Contexte canadien pour la gestion des données de recherche

4 Historique et paysage canadien de la gestion des données de recherche

Eugene Barsky; Elizabeth Hill; Tatiana Zaraiskaya; Minglu Wang; et Lucia Costanzo

Objectifs d’apprentissage

À la fin de ce chapitre, vous pourrez :

  1. Décrire l’histoire et le contexte de la gestion des données de recherche au Canada.
  2. Identifier les différents groupes qui participent à la gestion des données de recherche au Canada.
  3. Comprendre les progrès régionaux en matière de gestion des données de recherche.
  4. Comprendre les outils technologiques et les dépôts de données utilisés en collaboration par les chercheuses et chercheurs canadiens.

Introduction

Le Canada et plusieurs autres pays développés mettent en place des exigences en matière de gestion des données de recherche (GDR) pour un éventail de disciplines universitaires. Les obstacles à la gestion, à la préservation et au partage de données, dont il sera question dans d’autres chapitres, sont surmontés à l’aide de recommandations et de recours aux normes établies par les différentes communautés, comme les métadonnées reconnues, la documentation des données et les dépôts disciplinaires.

Comme vous l’avez appris, les Instituts de recherche en santé du Canada (IRSC), le Conseil de recherche en sciences naturelles et en génie du Canada (CRSNG) et le Conseil de recherche en sciences humaines (CRSH) sont les trois organismes de financement de recherche fédéraux. En mars 2021, ils ont publié la Politique des trois organismes sur la gestion des données de recherche afin de commencer à introduire graduellement des exigences relatives aux plans de gestion des données (PGD) pour certains programmes de subventions. Par le biais de ces programmes, les organismes subventionnaires encouragent fortement les établissements de recherche à fournir à leurs chercheuses et chercheurs un environnement qui permet des pratiques robustes de gestion et de curation des données et à soutenir la gestion et le versement des données de recherche dans des dépôts sécuritaires, accessibles, et qui assurent la curation de leur contenu. Même avant la publication de cette politique, des têtes dirigeantes et des organismes visionnaires, particulièrement des bibliothèques canadiennes, ont promu des initiatives et déployé des efforts pour sensibiliser localement les gens à la gestion de données.

Au cours de la dernière décennie, les bibliothèques universitaires canadiennes ont travaillé à la prestation de soutien en GDR auprès de leurs communautés (Steeleworthy, 2014; Liss, 2018). Les collaborations entre les bibliothèques universitaires et la communauté de recherche abordent les principaux défis en ce qui a trait à l’infrastructure, aux services et à la formation par le biais d’initiatives comme le réseau Portage (Portage) et Données de recherche Canada (DRC). Ces deux entités font désormais partie de l’Alliance de recherche numérique du Canada (Alliance).

Dans ce chapitre, nous donnons un aperçu de la GDR canadienne, laquelle a commencé par des initiatives sur le terrain avant de passer à des efforts nationaux à plus grande échelle. Ce chapitre actualise et développe des travaux réalisés il y a quelques années de cela (Barsky et al., 2017).

Bref historique de la gestion des données de recherche au Canada

Depuis la fin du 20e siècle, les bibliothèques universitaires discutent et plaident en faveur de la centralisation des services d’archivage et de découverte de données ainsi que pour un meilleur accès aux données de recherche au Canada. Toutefois, dans un pays avec une population relativement peu nombreuse et dispersée géographiquement, la centralisation constitue un défi de taille. Lorsque les initiatives en GDR ont commencé, les bibliothèques universitaires canadiennes ont réussi à consolider les collections de données en sciences sociales, surtout les collections gouvernementales mises à la disposition des chercheuses et chercheurs aux fins d’analyse secondaire. Les bibliothèques universitaires ont également participé à la création d’une communauté de pratique nationale en matière de GDR. En tirant profit des liens étroits entre les chercheuses, les chercheurs, les bibliothécaires et les spécialistes des données, le réseau des responsables de l’intendance de données a pu non seulement collaborer à l’élaboration d’outils et d’infrastructures de GDR, mais il a également pu offrir de nouvelles ressources à leurs communautés de recherche grâce à de la formation sur les données, une consultation et des services de dépôt de données.

Donner accès aux données de Statistiques Canada

L’Initiative de démocratisation des données (IDD), un service par abonnement qui donne accès aux données de Statistiques Canada, illustre parfaitement comment la collaboration en gestion des données peut aider à bâtir et à entretenir une infrastructure de diffusion des données et former des expertes et experts des données. Le programme de l’IDD a vu le jour en 1996 à la suite de consultations entre Statistiques Canada, l’Association des bibliothèques de recherche du Canada (ABRC) et la Fédération des sciences humaines (Boyko et Watkins, 2011). L’IDD est une réaction à la fois aux coûts élevés pour les fichiers de microdonnées à usage public de Statistiques Canada et à l’absence d’infrastructure dans les universités canadiennes pour donner accès à ces données (Humphrey, 2005). En raison des coupes budgétaires dans les années 1980, les prix établis pour l’accès aux fichiers de microdonnées à usage public visaient un recouvrement total des coûts; par conséquent, même les recherches les mieux financées ne pouvaient pas se les procurer.

La collection de l’IDD comprend des milliers de fichiers de données pour des centaines d’ensembles d’enquêtes. Sa taille et la demande des chercheuses et chercheurs ont influencé dans les bibliothèques la croissance de l’infrastructure de données nécessaire pour gérer et préserver l’accès à ces données. Au départ, peu de bibliothèques disposaient d’une expertise pour prendre en charge les services de données. Toutefois, Statistiques Canada exigeait un point de contact au sein des bibliothèques qui diffusaient les données. Les bibliothèques ont donc dû développer l’expertise de leur personnel par le biais d’activités de formation de l’IDD (Humphrey, 2005). Ces programmes de formation, en plus de permettre de développer la compétence du personnel dans les bibliothèques, ont créé une communauté universitaire nationale de données. La nécessité de prendre en charge le programme de l’IDD a également mené à la mise sur pied d’initiatives visant à offrir ou améliorer la transmission des données aux spécialistes en données et aux personnes utilisatrices. Ces systèmes de diffusion des données comprennent Odesi et Abacus en Ontario et en Colombie-Britannique ainsi que d’autres systèmes au Québec et dans les provinces de l’ouest (Hill et Gray, 2016). Vous pouvez approfondir vos connaissances en consultant les sources citées pour ce chapitre.

Stratégie de données de recherche nationale au début des années 2000

Dans les années 2000, Hackett (2001) a défini une vaste gamme d’enjeux en lien avec l’acquisition, la préservation des données de recherche canadiennes et leur accès. Localiser les données canadiennes préalablement recueillies et y accéder étaient les principaux problèmes soulevés. Cette difficulté était due aux coûts élevés, à l’absence d’un répertoire de ressources ou d’un service de dépôt central et à l’absence d’un organisme national pour définir les normes et offrir une direction, du financement ainsi qu’une infrastructure (Hackett, 2001). Il y avait quelques exceptions. Les disciplines des sciences physiques et de la génétique disposaient déjà d’une culture internationale de partage des données dans des dépôts disciplinaires. L’importance du partage des données de recherche pour la pratique scientifique dans ces disciplines a mené à la création de dépôts canadiens pour lesquels aucune politique n’était nécessaire. C’est notamment le cas du Polar Data Catalogue (un projet du Canadian Cryospheric Information Network), du Centre canadien de données astronomiques (une initiative du Canadian Advanced Network for Astronomical Research), et de CBRAIN (une initiative du McGill Centre for Integrative Neuroscience, MCIN). Toutefois, le manque de normes interdisciplinaires coordonnées en matière de curation des données et de métadonnées demeure problématique.

Au cours des 20 dernières années, le gouvernement fédéral a consulté diverses communautés de recherche ainsi que la Bibliothèque nationale du Canada et les Archives nationales du Canada (désormais Bibliothèque et Archives Canada) au sujet des avantages et des défis liés à la GDR. En 2005, le gouvernement canadien a publié le rapport National Consultation on Access to Scientific Research Data (NCASR). Il s’agit du résultat d’un groupe de travail d’expertes et experts comptant plus de 70 têtes dirigeantes du Canada, entre autres dans les domaines de la recherche, de l’administration et des bibliothèques (Strong et Leach, 2005). Le rapport comprenait une recommandation pour la mise sur pied d’un comité directeur national qui verrait à la création d’une archive de données nationale et à la coordination de la gestion des données. Il incluait également une recommandation pour le financement de projets dans tous les domaines au Canada. Toutefois, cette approche a échoué à obtenir du soutien politique (Humphrey, 2012a).

Sans comité directeur national et sans ressources issues du gouvernement fédéral, les bibliothèques universitaires ont dû trouver une autre voie. Elles ont créé des dépôts institutionnels et interinstitutionnels pour diffuser et archiver les données, particulièrement celles des données dites à longue traîne (long-tail), soit un grand nombre de jeux de données relativement petits produits par plusieurs disciplines (Heidorn, 2008). Ces derniers sont diversifiés et souvent difficiles à gérer (Cooper et al., 2021). Les bibliothèques possédaient une expertise en archivage et en préservation des résultats de recherche et, par leur implication dans le projet de l’IDD, elles se sont investies dans des solutions d’accès et de diffusion des données sous licence. Elles ont été reconnues comme étant bien placées pour relever le défi de la gestion des jeux de données à longue traîne.

Une approche locale à l’infrastructure canadienne de GDR voit le jour au début des années 2010

En 2008, le Conseil national de recherches du Canada (CNRC) a créé un groupe de travail sur la stratégie de données de recherche pour mettre en œuvre les recommandations du NCASR. Le groupe comptait plus de 70 leaders en recherche scientifique au Canada. En même temps, l’ABRC, un groupe qui représente les plus grandes bibliothèques universitaires au Canada et deux institutions fédérales, a commencé à participer à diverses conversations au sujet de l’avenir de l’infrastructure canadienne de recherche numérique. Graduellement, l’ABRC a argumenté que la GDR, le calcul de haute performance (représentée par Calcul Canada) et le réseau de recherche à haute vitesse (représenté par le Réseau canadien pour l’avancement de la recherche, de l’industrie et de l’enseignement (CANARIE)) devraient être perçus comme des piliers d’une importance équivalente dans une infrastructure de recherche (Humphrey, 2012b).

En 2011, l’ABRC et le groupe de travail sur la stratégie des données de recherche ont organisé un sommet sur les données de recherche qui a mené à la création de Données de recherche Canada (DRC) en 2012. Depuis 2014, le projet est appuyé par CANARIE, un organisme sans but lucratif ayant pour mission de faire fonctionner la structure nationale du réseau de recherche et d’éducation au Canada. DRC a aidé à la mise sur pied de comités et au lancement de projets techniques; il a collaboré avec des organisations internationales pour favoriser l’infrastructure et l’expertise en matière de données de recherche. DRC a coordonné le Sommet sur l’encadrement des services de données nationaux (ESDN), tenu pour la première fois en 2017, puis annuellement de 2019 à 2022. Cet événement réunissait des groupes et des spécialistes en GDR, notamment des organismes de financement, des responsables de la curation de dépôts de données disciplinaires et des bibliothécaires de données de partout au pays. Les discussions ont  souligné l’importance d’accorder la priorité à une infrastructure et à des services de GDR coordonnés à l’échelle nationale pour l’avenir de l’infrastructure de recherche numérique canadienne (Attendees of the NDSF Summit, 2019).

Dans le cadre des efforts de l’ABRC pour améliorer le niveau de préparation des bibliothèques aux services de soutien aux données de recherche, un cours en GDR a été offert au début de 2013. Dans le sillage de ce cours est née la Communauté de pratique canadienne en gestion des données de recherche, un forum qui permet de discuter continuellement des activités en GDR au Canada.

Les directrices et directeurs de l’ABRC ont établi des relations concrètes avec les organisations qui offrent l’infrastructure informatique de recherche aux bibliothèques canadiennes, notamment CANARIE, Calcul Canada (calcul à haute performance), Canadian University Council of Chief Information Officers (CUCCIO) et la Bibliothèque scientifique nationale. Le projet pilote ARC, qui devait durer un an, a été mis sur pied en 2014. Il avait pour objectif de favoriser la création d’une communauté de pratique en données de recherche au Canada. Résultat : création d’un réseau d’expertes et experts comprenant des bibliothécaires universitaires, des gens qui développent des systèmes et du code ainsi que des prestataires de services de données. Le projet ARC s’est avéré un succès et est devenu le réseau Portage en 2015. Sa mission : offrir une direction aux chercheuses et chercheurs du Canada par le biais d’un réseau d’expertes et experts partout au pays. Le 1er avril 2021, Portage a intégré l’Alliance; RDC a fait de même au printemps 2022. À l’heure actuelle, l’Alliance offre une infrastructure ainsi qu’un service de recherche numérique intégrée à l’ensemble des chercheuses et  chercheurs universitaires au Canada.

Politique de GDR nationale de la fin des années 2010 jusqu’au début des années 2020

En 2016, dans le sillon d’étapes entreprises par d’autres pays, les organismes fédéraux de financement de la recherche ont commencé à mettre sur pied une politique en GDR avec la publication d’une Déclaration de principes sur la gestion des données de recherche. Ce document propose aux chercheuses et chercheurs, aux communautés de recherche, aux établissements ainsi qu’aux organismes de financement de collaborer à la création d’un environnement ouvert et solide pour les données de recherche canadiennes.

En 2018, les organismes subventionnaires ont annoncé avoir rédigé une ébauche de politique de GDR et ont entamé une consultation publique. Elles ont reçu plus d’une centaine de commentaires provenant de diverses parties prenantes à propos de la recherche autochtone, la surveillance, la conformité ainsi qu’au sujet des trois piliers de mise en œuvre abordés par la politique : la stratégie de GDR, les PGD et le dépôt de données. En mars 2021, les organismes subventionnaires ont annoncé la création officielle de la Politique des trois organismes sur la gestion des données de recherche qui vise l’excellence dans la GDR au Canada. La politique reconnaît toutefois le contexte diversifié des demandes scientifiques disciplinaires, les limites légales et éthiques, les capacités des établissements ainsi que l’autodétermination et la mobilisation des communautés autochtones. À la suite de cette annonce tant attendue, la politique a créé un mandat de soutien à la GDR au sein des établissements de recherche.

Ainsi, chaque établissement canadien doit présenter une stratégie de GDR afin que les organismes de financement puissent évaluer le degré de préparation à l’échelle de tous les établissements. Le fait d’élaborer une stratégie de GDR permet aux responsables des établissements de réfléchir aux lacunes locales et de mettre en place des solutions en plus de favoriser la collaboration avec d’autres établissements. La publication de la Politique des trois organismes sur la gestion des données de recherche coïncide avec la création de l’Alliance, un organisme national sans but lucratif ayant pour objectif d’harmoniser et d’améliorer l’accès aux outils et aux services numériques à l’intention de la communauté de recherche canadienne. L’Alliance se concentre principalement sur la création d’un réseau de services de GDR national dans trois domaines : calcul informatique de pointe, gestion des données de recherche et logiciels de recherche.

Collaboration nationale : du réseau Portage à l’Alliance

Origine et organisation actuelle

Portage a été mis sur pied par l’ABRC en 2015 en réaction au Plan d’action du Canada pour un gouvernement ouvert; il était le précurseur de l’Alliance. À l’origine, il s’agissait d’un réseau national de services et de soutien en GDR supporté par la communauté  qui tirait profit des réseaux existants, nationaux et régionaux, des bibliothèques universitaires canadiennes. Portage est le fruit de la vision de personnes à l’avant-garde qui se portaient à la défense de la cause de la GDR (Humphrey, 2012b). Le concept initial du réseau a été abordé lors d’une rencontre informelle au congrès de l’ABRC en 2013.

En 2014, l’ABRC a lancé un projet pilote d’un an d’une communauté de pratique appelée ARC. Forte de cette réussite, elle a créé un réseau d’expertes et experts (REE) en GDR basé sur les bibliothèques. Des modèles fonctionnels et une gouvernance ont été définis au cours des deux années suivantes (de septembre 2015 à août 2017) (Humphrey et al., 2016). Depuis, le REE a développé et rendu disponible du matériel de formation, des lignes directrices et des modèles en lien avec la GDR, conformément aux exigences des organismes subventionnaires du Canada afin d’appuyer la communauté de recherche et les personnes responsables de l’intendance des données. Le REE a consolidé les liens existants entre les infrastructures de dépôt de données régionales qui se servent du logiciel Dataverse  ce qui a conduit à des partenariats formels et au lancement de Borealis, le dépôt Dataverse canadien. Le REE a également coordonné l’élaboration de l’application Web d’assistance au plan de gestion des données (l’Assistant PGD), la création d’un dépôt connu en tant que Dépôt fédéré de données de recherche (DFDR) et la mise en ligne de Lunaris, une plateforme de découverte de données.

Après avoir rejoint les rangs de l’Alliance en avril 2021, la communauté d’expertes et experts de Portage est devenue membre de l’équipe de GDR de l’Alliance. La gouvernance et les activités futures du REE font encore l’objet de discussions. Le réseau compte désormais plus de 140 expertes et experts provenant de 60 établissements partout au Canada. Il collabore avec une vaste gamme de parties prenantes et de partenaires à l’échelle locale, nationale et internationale afin de développer des services et une infrastructure pour que les chercheuses et chercheurs universitaires puissent accéder au soutien dont ils ont besoin en GDR (Humphrey, 2020). Au moment de rédiger ce document, le REE comprend neuf groupes actifs :

  1. Groupe d’experts sur la curation (GEC)
  2. Groupe d’experts sur la planification de la gestion des données (GEPGD)
  3. Groupe d’experts sur les dépôts de données (GEDD)
  4. Groupe d’experts sur Dataverse Nord (Dataverse Nord)
  5. Groupe d’experts sur la découverte et les métadonnées (GEDM)
  6. Groupe d’experts sur la préservation (GEP)
  7. Groupe d’experts sur la recherche et l’intelligence (GERI)
  8. Groupe d’experts sur les données sensibles (GEDS)
  9. Groupe d’experts national sur la formation (GENF)

Les efforts de la communauté d’expertes et experts en GDR ne cessent de progresser grâce aux travaux de l’équipe de GDR de l’Alliance pour élaborer des ressources communes, une expertise et des documents de formation. Les résultats et publications de chaque groupe peuvent être consultés sur le site Web de l’Alliance. Voici quelques faits saillants des réalisations de la communauté.

Infrastructures, services et outils

Le réseau canadien actuel de collaborations locales et régionales permet d’augmenter l’efficience et de favoriser une infrastructure, des services et des outils de gestion des données. Les spécialistes des données et les bibliothécaires des établissements universitaires canadiens, ainsi que le personnel en GDR de l’Alliance, ont participé au développement et au soutien des infrastructures et des outils de GDR dont il est question dans ce chapitre. Par exemple, le groupe de travail de Dataverse Nord a été mis sur pied pour rassembler les prestataires de dépôts Dataverse et les bibliothécaires du Canada afin de coordonner au niveau local et national et de discuter au sujet de la formation, des services de soutien, des stratégies de sensibilisation, de la promotion, du développement de l’infrastructure et des besoins.

Une infrastructure de gestion des données multifonctionnelle encore plus importante, le DFDR, a été créée avec l’équipe de GDR de l’Alliance comme prestataire de services et Calcul Canada pour l’hébergement du matériel et de l’infrastructure. Le DFDR a également bénéficié du soutien de plusieurs groupes d’expertes et experts, notamment le GEDM, le GEP et le GEC. Aujourd’hui, le DFDR offre une vaste gamme de services en GDR aux établissements, aux organisations et aux chercheuses et chercheurs du Canada, y compris le stockage, la préservation et la curation des données. Tous les membres de la communauté de recherche canadienne peuvent déposer des données ouvertes dans le DFDR et obtenir un identifiant numérique d’objet (DOI) afin d’identifier de manière unique leur jeu de données et générer une adresse Web permanente. Le DFDR est également en mesure de gérer les dépôts de données massives et offre un soutien dédié à la curation des données.

Au départ, le DFDR comprenait une fonction d’indexation de données provenant d’autres dépôts de données canadiens, permettant ainsi leur découverte. Toutefois, en 2022, il a été entendu d’approfondir cette capacité en tant que service distinct appelé Lunaris. Il s’agit d’une plateforme bilingue de type guichet unique pour chercher des données provenant du DFDR et d’autres sources. Lunaris n’héberge pas les données, il offre plutôt des liens vers des dépôts externes où les données peuvent être téléchargées.

La préservation des données de recherche est essentielle pour s’assurer qu’elles demeurent accessibles et utilisables à long terme. Le Canada ne dispose toujours pas d’un plan ou d’une stratégie solide pour la préservation des données de recherche. Le GEP a vu le jour afin d’améliorer la capacité de Portage à développer une infrastructure et des pratiques exemplaires pour préserver les données de recherche et les métadonnées. Ceci comprend une collaboration avec les parties prenantes pertinentes à des projets de développement de logiciels qui ajoutent des plateformes et des services de préservation à l’infrastructure de GDR au Canada. Le GEP a travaillé avec d’autres groupes d’expertes et experts afin de mettre davantage de l’avant les enjeux relatifs à la préservation, a collaboré avec le DFDR et les dépôts Borealis en ce qui a trait à la fonction de préservation des dépôts et a participé avec le DFDR, SciNet, Scholars Portal et les bibliothèques de l’Université de Toronto sur un projet de pipeline de préservation afin de simplifier l’accès pour les chercheuses et chercheurs à des environnements robustes de préservation numérique à long terme.

Au départ, l’outil en ligne Assistant PGD était hébergé et administré par l’Université de l’Alberta; plus tard, la section GDR de l’Alliance en est devenue responsable. La Politique des trois organismes sur la gestion des données de recherche met en évidence l’importance des PGD dans le processus de recherche et les définit comme un des trois piliers principaux. Les trois organismes fédéraux de financement de la recherche ont également annoncé que le PGD deviendrait bientôt une exigence – et non plus une recommandation – pour l’ensemble des chercheuses et chercheurs du Canada qui demandent un financement public. Avant cette annonce, le recours aux PGD constituait déjà une exigence standard des demandes de financement américaines et européennes. L’assistant PGD, créé en partenariat avec les trois organismes subventionnaires, offre des conseils détaillés sur la création d’un plan de gestion des données. De plus, les REE ont élaboré plusieurs documents bilingues, notamment des guides pour :

Il existe plusieurs modèles et exemples de PGD par discipline, qui mettent en évidence les meilleures pratiques en matière de PGD, dans la section des ressources de formation du site Web de l’Alliance.

Pratiques exemplaires, normes et orientations

En tant que réseau collaboratif national d’expertes et experts, l’Alliance a favorisé la mise en place et la coordination d’une offre d’infrastructure et d’outils en ligne existants et dispersés : l’Assistant PGD, le Dataverse de Scholars Portal (renommé Borealis, le dépôt Dataverse canadien, en 2022), le DFDR et Lunaris. Il a également préparé des lignes directrices et des recommandations quant aux pratiques exemplaires en GDR dans le cadre d’une collaboration étroite avec les trois organismes fédéraux de financement de la recherche. Les lignes directrices et la documentation élaborées par les groupes de travail en GDR de l’Alliance sont disponibles sur Zenodo et incluent :

  • Guide pour la curation dans Dataverse, fruit du groupe de travail sur le guide de curation dans Dataverse. Les pratiques exemplaires pour préparer des jeux de données à leur publication dans le dépôt Dataverse sont décrites;
  • Guide des pratiques exemplaires sur les métadonnées de Dataverse Nord, fruit du groupe de travail sur Dataverse Nord, il est constamment mis à jour. Ce guide donne un aperçu des pratiques exemplaires en matière de métadonnées et donne des exemples issus de plusieurs disciplines, notamment les données géospatiales;
  • Guide d’évaluation pour la préservation des données de recherche, fruit du groupe de travail sur l’évaluation à des fins de préservation. Ce guide aborde les besoins des personnes qui créent et préservent les données afin d’évaluer et sélectionner les données de recherche qui bénéficieront d’un accès à long terme;
  • Boîte à outils pour les données sensibles à l’intention des chercheuses et chercheurs, publiée en 2020 et continuellement mise à jour par le Groupe d’experts sur les données sensibles. Ce guide en trois parties comprend un glossaire, une matrice de risques pour les données et un échantillon de vocabulaire de consentement. Nous avons listé et fourni un lien vers chaque partie du guide dans l’encadré qui suit. Il a été adopté à grande échelle par les établissements canadiens.

Boîte à outils pour les données sensibles – destinée aux  chercheurs Partie 1: Glossaire terminologique sur l’utilisation des données sensibles à des fins de recherche

Boîte à outils pour les données sensibles – destinée aux chercheurs Partie 2: Matrice de risque lié aux données de recherche avec des êtres humains

Boîte à outils pour les données sensibles – destinée aux chercheurs Partie 3: Langage en matière de gestion de données de recherche pour le consentement éclairé

Création de réseaux et de communautés

En plus d’offrir une infrastructure et des pratiques exemplaires en GDR, l’Alliance souhaitait lever les obstacles sociaux, culturels et technologiques associés à l’écosystème de GDR (Humphrey, 2012b). Dans les faits, elle a encouragé la création de communautés et de réseaux variés au cours des dernières années.

Les membres du Groupe d’experts sur les dépôts de données (GEDD) de la GDR de l’Alliance ont participé à la mise sur pied du Consortium DataCite Canada, lancé en janvier 2020. Financé par l’Alliance, le consortium est dirigé par l’équipe de GDR de l’Alliance alors que le Réseau canadien de documentation pour la recherche s’occupe de l’administration. Plus de 50 établissements du consortium ont collaboré à l’élaboration d’une structure de gouvernance et de financement et pour offrir à leurs membres des services de production de DOI et d’enregistrement des métadonnées par le biais de DataCite. Ce consortium constitue une réalisation importante pour les établissements canadiens. Il permet de gérer en collaboration le bassin national de DOI pour une gamme de dépôts de recherche et d’autres actifs numériques tout en disposant d’un scénario de tarification stable, commun et collaboratif pour divers paliers d’établissements de recherche au Canada. Grâce à lui, une communauté de pratique peut également résoudre des problèmes techniques et lancer des projets de DOI novateurs au Canada.

Pour aider les dépôts de données de recherche canadiens à harmoniser leurs pratiques aux normes mondiales, le GEDD a offert un financement en GDR de l’Alliance pour une cohorte de candidatures à la certification CoreTrustSeal (CTS). La première cohorte comptait 12 dépôts, dont plusieurs dépôts institutionnels Borealis qui cherchaient à améliorer leurs pratiques. L’obtention de la certification CTS est précédée d’un long processus. Le GEDD a organisé et supervisé des groupes de rédaction et de lecture au bénéfice du personnel associé aux dépôts qui ont postulé et il a procuré du support au cours du processus d’examen par les pairs.

Le Groupe d’experts sur la curation (GEC) se concentre sur la définition, l’évaluation et la promotion de pratiques exemplaires en curation des données. Ceci comprend des techniques, des méthodes et des outils qui peuvent mieux préparer les données et métadonnées, améliorer la qualité des données et, en fin de compte, faciliter la diffusion et la réutilisation des données. Il comble également un besoin en matière de formation et de soutien pour une nouvelle génération de responsables de la curation des données. La création d’une communauté et d’un réseau est un aspect essentiel des approches adoptées par le groupe d’expertes et experts. En 2019, le GEC a tenu le premier forum canadien sur la curation des données en partenariat avec l’Université McMaster et grâce à un financement du CRSH. Ce forum avait pour but principal de mettre sur pied une communauté de pratique nationale qui rassemble des responsables de l’intendance des données, des bibliothécaires, des prestataires de services de données et des gens qui développent des systèmes. Le programme du forum comprenait toute une gamme de conférences, des discussions et des ateliers qui visaient à faciliter la communication et la collaboration en matière de pratiques et de normes de curation des données. Le forum visait aussi à développer des compétences ainsi que des ressources de formation. Il a connu un immense succès et a atteint son objectif : des responsables de la curation des données ont participé régulièrement à des réunions avec le GEC, depuis, pour discuter et mettre leurs connaissances à jour en matière de curation des données, d’enjeux actuels et de perfectionnement.

Recherche et formation

Pour garder le rythme avec un environnement en constante évolution, l’équipe GDR de l’Alliance a créé un groupe d’expertes et experts sur la recherche et l’intelligence (GERI) ainsi qu’une équipe de formation pour surveiller les lacunes en matière de GDR et offrir une formation en temps opportun à la communauté et à ses groupes élargis.

Le GERI met l’accent sur la surveillance permanente des sujets et des mandats en lien avec la GDR. Il guide l’élaboration de pratiques exemplaires en GDR au Canada et informe les communautés concernées  des enjeux actuels ou à venir en lien avec les politiques et pratiques. Il garde à jour une Feuille de route des priorités de recherche en GDR pour cerner les lacunes en ce qui a trait aux connaissances, aux compétences, aux services et aux politiques en GDR. Le GERI mène également des études indépendantes et effectue des sondages puis en analyse les résultats pour émettre des recommandations à l’équipe GDR de l’Alliance fondées sur des données probantes. En 2016, il a mis sur pied le consortium canadien de sondage en GDR et a élaboré un outil de sondage commun. En tout, 15 universités l’ont utilisé pour sonder les chercheuses et chercheurs de leurs établissements afin de comprendre leurs pratiques et attitudes en matière de GDR. En 2019, le GERI a mené deux sondages auprès d’établissements canadiens pour mesurer leur capacité en GDR et l’état de l’élaboration de leur stratégie; ceci s’est déroulé avant l’annonce de la Politique des trois organismes en GDR. Les résultats ont démontré qu’il existait des initiatives et des services de GDR et le GERI s’est fait la voix des établissements au sujet de leurs priorités ainsi que leurs besoins de soutien supplémentaires en GDR.

Alors que le paysage de la GDR poursuit son évolution, il est essentiel que les chercheuses et chercheurs, spécialistes des données et autres personnes impliquées en GDR possèdent l’information et reçoivent la formation nécessaire pour être au courant des derniers développements ainsi que des pratiques exemplaires. La création de ressources de formation en GDR a constitué une des principales activités de l’équipe GDR de l’Alliance. Depuis 2017, le Groupe d’experts national sur la formation (GENF) a préparé des documents de formation sur le sujet. Les membres supervisent plusieurs projets collaboratifs précis qui permettent d’élaborer et d’offrir des ressources dans le but de soutenir le perfectionnement de compétences en GDR à l’échelle du Canada. Tout de suite après l’annonce de la Politique des trois organismes en GDR, le GENF a coordonné une série d’ateliers populaires sur les aspects les plus importants de la politique. Ces ateliers ont permis aux chercheuses, chercheurs et aux parties prenantes de comprendre les exigences de la politique et de se sensibiliser aux ressources ainsi qu’aux outils existants qui peuvent les aider à développer un PGD et des stratégies institutionnelles de GDR.

Services de dépôt de données dans les bibliothèques canadiennes

Tout comme les réseaux d’expertes et experts, la formation et le soutien mis en place à l’échelle nationale, diverses bibliothèques universitaires ont développé ensemble un service de dépôt de données canadien en utilisant Dataverse, un logiciel ouvert développé par l’Institute for Quantitative Social Science de Harvard. Il a pour objectifs de stocker, partager, citer, préserver, découvrir et d’analyser les données de recherche. Sa nature ouverte permet aux établissements d’héberger leurs propres installations du logiciel Dataverse et d’offrir une solution adaptée aux besoins de leur propre communauté.

Les installations locales et régionales du logiciel Dataverse au Canada, notamment le Dataverse de Scholars Portal et ceux d’autres établissements et régions, sont passées à un service national appelé Borealis. Scholars Portal a commencé à offrir le service Dataverse en dehors du Ontario Council of University Libraries (OCUL) en 2019 et un service national officiel a été offert en 2020 (document en anglais uniquement) par le biais d’accords avec les quatre consortiums régionaux de bibliothèques universitaires. La nouvelle marque Borealis a été lancée en 2022. L’installation nationale partagée offre la possibilité de créer une marque locale et de fournir des ressources communes de formation aux gens qui utilisent le service. Durant la transition, le Groupe d’experts sur Dataverse Nord a commencé à créer des ressources de formation, à offrir du soutien, faire de la sensibilisation et mettre sur pied des stratégies de promotion. La sensibilisation et la promotion sont importantes, car les universités canadiennes préfèrent souvent stocker les données sur des serveurs hébergés localement.

Les données peuvent être téléversées dans des collections Dataverse en tant qu’éléments d’un réseau plus vaste. Une collection Dataverse contient des jeux de données (données de recherche, code, documentation, métadonnées) et peut être définie pour une chercheuse ou un chercheur, une faculté, une revue savante ou une organisation. Par exemple, un chercheur peut téléverser des données dans la collection de son établissement qui, avec l’ensemble des autres collections institutionnelles, forme Borealis, le dépôt national. Chercheuses et chercheurs, équipes et établissements peuvent créer leur propre compte et téléverser leurs données dans une collection institutionnelle (définie par leur affiliation) ou une collection liée à un projet de recherche, si disponible. Les bibliothécaires et personnes responsables de l’intendance des données peuvent également effectuer la curation des jeux de données et gérer la soumission des données au nom des chercheuses et chercheurs. Le logiciel Dataverse est très souple à ce chapitre. Il est possible d’appliquer une marque locale aux collections et aux sous-collections Dataverse.

Le logiciel Dataverse offre aussi une fonction d’analyse de données dans le navigateur; par conséquent, les personnes qui l’utilisent n’ont pas nécessairement besoin de télécharger les fichiers de données pour les consulter. Les fichiers de données tabulaires téléversés dans le système peuvent être analysés grâce à l’outil Web d’analyse et de visualisation des données. Il est possible d’intégrer Dataverse à d’autres ressources documentaires afin d’améliorer la découverte des données. Par exemple, depuis que tous les partenaires de UBC Abacus Dataverse (bibliothèques de l’Université de Victoria, de l’Université du nord de la Colombie-Britannique et de l’Université Simon-Fraser) se servent de ProQuest Summon comme outil de recherche, les collections Dataverse de leurs bibliothèques respectives deviennent accessibles par le biais de flux du protocole Open Archives Initiative (OAI). Chacun des flux OAI comprend toutes les données provenant des établissements partenaires ainsi que l’information appropriée à propos des licences. Grâce à un processus de découverte amélioré (particulièrement par l’attribution de DOI pour des jeux de données de recherche), il est plus facile pour les chercheuses et chercheurs d’accéder aux données et de les réutiliser (p. ex., dans ORCID, Google, DataCite, Google Data Search, Crossref, entre autres services). Ceci facilite les citations et améliore les profils d’impacts, et ce, tant pour les individus que pour les établissements.

Le logiciel de dépôt Dataverse s’est avéré une plateforme souple qui peut prendre en charge plusieurs modèles de services en GDR proposés par les bibliothèques au Canada. Il offre une vaste gamme de caractéristiques qui peuvent améliorer la découvrabilité des données et leur accès ainsi qu’une excellente gestion des données pour la préservation. Toutefois, le logiciel Dataverse ne constitue pas un système de préservation numérique complet (bien que Borealis prenne en charge la préservation numérique au niveau du bit — vous trouverez une explication à ce sujet dans le chapitre « Préservation numérique des données de recherche » et dans le plan de préservation de Borealis). Le dépôt ne tient pas compte du format et accepte tous les types de fichiers, non seulement les données tabulaires.

Le Ontario Council of University Librairies a parrainé le travail d’Artefactual pour développer une intégration technique (document en anglais uniquement) entre le logiciel Dataverse et Archivematica, un outil ouvert et robuste pour le traitement des objets numériques à des fins de préservation et d’accès. Il est possible d’utiliser ce système de préservation conjointement avec le service Borealis en place ou toutes autres installations Dataverse (à partir des versions 1.8 Archivematica et 4.8.6 de Dataverse).

Le soutien à la GDR au Canada fait l’objet d’une attention nationale. Historiquement, et à l’heure actuelle, les régions et les communautés sont confrontées à des enjeux relatifs au soutien et à l’infrastructure en fonction de leurs propres réseaux, du financement régional ou provincial et de la participation aux décisions des consortiums par région.

Souveraineté des données autochtones

Plusieurs initiatives et développements mentionnés dans ce chapitre, tout comme d’autres dont il sera question dans ce manuel, ont eu lieu sans tenir compte des peuples autochtones et de leurs données ou sans aborder les injustices historiques à leur égard. En fait, les communautés autochtones sont depuis longtemps maltraitées et négligées en ce qui a trait à la recherche canadienne. Si la Politique des trois organismes sur la gestion des données de recherche aborde désormais clairement les éléments à prendre en considération quant aux données autochtones et que des expertes et experts en données autochtones font partie du Groupe d’experts sur les données sensibles, nous encourageons l’équipe de GDR de l’Alliance à aborder ces enjeux de manière plus exhaustive à court terme.

Les universitaires et les personnes qui militent pour les droits des Premières Nations ont réagi à ces lacunes. Par exemple, le Centre de gouvernance de l’information des Premières Nations (CGIPN), un organisme à but non lucratif, a vu le jour en 2010. Ses premiers travaux remontent à 1996, lorsque l’Assemblée des Premières Nations a mis sur pied un comité directeur national ayant pour mandat de créer un sondage sur la santé des Premières Nations (l’Enquête régionale sur la santé des Premières Nations) à la suite de la décision du Canada d’exclure les populations vivant sur une réserve de projets de cueillette de données longitudinales d’envergure. En 1998, le comité a défini les Principes de PCAP® (pour propriété, contrôle, accès et possession) en tant qu’outil et norme pour recueillir et gérer les données des Premières Nations. Pour obtenir plus d’information sur les Principes, consultez le chapitre « Souveraineté des données autochtones ».

Efforts régionaux

Partout au Canada, des établissements ont adopté des approches particulières pour développer et élargir les services de GDR en fonction de leur taille, des ressources disponibles (ressources humaines et infrastructure) et de leurs axes de recherche. Les bibliothécaires et spécialistes des collèges et des universités sont des membres importants des groupes de travail et des comités sur la GDR institutionnelle et participent à l’élaboration de politiques et de stratégies en GDR.

Plusieurs établissements au pays ont participé à des sondages sur les pratiques et les besoins en GDR, des sondages qui reposaient sur un outil commun créé par des bibliothécaires de l’Université de Toronto en 2015. Par la suite, il a été modifié par plusieurs établissements. Résultat : une compréhension plus riche des pratiques disciplinaires en GDR ainsi que des besoins locaux et nationaux. En outre, il a aidé les chercheuses et chercheurs à mieux connaître les pratiques exemplaires en GDR (Cheung et al., 2022).

Des cours en GDR ont été offerts dans les écoles de bibliothéconomie à l’échelle du pays. Comme nous le mentionnions plus tôt, des régions ont adapté le logiciel de dépôt Dataverse au niveau local et, dans de nombreux cas, au niveau national. Toutes les régions sont représentées au sein des comités de GDR de l’Alliance. Certains établissements ont réagi à la nécessité d’offrir un soutien en GDR par la création de postes de bibliothécaires ou de rôles en appui à la GDR dans les bibliothèques. Vous trouverez ci-après des initiatives régionales qui mettent en évidence des services et des domaines d’intérêts particuliers.

La GDR dans la région atlantique

Le CAAL/CBPA (Council of Atlantic Academic Libraries/Conseil des bibliothèques postsecondaires de l’Atlantique, anciennement CAUL-CBUA) est le réseau des bibliothèques d’universités et de collèges publics dans la région de l’Atlantique. Il met l’accent sur la mise sur pied et la coordination d’activités de préservation numérique dans la région. Le Digital Preservation and Stewardship Committee (DPSC) a été créé en 2013. Plus tard, ses travaux ont englobé le développement de services de GDR à grande échelle afin d’harmoniser ses travaux à la vision nationale. La plus récente initiative comprend la Subvention pour l’innovation du CAAL/CBPA 2020. Elle a permis d’offrir des ateliers à l’ensemble des établissements de la région atlantique qui ont pu les visionner. Les membres du DPSC ont dirigé l’organisation et la réalisation des ateliers. Ces événements étaient intitulés Atlantic RDM days (Journée de la GDR au Canada atlantique) et se déroulaient en français et en anglais. Ils étaient importants pour les collèges et universités qui ne disposaient pas des ressources pour prendre en charge la GDR au niveau de l’établissement, mais qui devaient tout de même se conformer à la Politique des trois organismes sur la gestion des données de recherche et favoriser les pratiques exemplaires en GDR au sein de leur communauté de recherche.

En 2015, l’Université Dalhousie a été l’un des premiers établissements de la région atlantique à mettre sur pied une équipe de GDR, laquelle comprenait des partenaires de différents services (Bureau de la recherche, services de technologie universitaire et bibliothèques de l’Université Dalhousie). Elle a été le premier établissement canadien à élaborer puis à publier une stratégie de GDR, comme l’exige la Politique des trois organismes sur la gestion des données de recherche. Désormais, l’université offre un cours en GDR (Managing Research Data).

Plusieurs établissements de la région atlantique se sont joints au dépôt national Borealis afin d’offrir des services d’archivage de données à leur communauté de recherche locale. D’autres ont accepté de conserver leurs propres instances de dépôts Dataverse sur leurs serveurs institutionnels locaux. Ceci s’explique par la disponibilité des ressources institutionnelles locales à entretenir le dépôt et à le garder à jour. Par exemple, depuis 2018, les bibliothèques de l’Université du Nouveau-Brunswick ont hébergé un dépôt Dataverse local. L’hébergement et l’entretien sont réalisés de manière indépendante grâce à la collaboration de l’équipe système des bibliothèques et le comité des services de GDR des bibliothèques. Comme d’autres établissements canadiens, toutes les universités de recherche dans la région atlantique ont accès à l’infrastructure nationale d’archivage de données DFDR.

La GDR au Québec

Depuis les années 1960, les bibliothèques universitaires du Québec collaborent au sein du Bureau de la Coopération Interuniversitaire (BCI), anciennement appelé la Conférence des Recteurs et des Principaux des Universités du Québec (CREPUQ). En 1967, le Comité de coordination des bibliothèques a été créé et, quelques années plus tard, il est devenu le Sous-comité des bibliothèques (Roy et Bégin, 1969). En 2023, le Sous-comité est devenu une entité à part entière, le Partenariat des bibliothèques universitaires (PBUQ).

Au sein même du sous-comité des bibliothèques, un comité centré sur la GDR a été lancé en 2015 et ses membres sont à l’origine de différentes initiatives de promotion et de soutien : Semaine des données à cœur (version francophone de la Love Data Week), LibGuide de ressources en GDR pour le réseau des universités du Québec grâce à une subvention du CRSH et une grande implication dans la traduction de ressources canadiennes en français. L’accent sera probablement mis sur le fait de garder le rythme des besoins croissants au cours des prochaines années.

La communauté québécoise de GDR Québec a également participé à d’importants projets d’infrastructure, soit l’internationalisation de Dataverse et GeoIndex.

L’internationalisation de Dataverse s’est déroulée en deux étapes : la première a commencé en 2015 et la deuxième, quelques années plus tard (Bilodeau, 2018). Marie-Hélène Vézina, une bibliothécaire à l’Université de Montréal avec de l’expérience en développement de projets numériques, s’est jointe au personnel de Scholars Portal. Avec le soutien de la communauté de Dataverse plus large, notamment l’Institute for Quantitative Social Science de Harvard, l’équipe a internationalisé le logiciel Dataverse. Si une partie de la traduction avait déjà été effectuée, rien n’était en place pour prendre en charge le multilinguisme. Le code développé a été intégré au code de base de Dataverse, ce qui a permis le déploiement d’une installation bilingue (anglais et français) par Scholars Portal. L’Université de Montréal a fourni la traduction en français. Scholars Portal et les établissements du BCI ont finalisé une entente formelle qu’ils ont signée au printemps 2019. Les premières collections de Dataverse institutionnelles ont été rendues accessibles aux chercheuses et chercheurs à l’été 2022 (Vézina, 2022).

Le projet GeoIndex a été lancé en 2006 pour les besoins de diffusion des données géospatiales à l’Université Laval. La même année, le projet a gagné un prix ESRI Canada et en 2012, le prix Innovation des services documentaires du Québec. Un important accord entre le Bureau de coopération interuniversitaire (BCI) et le ministère de l’Énergie et des Ressources naturelles (MERN) a mené à l’ouverture de la plateforme aux autres universités québécoises en 2019 afin qu’elles déposent et partagent leurs données. GeoIndex est unique par rapport à d’autres plateformes de données géospatiales en raison de son utilisation du répertoire des vedettes-matière et de son mode de recherche basé sur le contour géospatial des données. En 2021, un module s’est ajouté pour les photos aériennes, permettant de rassembler l’ensemble de l’inventaire des universités québécoises à un seul endroit.

La GDR en Ontario

L’Ontario compte 23 universités publiques et 24 collèges. Depuis les années 1960, les bibliothèques de ces établissements ont collaboré avec succès par l’intermédiaire du Ontario Council of University Libraries (OCUL). À ses débuts, l’OCUL était impliqué dans des services traditionnels de bibliothèque, comme l’octroi de licences en consortium à des publications savantes et la facilitation d’un partage efficace des ressources. Au cours de ces premières années, plusieurs établissements ont développé leur propre système de dépôt de données, y compris l’archive de données en sciences sociales de l’Université Carleton fondée en 1965 dans la faculté de sociologie et d’anthropologie; la bibliothèque des ressources en données de l’Université Western, lancée à la fin des années 1970 et qui collabore avec le laboratoire informatique des sciences sociales pour diffuser et archiver divers projets de recherche de la faculté; la bibliothèque de données et de cartes de l’Université de Toronto, établie en 1988, dont les services comprennent l’acquisition et la préservation de jeux de données produits par les chercheuses et chercheurs de l’établissement.

En 2002, l’OCUL a formé Scholars Portal, une infrastructure technologique partagée qui héberge les collections numériques en nombre croissant de l’OCUL et y donne accès. Alors que les services de données gagnent en importance, les bibliothèques de l’Ontario ont perçu l’occasion de collaborer sous l’égide de l’OCUL pour améliorer les services, réduire le dédoublement des efforts et mieux gérer les ressources limitées. Au cours de la dernière décennie, l’OCUL a entrepris plusieurs projets d’infrastructure de données ayant connu du succès, y compris l’élaboration d’Odesi, un portail collaboratif de données en sciences sociales, et Scholars GeoPortal, un portail de données géospatiales. Bien que ces deux portails de données contiennent certaines données de recherche, ils sont conçus comme des collections de données publiées provenant de sources officielles faisant autorité telles que les agences statistiques gouvernementales. Ainsi, ils ne sont pas propices à l’inclusion à grande échelle des productions de données de recherche institutionnelle des établissements membres. Ces systèmes se concentrent sur la découverte et l’accès plutôt que sur la préservation à long terme (Moon, 2014).

Pour cette raison, l’Ontario et le Canada avaient besoin d’autres solutions pour répondre à la demande croissante de dépôts de données de recherche en bibliothèque. En 2011, Scholars Portal s’est joint au projet pilote de la bibliothèque de l’Université de Colombie-Britannique, a installé un dépôt Dataverse puis l’a mis à la disposition des membres de l’OCUL. Ce projet avait pour but d’aborder le besoin exprimé par la communauté d’avoir un service de dépôt situé en Ontario qui permettrait aux chercheuses et chercheurs d’effectuer de façon autonome un dépôt grâce à un service en ligne. Le logiciel Dataverse a été choisi en raison de sa prise en charge des données de recherche ainsi que de l’intégration à la plateforme du schéma de métadonnées du Data Documentation Initiative (DDI). Le personnel de Scholars Portal a préparé des documents et du matériel de formation et a formé les membres du personnel des bibliothèques de l’OCUL quant aux avantages d’intégrer le logiciel Dataverse dans leurs services offerts pour la gestion et le dépôt des données de recherche. Résultat : le dépôt Dataverse de Scholars Portal, désormais nommé Borealis, permet à certaines bibliothèques de l’OCUL de lancer des services de GDR sans devoir disposer d’une infrastructure technique ni du personnel pour soutenir les dépôts par elles-mêmes. Les modèles de service varient d’une bibliothèque à l’autre, du dépôt libre-service à la curation prise en charge par la bibliothèque. De nos jours, le service a évolué grandement. Plusieurs autres établissements de partout au pays s’y sont joints ou ont migré leurs données de recherche vers Borealis, ce qui en fait le centre national pour l’archivage des données de recherche. Le soutien à l’utilisation de Borealis est en grande partie assuré localement par le personnel de bibliothèque et est indépendant de l’infrastructure hébergée et supportée par Scholars Portal.

La communauté de données de l’OCUL, dont l’objectif initial était d’aborder l’accès aux données de l’IDD de Statistiques Canada, a évolué pour devenir un forum de soutien à la GDR. Les expertes et experts issus des établissements universitaires de l’Ontario sont devenus des membres clés de la communauté de GDR de l’Alliance et de ses groupes de travail.

La GDR dans les Prairies

Les établissements des provinces des Prairies ont exercé une grande influence sur les collaborations nationales en GDR au cours de la dernière décennie. Au début de 2015, les bibliothèques de l’Université de l’Alberta ont mis en œuvre la première instance canadienne d’un outil en ligne ouvert pour aider les chercheuses et chercheurs à rédiger des PGD. À l’époque, un code DMPOnline d’origine britannique était utilisé; l’Université de la Colombie-Britannique et l’Université de l’Alberta ont été les premiers établissements à en adapter la version canadienne.

Presque immédiatement, le projet a été adapté par d’autres établissements canadiens au sein du cadre Portage de l’ABRC et il a été appelé DMP Builder. Plus tard, au cours du cycle de vie de l’outil, il est devenu l’Assistant PGD qui comprend des options en anglais et en français afin de mieux servir la communauté universitaire francophone. Plus de 50 établissements canadiens se servent désormais de l’Assistant PGD avec des lignes directrices adaptées à chaque établissement par le REE en GDR de l’Alliance. Voilà plus d’une décennie que les bibliothèques de l’Université de l’Alberta commanditent l’Assistant PGD pour la communauté de GDR canadienne, qui lui en est très reconnaissante.

Depuis la fin de 2015, le service des technologies dédié à la recherche de l’Université de la Saskatchewan (USask) a mis en œuvre une initiative semblable en partenariat avec le bureau du vice-président à la recherche. Grâce au financement de Calcul Canada, l’équipe de l’USask a été choisie pour créer une interface nationale de découverte de données de recherche au Canada. Elle est la principale responsable du développement et du fonctionnement de la plateforme Lunaris, désormais sous l’égide de l’Alliance. En 2016, elle a adapté le code source de base, celui-ci étant ouvert, des Open Collections de la bibliothèque de l’Université de la Colombie-Britannique comme interface de découverte principale ainsi que le code de base ouvert de Geodisy, également le fruit des bibliothèques de l’Université de la Colombie-Britannique, comme interface de découverte de données fondées sur les cartes. À l’aide du logiciel ouvert Archivematica, l’équipe de l’USask a également développé une excellente collaboration avec la plateforme Globus Connect pour travailler avec des données massives et préserver les données de recherche numériques.

La GDR en Colombie-Britannique

Depuis longtemps, les établissements de Colombie-Britannique participent à la GDR avec à leur tête l’Université de la Colombie-Britannique (UBC), l’Université Simon-Fraser (SFU) et l’Université de Victoria (UVic). La bibliothèque de l’UBC est l’une des plus grandes bibliothèques universitaires au Canada. Elle réalise des activités de GDR ad hoc depuis le début des années 1970. En 2008, afin d’aider les établissements régionaux de plus petite envergure, l’UBC a conclu une entente pour rendre le dépôt de données Abacus accessibles à d’autres universités de la province. Au moment de la rédaction du présent document, quatre grandes bibliothèques de recherche universitaire en Colombie-Britannique (Université Simon-Fraser, Université de Victoria, Université du nord de la Colombie-Britannique, Université de la Colombie-Britannique) se servent de l’instance du dépôt Dataverse de l’UBC en tant que dépôt de données sous licence.

Les données sont mises à la disposition des personnes utilisatrices de chaque établissement conformément à leurs licences en utilisant la Fédération canadienne d’accès, un organisme qui gère les identités numériques en éducation supérieure et en recherche par le biais d’un cadre de confiance pour le contrôle des accès. L’équipe des données de la bibliothèque de l’UBC offre une formation élémentaire et avancée sur le dépôt Dataverse aux groupes, aux facultés et aux laboratoires sur le campus de l’université et à ses partenaires dans d’autres bibliothèques universitaires et établissements de recherche. Après la formation, ces groupes devraient gérer leurs propres données dans les collections Dataverse qui leur ont été affectées. La UBC Library School (aussi appelée iSchool) a été parmi les premiers établissements canadiens à offrir un cours de premier cycle en gestion des données de recherche.

Les bibliothèques de SFU et d’UVic ont également apporté beaucoup au paysage de la GDR au Canada. Au début des années 2010, la bibliothèque de SFU a développé Radara, son propre dépôt de données de recherche fondé sur Islandora (désormais déprécié et remplacé par le DFDR) et est devenue le chef de file canadien en cryptage à divulgation nulle de connaissance (document en anglais uniquement) pour les données sensibles. Les bibliothèques de l’UVic ont également fait des expériences en matière de services de GDR et ont pu répondre aux besoins des équipes de recherche en matière de licences uniques, notamment pour les jeux de données d’Inforoute Santé Canada.

La GDR dans le nord du Canada

Le nord du Canada est composé de trois territoires : les Territoires du Nord-Ouest, le Nunavut et le Yukon. Les deux établissements de recherche situés dans cette région sont l’Université du Yukon et le Collège Aurora. Dans le cadre de la stratégie de GDR institutionnelle (mandatée par la Politique des trois organismes sur la gestion des données de recherche), les bibliothécaires de l’Université du Yukon et les membres du bureau des services à la recherche ont collaboré à la création d’un dépôt institutionnel, Arca, hébergé par la British Columbia Electronic Library Network (BC ELN).  Ce réseau est une initiative pour les dépôts numériques en Colombie-Britannique fondés sur le logiciel Islandora qui vise principalement les établissements et des collèges de plus petite envergure. Les résultats de recherche téléversés par les chercheuses et chercheurs de l’Université du Yukon dans BC ELN Arca sont collectés par Lunaris.

En octobre 2022, les bibliothécaires du Collège Aurora à Inuvik ont participé à un panel sur les stratégies institutionnelles organisé par l’Alliance. Ce fut l’occasion pour les bibliothécaires de communiquer leur expérience unique pour traiter les enjeux en matière de GDR dans un petit établissement du nord. Certains établissements du nord du Canada, comme l’Université du Yukon, collaborent avec d’autres universités et collèges en Colombie-Britannique pour élaborer leurs stratégies institutionnelles en GDR, conformément à la Politique des trois organismes sur la gestion des données de recherche. Ils participent à un groupe ad hoc pour créer des plans d’action et partager leurs visions des services en GDR dans les établissements de plus petite envergure.

Conclusion

Il s’agit d’une période passionnante pour la GDR au Canada et il a fallu des années de travail dévoué et une collaboration provinciale de haut niveau pour y arriver. Les bibliothèques entrevoient les possibilités d’interagir avec leurs communautés et entre elles. Évidemment, ces occasions s’accompagnent de défis, comme une infrastructure numérique dispendieuse qu’il faut constamment gérer. Nous croyons que Portage et la formation de l’Alliance offrent le meilleur potentiel pour répondre à des besoins jusque-là insatisfaits. Toutefois, pour y arriver, il faudra disposer d’un financement durable.

Le développement d’outils ouverts, d’une infrastructure et de services de soutien en matière de GDR est essentiel pour que les universitaires du Canada puissent réussir à intégrer ces activités à leurs processus de travail. Les bibliothèques universitaires disposent d’une histoire de prise en charge de l’accès aux données, de leur diffusion et de leur préservation; elles ont pour mandat de participer à la préservation des résultats de recherche de leur communauté (p. ex., dépôts institutionnels). Les bibliothèques peuvent diriger l’adoption de pratiques exemplaires et de normes ouvertes. Elles peuvent également établir des partenariats avec toute une gamme de parties prenantes pour l’élaboration d’une infrastructure et d’outils. La communauté des bibliothèques canadienne favorise activement le partage des données de recherche depuis les années 1960 et est en bonne posture pour jouer un rôle de leadership à ce chapitre à l’avenir.

Questions de réflexion

  1. Qu’avez-vous appris au sujet de la communauté des données au Canada?
  2. Selon vous, comment  la communauté des données des bibliothèques universitaires canadiennes se compare-t-elle aux autres secteurs de la bibliothéconomie universitaire?
  3. À la lumière du mouvement international en matière de science ouverte, quels défis percevez-vous en gestion des données de recherche aujourd’hui?
  4. Quels partis ou organismes sont les mieux placés pour soutenir la GDR auprès des chercheuses et chercheurs canadiens?

 

Éléments clés à retenir

  • Les services de données, la sensibilisation, les infrastructures, les outils et la culture de GDR en général ont évolué au cours des décennies et ce, tant sur le plan local, régional, que national.
  • Les bibliothécaires de données, les spécialistes des données, les consortiums de bibliothèques, les agences de financement public et les organismes gouvernementaux jouent un rôle clé dans la définition des besoins et dans l’élaboration des services en GDR.
  • Pour favoriser les pratiques exemplaires en gestion des données en soutien aux services de GDR, le gouvernement, les établissements, les prestataires de services et la communauté de recherche doivent continuer à collaborer à toutes les étapes du cycle de vie de la recherche.
  • Plusieurs outils et infrastructures techniques existent pour soutenir la GDR et ils devront évoluer afin de répondre aux besoins actuels et nouveaux.

Remerciements

La première version de la section sur la GDR au Québec a été rédigée par Ève Paquette-Bigras, bibliothécaire universitaire à l’Université de Montréal. Les autrices et auteurs remercient Ève d’avoir fourni l’historique et le contexte des réalisations en matière de GDR dans cette province.

Lectures et ressources supplémentaires

Doiron, J., Neilson, M. et Nicholson, R. (2020). Data management planning in Canada [Livre blanc]. NDRIO. https://alliancecan.ca/en/document/261

Gouvernement du Canada. (2021). Politique des trois organismes sur la gestion des données de recherche. https://science.gc.ca/site/science/fr/financement-interorganismes-recherche/politiques-lignes-directrices/gestion-donnees-recherche/politique-trois-organismes-gestion-donnees-recherche

Lavoie, B. et Dempsey, L. (2004). Thirteen ways of looking at…digital preservation. D-Lib Magazine, 10(7–8). https://doi.org/10.1045/july2004-lavoie

Moon, J. (2021, 8 novembre). Mise à jour de Portage et l’Alliance de recherche numérique du Canada. Alliance de recherche numérique du Canada. https://alliancecan.ca/fr/nouveautes/nouvelles/mise-jour-de-portage-et-lalliance-de-recherche-numerique-du-canada

Read, K., McDonald, G., Mackay, B. et Barsky, E. (2014). A commitment to First Nations data governance: A primer for health librarians. Journal of the Canadian Health Libraries Association / Journal de l’Association des bibliothèques de la santé du Canada, 35(1), 11–15. https://doi.org/10.5596/c14-003

Wilkinson, M. D., Dumontier, M., Aalbersberg, Ij. J., Appleton, G., Axton, M., Baak, A., Blomberg, N., Boiten, J-. W., da Silva Santos, L. B., Bourne, P. E., Bouwman, J., Brookes, A. J., Clark, T., Crosas, M., Dillo, I., Dumon, O., Edmunds, S., Evelo, C. T., Finkers, R., … Mons, B. (2016). The FAIR guiding principles for scientific data management and stewardship. Scientific Data, 3, 1–9. https://doi.org/10.1038/sdata.2016.18

Bibliographie

Attendees of the NDSF Summit. (2019). Kanata declaration (Version 2.0). National Data Services Framework Summit 2019 (NDSF 2019), Ottawa, Canada. Zenodo. https://doi.org/10.5281/zenodo.3234815

Barsky, E., Laliberté L., Leahey, A. et Trimble, L. (2017). Collaborative research data curation services: A view from Canada. Dans L. R. Johnston (dir.), Curating research data: Volume one: Practical strategies for your digital repository (p. 79-101). Association of College and Research Libraries. https://dx.doi.org/10.14288/1.0340778

Bilodeau, G. (2018, 3 mai). Gestion des données de recherche (GDR): Écosystème Canadien – un bref survol [Présentation]. Semaine de la conduite responsable en recherche, Université Laval, Québec, Canada. https://www.ulaval.ca/sites/default/files/recherche-creation/documents/conduite%20responsable/gestion-donnees-recherche-bilodeau.pdf

Boyko, E. et Watkins, W. (2011). The Canadian data liberation initiative: An idea worth considering. International Household Survey Network, IHSN Working Paper (006). http://www.ihsn.org/sites/default/files/resources/IHSN-WP006.pdf

Cheung, M., Cooper, A., Dearborn, D., Hill, E., Johnson, E., Mitchell, M. et Thompson, K. (2022). Practices before policy: Research data management behaviours in Canada. Partnership: The Canadian Journal of Library and Information Practice and Research, 17(1), 1-80. https://doi.org/10.21083/partnership.v17i1.6779

Cooper, A., Steeleworthy, M., Paquette-Bigras, È., Clary, E., MacPherson, E., Gillis, L., Wilson, L. et Brodeur, J. (2021). Guide pour la curation dans Dataverse. Zenodo. https://doi.org/10.5281/zenodo.5579820

Hill, E. et Gray, S. V. (2016). The academic data librarian profession in Canada: History and future directions. Dans L. M. Kellam et K. Thompson (dir.), Databrarianship: The Academic Data Librarian in Theory and Practice (p. 321-334). ACRL. http://ir.lib.uwo.ca/wlpub/49

Hackett, Y. (2001). A national research data management strategy for Canada: The work of the National Data Archive Consultation Working Group. IASSIST Quarterly,​ 25(3), 13-16. https://doi.org/10.29173/iq91

Heidorn, P. B. (2008). Shedding light on the dark data in the long tail of science. Library Trends, 57(2), 280–299. https://doi.org/10.1353/lib.0.0036

Humphrey, C. (2005). Collaborative training in statistical and data library services: Lessons from the Canadian data liberation initiative. Resource Sharing and Information Networks, 18(1–2), 167–181. https://doi.org/10.1300/J121v18n01_13

Humphrey, C. (2012a, 5 décembre). Canada’s long tale of data. Preserving Research Data in Canada. http://preservingresearchdataincanada.net/2012/12/05/hello-world

Humphrey, C. (2012b, 13 décembre). Research data management infrastructure II. Preserving research data in Canada. https://preservingresearchdataincanada.net/2012/12/13/research-data-management-infrastructure-ii/

Humphrey, C. (2020). The CARL portage partnership story. Partnership: The Canadian Journal of Library and Information Practice and Research, 15(1), 1–7. https://doi.org/10.21083/partnership.v15i1.5825

Humphrey, C., Shearer, K. et Whitehead, M. (2016). Towards a collaborative national research data management network. International Journal of Digital Curation, 11(1), 195–207. https://doi.org/10.2218/ijdc.v11i1.411

Liss, S. N. (2018, 5 septembre). Addressing gaps in Canadian research data management: A comprehensive guide of the Portage Network. University Affairs. https://www.universityaffairs.ca/magazine/sponsored-content/addressing-gaps-in-canadian-research-data-management/ 

Moon, J. (2014). Developing a research data management service – a case study. Partnership: The Canadian Journal of Library and Information Practice and Research, 9(1), 1–14. https://doi.org/10.21083/partnership.v9i1.2988

Roy, J. et Bégin, J.-O. (1969). Enquête relative à un plan de coordination: rapport. Comité de coordination des bibliothèques de la CREPUQ.

Steeleworthy, M. (2014). Research data Management and the Canadian Academic library: An organizational consideration of data management and data stewardship. Partnership: The Canadian Journal of Library and Information Practice and Research, 9(1), 1–11. https://doi.org/10.21083/partnership.v9i1.2990

Strong, D. F. et Leach, P. B. (2005). National consultation on access to scientific research data (Rapport final). Gouvernement du Canada. https://publications.gc.ca/site/eng/272526/publication.html

Vézina, M.-H. (2022). Métadonnées bibliographiques des thèses et mémoires du dépôt institutionnel de l’Université de Montréal [Canada] [Jeu de données]. Borealis. https://doi.org/10.5683/SP3/SJJACL

definition

À propos des auteurs

Eugene Barsky est bibliothécaire en données de recherche à l’Université de la Colombie-Britannique (UBC). Il travaille avec les chercheuses et chercheurs de l’UBC pour conserver et gérer les données de recherche, de la planification au dépôt en passant par la préservation. M. Barsky a participé à la mise sur pied du service de Dépôt fédéré de données de recherche et collabore avec l’Alliance de recherche numérique du Canada (l’Alliance) ainsi que l’Union européenne (OpenAIRE). Il est le chercheur principal du projet national Geodisy financé par l’Alliance. Parmi les prix qui lui ont été décernés par ses pairs, mentionnons ceux de l’Association des bibliothèques de recherche du Canada, de l’American Society for Engineering Education et la Special Library Association. Il a publié plus de 30 articles révisés par des pairs et il a fait des présentations à plus de 70 conférences. Il est professeur associé à l’iSchool de l’UBC. Il enseigne la gestion des données de recherche et compte parmi les personnes qui ont fondé le réseau d’expertes et d’experts de Portage (maintenant l’Alliance) au Canada. Courriel : eugene.barsky@ubc.ca | ORCID : 0000-0002-5119-2271

definition

Elizabeth Hill est la bibliothécaire des données à l’Université Western. Elle y donne des formations en littératie des données ainsi qu’en accès aux sources de données. Elle agit à titre de conseillère externe auprès de Statistiques Canada. Mme Hill est active dans plusieurs communautés de données et groupes de travail et ce, tant à titre de participante que de cheffe. Ses domaines d’intérêt en recherche comprennent le soutien aux chercheuses et chercheurs. Elle a publié des ouvrages au sujet des systèmes de diffusion de données et de la bibliothéconomie des données au Canada. ORCID : 0000-0002-9715-238X

definition

Tatiana Zaraiskaya est une bibliothécaire en STIM aux bibliothèques de l’Université du Nouveau-Brunswick (UNB) où elle est également responsable de la gestion des données de recherche. Depuis 2016, elle est membre du Groupe d’experts sur la recherche et l’intelligence de l’Alliance de recherche numérique du Canada. Elle a participé à plusieurs sondages menés par ce groupe de travail et compte parmi les personnes ayant réalisé le sondage sur la GDR de l’Université Queen’s et de l’UNB. Elle a corédigé plusieurs conférences et autres publications savantes en lien avec la GDR et elle a participé à l’élaboration du modèle de PGD de base de Portage. Elle a obtenu un doctorat en biophysique à l’Université de Guelph et un MLIS à l’Université Western en Ontario. Courriel : t.zaraiskaya@unb.ca  | Google Scholar : https://scholar.google.com/citations?user=BB6c8XQAAAAJ&hl=en | ORCID : 0000-0001-9294-6052

definition

Minglu Wang est une bibliothécaire en gestion des données de recherche (GDR) à l’Université York. Elle a publié des articles de recherche, des chapitres de livre, des documents de travail et des communications lors de colloques au sujet des bibliothèques universitaires et des services de GDR. Mme Wang est une membre active de l’Association of College & Research Libraries (ACRL), une division de l’American Library Association. Pendant plusieurs années, elle a rédigé des articles et des livres blancs pour les publications Top Trends et Environmental Scan de l’ACRL. Elle fait partie du Groupe d’experts sur la recherche et l’intelligence de l’équipe de GDR de l’Alliance de recherche numérique du Canada. Elle a participé à la conception et à la rédaction du rapport sur le sondage sur les capacités en GDR des établissements canadiens. Courriel : mingluwa@yorku.ca  | ORCID : 0000-0002-0021-5605

definition

Lucia Costanzo est la bibliothécaire en GDR à l’Université de Guelph. Récemment, elle a terminé un prêt de service auprès de l’Alliance de recherche numérique du Canada (l’Alliance) en tant que coordonnatrice de l’évaluation, de la recherche et de l’intelligence. Dans le cadre de ce rôle, Mme Costanzo a coordonné les activités du Groupe d’experts sur la recherche et l’intelligence. Ces activités comprenaient informer et conseiller l’équipe de GDR et la direction de l’Alliance relativement aux nouveaux développements et aux nouvelles directions et ce, tant à l’échelle nationale qu’internationale, au chapitre de la GDR et des écosystèmes plus vastes d’infrastructure de recherche numérique. Avant sa période de prêt de service, elle a travaillé pendant plus de 20 ans à l’Université de Guelph à appuyer, rendre accessible et contribuer au processus d’apprentissage et de recherche sur le campus. Courriel : lcostanz@uoguelph.ca | ORCID : 0000-0003-4785-660X

definition

Licence

Symbole de License Creative Commons Attribution - Pas d’utilisation commerciale 4.0 International

La gestion des données de recherche dans le contexte canadien Droit d'auteur © 2023 par Sous la direction de Kristi Thompson; Elizabeth Hill; Emily Carlisle-Johnston; Danielle Dennie; et Émilie Fortin est sous licence License Creative Commons Attribution - Pas d’utilisation commerciale 4.0 International, sauf indication contraire.

Identificateur d’objets numériques (DOI)

https://doi.org/10.5206/XXFL7946

Partagez ce livre