Avant-propos : réflexions sur une carrière de bibliothécaire de données

Jeff Moon

Au cours des dernières années, la reconnaissance de la gestion des données de recherche (GDR) en tant que pilier essentiel des activités de recherche est montée en flèche, et ce, grâce aux efforts des bibliothécaires, des spécialistes des données, des responsables du développement en recherche, des autorités politiques, des organismes de financement, des maisons d’édition, des administrations dans les établissements d’enseignement supérieur et d’un nombre croissant de chercheuses et chercheurs de première ligne. Comment y sommes-nous arrivés? En réfléchissant à mes 36 années d’expérience dans ce domaine, la réponse m’apparaît évidente : grâce à la communauté. La nature collégiale et collaborative de la communauté canadienne des données nous a permis au fil des décennies d’atteindre cette reconnaissance, car nous croyons tous qu’ensemble, nous pouvons faire mieux. Pour mettre en contexte l’origine et l’objectif de cette nouvelle ressource éducative libre (REL), j’ai revisité ce parcours. Mon récit de notre histoire commune prendra une couleur personnelle et s’avérera sélectif; vous pouvez approfondir le sujet en consultant les excellents travaux de Gray et Hill (2016) et de Humphrey (2020).

Je suis arrivé à l’Université Queen’s en 1987, fort d’une formation en biologie, d’un diplôme en bibliothéconomie et de connaissances de base en statistiques et en ordinateurs centraux. C’est d’ailleurs grâce à ces derniers que j’ai été engagé comme premier bibliothécaire de données à Queen’s. Je crois qu’à l’époque, l’Université était l’un des six établissements canadiens à avoir des bibliothécaires de données. Très tôt, j’ai appris que cette profession était une activité aérobique : apporter les rubans de données à neuf pistes au centre informatique, revenir à la bibliothèque, accomplir une tâche en lot sur l’ordinateur central, retourner au centre informatique pour récupérer les résultats imprimés, revenir à la bibliothèque, trouver et corriger les erreurs; répéter le processus. Je n’ai jamais été aussi en forme!

À cette époque, le gouvernement fédéral imposait des mesures de recouvrement des coûts qui décuplaient le prix pour les données de Statistiques Canada, soit de 25 $ à 2 500 $ par fichier, rendant les données inaccessibles pour les chercheuses, les chercheurs et les universités. Laine Ruus, une bibliothécaire de données de longue date à l’Université de Toronto, était d’avis qu’ensemble, nous pouvions faire mieux. En collaboration avec l’Association des bibliothèques de recherche du Canada (ABRC), elle a mené des négociations afin d’acheter un ensemble de fichiers de données du recensement auprès de Statistiques Canada afin de les copier puis de les partager sous licence avec les établissements participants. La tâche gargantuesque et totalement altruiste de copier et d’envoyer des centaines de rubans magnétiques à l’échelle du pays a fait en sorte que les données demeuraient abordables et accessibles pour les 25 établissements participants.

Ce succès comprenait son lot de défis : que devaient faire les bibliothèques universitaires avec ces rubans? La plupart du temps, les bibliothécaires étaient responsables des documents gouvernementaux et se voyaient attribuer le rôle de « bibliothécaire de données », bien que la plupart n’avaient pas de formation dans le domaine. C’est ainsi qu’en 1988 est née l’Association canadienne des utilisateurs de données publiques (ACUDP) dont l’un de ses principaux mandats était de former ses membres. Parmi les personnes à la tête de cette formation, mentionnons Wendy Watkins (Université Carleton) et Laine Ruus. D’abord offerte de manière non formelle, souvent individuellement, la formation est devenue plus formelle à l’occasion de diverses conférences.

Plus tard, Wendy s’est jointe à Ernie Boyko de Statistiques Canada pour entreprendre un projet de grande envergure : élaborer ce qui est devenu l’Initiative de démocratisation des données (IDD) et trouver les ressources nécessaires pour ce modèle de service des données national conçu pour fournir un accès aux données de Statistiques Canada et, surtout, une formation ciblée moyennant le paiement de frais d’abonnement annuels fixes et abordables. Cette réussite a nécessité beaucoup d’adhésion, de temps et d’effort. En 1995, dans un rapport régional au ICPSR (en anglais uniquement), Wendy indiquait qu’à ce jour, toutes les parties étaient enthousiastes, mais qu’il manquait des engagements fermes en matière de financement. Au moment du lancement en 1996, plus de 50 établissements s’étaient joints à l’initiative en tant que « représentants de l’IDD » et bénéficiaient du double avantage des économies et de l’indispensable  formation. Un autre avantage, moins tangible, à émerger de  l’IDD a été une communauté de pratique dans le cadre de laquelle les bibliothécaires de données plus habiles offraient du soutien, une direction et des encouragements à un nombre croissant de nouvelles recrues dans le domaine des données au Canada. Ce réseau d’expertise et de mentorat a de facto aidé à créer des liens, à bâtir la confiance et la crédibilité et constitue un modèle de développement communautaire dont nous tirons profit aujourd’hui.

Avançons rapidement dans le temps : je vois le progrès depuis les rubans magnétiques jusqu’aux cartouches puis aux CD-ROM, à la fois individuels et dans des « tours » réseautées, jusqu’à l’émergence des données livrées par Internet par site FTP puis par le Web. Plusieurs services canadiens de livraison de données fondés sur le Web ont vu le jour au cours de cette période; leurs noms abstraits rappelleront des souvenirs aux bibliothécaires d’un certain âge : IDLS, Equinox, QWIFS, LANDRU, ISLAND, Sherlock et SDA. L’IDD a souvent offert une formation régionale au sujet d’un ou de plusieurs de ces services. Ce pot-pourri de systèmes a servi de terrain d’essai pour des solutions nationales plus ambitieuses; plusieurs de ces plateformes offraient un accès par abonnement aux établissements d’un océan à l’autre.

Fait important : au cours de cette période, le concept de gestion des données est apparu et s’est développé, bien que lentement. Plusieurs bibliothécaires de données ont commencé à participer à des « sauvetages de données », montrant ainsi le risque de perdre les fichiers de données produits par le gouvernement par cause d’ignorance, d’absence de financement ou par négligence. Statistiques Canada a souvent demandé à Laine Ruus, une collectionneuse hors pair, si elle avait conservé (géré) une copie des données dont ils avaient besoin et qu’ils ne trouvaient plus. Le rapport régional de l’ICPSR a illustré la situation en mentionnant les activités de la Data Library de l’Université de l’Alberta qui a réussi à sauver 20 années de données de l’étude Albert Hail après la fermeture d’un programme gouvernemental provincial. Il est aujourd’hui possible d’accéder à ces données dans Borealis, le dépôt Dataverse canadien.

Au fur et à mesure que la technologie a évolué, ainsi en a-t-il été de l’importance d’effectuer des recherches numériques. Comme dans les cas d’initiatives de sauvetage de données mentionnées précédemment, la valeur, combinée à la fragilité, des données générées par les chercheuses et les chercheurs a émergé dans les consciences. Au cours de la dernière décennie, le gouvernement fédéral et ses trois organismes de financement ont publié une gamme de documents politiques fondamentaux qui définissent leur position par rapport à la science ouverte et à l’importance de la transparence, de la reproductibilité, de la vérification et de la réutilisation des données. Les bibliothèques aussi, guidées par l’Association des bibliothèques de recherche du Canada (ABRC) dirigée de main de maître par la directrice générale Susan Haigh, se sont beaucoup intéressées à la GDR. Grâce au soutien des directrices et directeurs de bibliothèque de l’ABRC et du leadership visionnaire de Charles (Chuck) Humphrey (Université de l’Alberta), une feuille de route de la GDR au Canada a vu le jour, aboutissant en 2015 à la création du réseau Portage de l’ABRC. En 2017, j’ai accepté de relever le défi de prendre le relais de Chuck lorsqu’il a pris sa retraite. Je me suis alors joint à Lee Wilson, alors gestionnaire de service de Portage, dans le but de continuer à développer le réseau pancanadien d’expertes et experts (signe de tête de reconnaissance à l’IDD), lequel a été mis sur pied pour, à partir de zéro, développer et coordonner la capacité de GDR et la formation au Canada. Ensemble, nous avons supervisé l’intégration du réseau Portage dans l’Alliance de recherche numérique du Canada (l’Alliance). L’équipe de GDR à l’Alliance et le réseau d’expertes et experts, désormais dirigés par Lee Wilson, a poursuivi le travail de Portage en étroite collaboration avec d’autres dans l’écosystème d’infrastructure de recherche numérique afin d’améliorer les pratiques de gestion de données, les plateformes, les services et la formation à l’échelle du Canada.

Peu après le lancement du réseau Portage, on m’a demandé de préparer un programme de GDR de premier cycle pour l’école de bibliothéconomie de l’Université Western. Au bout d’une recherche méticuleuse, j’ai fini par choisir un manuel rédigé au Royaume-Uni comme base pour le cours. Admirablement rédigé et exhaustif, il ne portait toutefois que sur les outils, cadres politiques et exemples britanniques et européens. Si plusieurs aspects de la GDR dépassent les frontières nationales, faire comprendre son contexte local à la communauté étudiante canadienne aurait eu une grande valeur. D’autres personnes ont exprimé une frustration semblable alors qu’elles cherchaient un soutien local à la GDR qui faisait autorité en la matière.

Portage, et maintenant l’Alliance, a fait beaucoup pour aborder les besoins de formation en GDR au Canada, entre autres en collaborant étroitement avec le réseau d’expertes et experts en GDR. Le  Groupe d’experts national sur la formation (GENF) a été particulièrement impliqué pour créer une vaste gamme de webinaires, de modèles, de guides, de glossaires, de vidéos et de cours préparatoires – tous offerts gratuitement sur le site Web d’alliancecan.ca. En même temps, d’autres membres de la communauté de GDR ont convenu qu’il était possible d’en faire plus. Mentionnons Lachlan MacLeod de l’Université Dalhousie qui a lancé la discussion à propos de la création d’un manuel ouvert sur la GDR, organisé des appels communautaires et établi une liste de distribution pour les personnes intéressées par le sujet. Une équipe de rédaction nationale a été mise sur pied; elle est composée d’Elizabeth (Liz) Hill, de Kristi Thompson et d’Emily Carlisle-Johnston, toutes de l’Université Western (anglais) et de Danielle Dennie (Université Concordia) ainsi qu’Émilie Fortin (Université Laval) (français).

L’équipe de rédaction anglophone a préparé le concept initial pour l’élaboration du manuel, la levée de fonds et la révision des soumissions en anglais. Liz Hill apporte une grande expérience en données et GDR, une connaissance approfondie de l’histoire des services de données au Canada (consultez l’article mentionné ci-après ainsi que le chapitre sur l’histoire compris dans ce manuel) et connaît presque tous les membres de l’écosystème de données canadien – autant de membres qui la connaissent en retour. Elle a su rallier habilement les gens et les relations pour ce projet. Kristi Thompson apporte une expérience en sciences informatiques et en analyse quantitative au projet, ce dont, en plus de son expérience en rédaction, elle a tiré profit pour réviser le contenu technique du manuel. Elle est reconnue pour son travail d’anonymisation des données (consultez le chapitre sur les données sensibles), sa capacité de lecture de textes au contenu quantitatif ainsi que sa participation au « sauvetage de données », le tout bien ancré dans une expertise solide en GDR. Kristi a aussi mené des efforts de collecte de fonds fructueux pour le projet. L’équipe de rédaction a bénéficié du travail d’Emily Carlisle-Johnston qui dispose d’une expertise essentielle en REL, en révision et en élaboration de manuels. Ses connaissances de la plateforme de publication ouverte Pressbooks, son plaidoyer à l’égard de l’ouverture tout au long du processus du projet et son expérience à diriger le processus de rédaction de ressources éducatives libres (REL) alors qu’elle travaillait chez eCampusOntario ont fait d’elle une ressource parfaite pour ce projet.

L’équipe de rédaction francophone était responsable de superviser la traduction, de réviser les contributions en français et de diriger la production d’une édition entièrement en français. Émilie Fortin dispose d’une expérience variée et d’une formation en préservation en plus d’avoir rédigé des documents essentiels sur les métadonnées et les formats pour ce manuel. Elle travaille en GDR depuis 2021. Danielle Dennie a une formation en bibliothéconomie scientifique et en GDR et elle a occupé plusieurs postes de direction de bibliothèque. Danielle est la coordonnatrice principale entre les aspects anglophones et francophones du projet; elle est l’agente de liaison avec l’équipe anglophone et supervise le travail des réviseurs et des traducteurs. Danielle et Émilie ont toutes deux contacté la communauté des données francophone et ont traduit des communications pour le projet.

Cette équipe de rédaction nationale dispose d’une vaste gamme de compétences et de niveaux d’expérience; chaque membre apporte une contribution distincte et complémentaire. En fin de compte, leurs efforts conjoints ont attiré plus de 50 membres de la communauté canadienne des données pour des rôles d’édition, de rédaction, de révision, de collecte de fonds, entre autres contributions à ce projet. Cette équipe pancanadienne élargie partage une appréciation de la valeur et de l’importance d’encadrer la formation et les ressources en GDR dans un contexte canadien et a décidé de combler ce besoin. Résultat : ce manuel sur la GDR bilingue, entièrement canadien, La gestion des données de recherche dans le contexte canadien : un guide pour la pratique et l’apprentissage.

Il est passionnant de penser à quel point ce travail promet d’être précieux et apprécié dans le cadre d’un arsenal toujours plus grand de ressources canadiennes de formation en matière de GDR. Ce manuel vise les chercheuses et les chercheurs et les spécialistes à tous les niveaux et de toutes les disciplines. Il présente un fort potentiel d’utilisation dans les contextes suivants :

  • En tant que matériel éducatif (cours, ateliers, école de bibliothéconomie, etc.);
  • En tant que source de référence (pour les chercheuses et chercheurs et spécialistes en GDR – novices ou avec de l’expérience);
  • En administration, pour les gestionnaires qui souhaitent en savoir davantage sur les aspects politiques et réglementaires de la GDR;
  • En tant que moteur de changement pouvant être mis en application dans des discussions sur les politiques, leur élaboration et leur mise en place.

Le fait que ce manuel soit en ligne et libre facilite son accessibilité et ses possibilités d’amélioration continue. Le paysage de la GDR évolue sans cesse grâce aux progrès réalisés sur la scène locale, régionale, nationale et internationale. Autant de travaux qui peuvent nourrir et améliorer cette référence au fil du temps.

Au fond, ce manuel incarne un océan de changements dans l’écosystème canadien des données. Nous témoignons et participons à élargir notre objectif collectif national qui ne se limite plus à faciliter l’accès et l’utilisation des données existantes, mais à développer activement le contenu disponible en favorisant et en soutenant la FAIR-isation des données générées par les chercheuses et chercheurs selon les moyens décrits dans ce manuel. Les pratiques exemplaires, les conseils, l’orientation, les discussions sur les politiques et les exemples renforceront certainement les efforts déployés pour normaliser l’attention nécessaire et croissante portée aux principes FAIR. Je choisis le verbe « normaliser », car nous devons faire des pratiques exemplaires relatives à la gestion des données de recherche une normalité. Nous devons aussi nous attendre à ce qu’elles soient intégrées aux mentalités et aux processus de travail des différentes communautés de recherche,  et ce, non seulement en réaction à des impératifs politiques, mais parce que les chercheuses et chercheurs reconnaissent et valorisent les bienfaits des données bien gérées – pour leur discipline, leur réputation, la réutilisation et vérification futures, et la société dans son ensemble. Ce manuel nous aidera à atteindre cet objectif. Ne sous-estimez jamais le pouvoir d’une communauté dévouée à l’action.

Mars 2023

Gray, S. V. et Hill, E. (2016). The Academic Data Librarian Profession in Canada: History and Future Directions. Dans L. Kellam et K. Thompson (dir.), Databrarianship: The Academic Data Librarian in Theory and Practice (p. 321-334). Association of College and Research Libraries.  http://ir.lib.uwo.ca/wlpub/49

Humphrey, C. (2020). The CARL Portage Partnership Story.  Partnership: The Canadian Journal of Library and Information Practice and Research, 15(1). https://doi.org/10.21083/partnership.v15i1.5825


À propos de l'auteur

Jeff Moon est directeur de la stratégie et des services de données chez Compute Ontario.

Licence

Symbole de License Creative Commons Attribution - Pas d’utilisation commerciale 4.0 International

La gestion des données de recherche dans le contexte canadien Droit d'auteur © 2023 par Sous la direction de Kristi Thompson; Elizabeth Hill; Emily Carlisle-Johnston; Danielle Dennie; et Émilie Fortin est sous licence License Creative Commons Attribution - Pas d’utilisation commerciale 4.0 International, sauf indication contraire.

Identificateur d’objets numériques (DOI)

https://doi.org/10.5206/VLBE3222

Partagez ce livre