Perspectives sur la gestion des données de recherche

18 Une perspective pratique sur le domaine évolutif de la gestion des données de recherche

Dr. Joel T. Minion

Objectifs d’apprentissage

À la fin de ce chapitre, vous pourrez :

  1. Comprendre les facteurs au cœur du développement de la gestion des données de recherche.
  2. Définir les rôles et responsabilités de divers groupes qui participent à la gestion des données de recherche.
  3. Comprendre dans quelle mesure la gestion des données de recherche, les méthodes de recherche et les types de données continuent d’évoluer, et ce, tant ici qu’à l’international.
  4. Formuler une stratégie élémentaire pour gérer un jeu de données de recherche particulier.

Introduction

Comme vous le savez, la gestion et la supervision systématiques des données de recherche sont en train de devenir des compétences essentielles pour les chercheuses et chercheurs des établissements d’enseignement supérieur au Canada et de partout dans le monde, tout comme pour les bibliothécaires et autres spécialistes des données qui les soutiennent. Si les progrès au chapitre de la gestion des divers types de données profitent à la recherche en général à long terme, ce changement ne cesse de soulever des inquiétudes pratiques chez les personnes responsables de la gestion des données de recherche (GDR). Un des principaux défis de la GDR : il s’agit d’un domaine de pratique émergent. Les attentes en matière de gestion des données varient selon le type de données, le domaine d’étude, l’établissement, la source de financement et le ressort territorial. Les initiatives pour gérer et partager les données génomiques, par exemple, sont plus avancées que celles relatives aux données ethnographiques. De même, chaque pays n’accorde pas la même urgence à mettre en œuvre des stratégies pour faire progresser la GDR.

Par conséquent, les chercheuses et chercheurs et autres spécialistes ayant besoin de gérer des données ne disposent pas toujours d’une voie claire à suivre avec des indications fiables; dans certains cas, il s’agit même de défricher le terrain. Tous les travaux en GDR ont ceci en commun qu’ils doivent réfléchir de manière critique aux tâches à réaliser. Aucune approche unique ne fonctionnera à grande échelle. Ce chapitre a pour but de vous aider à développer une perspective critique à l’égard de la gestion des données de recherche, quel que soit votre rôle dans le processus. Comme vous le constaterez, la capacité à réfléchir à ces défis en lien avec la GDR exige un ensemble de compétences dans plusieurs domaines : se familiariser avec les éléments complexes des données de recherche; mettre en application les approches actuelles dans de nouveaux contextes; déterminer où et quand chercher des réseaux de pratique externes pour obtenir du soutien et affiner votre ingéniosité et créativité.

Il est essentiel de retenir que le travail de gestion des données relève à la fois de l’art et de la science. S’il existe plusieurs principes et pratiques pour vous guider, la GDR n’est souvent rien de plus que des chercheuses et chercheurs qui commencent en GDR, dont le temps est limité, qui tentent de traiter leurs données selon leur niveau de connaissance.

La réflexion repose sur trois questions.

  • Pourquoi insister sur la GDR? Cette partie examine ce qui stimule les nouvelles exigences pour gérer les données de manière systématique et pourquoi la réponse est importante pour vous;
  • À qui la responsabilité? Le travail de GDR comprend divers groupes. L’expertise et les responsabilités des gens ont une incidence sur la manière dont le travail est effectué et comment le soutien est offert;
  • Où se trouve l’avant-garde? Parce que la GDR n’en est encore qu’à ses débuts, nos efforts doivent être encadrés par la pratique actuelle tout en restant à l’affût des changements en cours, au Canada et ailleurs.

Fort de ces questions, nous conclurons le chapitre avec des étapes pratiques à prendre en considération lorsque nous gérons des données de recherche, quel que soit le projet. Ensemble, questions et étapes devraient améliorer vos compétences en résolution de problèmes et optimiser votre capacité à réaliser des travaux en lien avec la GDR.

Pourquoi insister sur la GDR?

Si vous êtes nouvelle ou nouveau dans le monde des données de recherche, vous aurez peut-être la surprise d’apprendre à quel point l’approche de la GDR, systématique et contrôlée de l’extérieur de la recherche, est novatrice. Généralement, les chercheuses et chercheurs, en collaboration avec leur établissement, sont responsables de la gestion des données de recherche : la manière de les organiser, de les archiver et la décision de les partager. Souvent, les données de recherche sont perçues comme étant la propriété de la chercheuse ou du chercheur qui les ont créées. Elles sont le produit d’un investissement substantiel en temps, en effort personnel, en formation et en perfectionnement professionnel de la part de la chercheuse ou du chercheur. Les données constituent la pierre angulaire de sa carrière et la base de publications scientifiques. Elles ont peut-être été partagées avec des collègues proches, mais il n’y a que peu d’incitatifs, et encore moins d’exigences, à organiser les données selon des normes externes ou à les rendre accessibles à autrui.

Dans ces circonstances, il y a eu très peu de motivation à adopter une approche plus systématique de la GDR. Qu’est-ce qui a changé? Jusqu’à un certain point, la culture a changé dans diverses communautés de recherche afin de reconnaître l’impact possible de la collaboration sur la progression des disciplines et la production de connaissances. Si cette évolution se poursuit (plus rapidement dans certains domaines que dans d’autres), elle n’explique pas, à elle seule, pourquoi des concepts comme les principes FAIR et des outils comme les plans de gestion de données (PGD) ont vu le jour. Deux facteurs ont été particulièrement percutants : 1) les attentes qui évoluent de la part des sources de financement, 2) les progrès technologiques et la puissance des données massives.

Attentes en évolution

Pendant plus d’une décennie, les principaux organismes de financement (p. ex., les trois organismes fédéraux de financement de la recherche au Canada et des organismes semblables ailleurs dans le monde) ont commencé à optimiser la production de connaissances issues des recherches qu’ils soutiennent. Ils exigent des données bien organisées et (idéalement) ouvertes, et ce, pour plusieurs raisons. D’abord, des données bien gérées réduisent le dédoublement, car elles permettent à la communauté de recherche de cerner les études déjà réalisées sur un sujet. La GDR donne un accès plus complet aux données de recherche, bien au-delà de ce qui est inclus dans les articles ou les livres qu’une chercheuse ou un chercheur choisit de publier (ou peut publier). Ensuite, un meilleur accès aux données historiques signifie de meilleures occasions de réaliser une analyse secondaire, ce qui maximise les résultats de recherche pour chaque dollar, peso, livre, euro investi. Enfin, les organismes de financement conviennent qu’une meilleure gestion des données et une plus grande ouverture protègent la robustesse et la transparence de la recherche qu’ils appuient (Pinfield et al., 2014).

Exercice : la montée des plans de gestion des données (PGD)

Comme vous l’avez appris, l’obligation pour les chercheuses et chercheurs de soumettre des plans de gestion des données avec leurs demandes de subvention devient de plus en plus fréquente au Canada. Dans d’autres pays, certains organismes de financement exigent un PGD depuis plus d’une décennie. Effectuez des recherches en ligne pour trouver les références les plus récentes en matière de PGD (soit des exemples de plans, soit des appels à les rendre obligatoires). Après avoir examiné quelques exemples, réfléchissez de manière critique aux types de données, aux domaines d’étude, aux pays/organismes de financement en question. Que découvrez-vous au sujet de la montée des PGD?

Progrès technologiques

Les progrès en matière de technologies informatiques stimulent, eux aussi, la GDR. Pensons notamment à la capacité à stocker des jeux de données massifs et de travailler avec eux, l’arrivée de l’infonuagique et du partage de données par Internet ainsi que la réduction des coûts des technologies informatiques. À l’origine, de telles améliorations constituaient les principaux avantages pour les domaines qui travaillent avec des données massives (p. ex., l’astronomie, la génomique, la cartographie géospatiale), ce qui explique, en partie, pourquoi la GDR a progressé plus rapidement dans certaines disciplines que dans d’autres (la nature des données en question – quantitative – constitue un autre facteur). De tels progrès technologiques ont façonné les possibilités dans d’autres domaines d’étude, comme la numérisation des ressources en sciences humaines et la capacité d’analyser les données des médias sociaux. Des améliorations apportées aux logiciels d’analyse ont également permis de relier des données de recherche de manière sécuritaire à d’autres types de données (p. ex., les dossiers médicaux, les sources météorologiques) pour créer d’encore plus gros jeux de données.

Autres facteurs

Bien entendu, d’autres facteurs stimulent également la GDR. Une gestion plus cohérente des données rend le processus de recherche plus efficace et peut mener à des résultats plus solides. Comme mentionné dans le chapitre sur la GDR et la recherche qualitative, une meilleure organisation des données d’entrevues améliore l’analyse, car il devient possible d’établir plus facilement des liens dans de grands jeux de transcription. De plus en plus, la recherche est transdisciplinaire, ce qui signifie qu’elle dépasse les limites et méthodologies épistémologiques, réunissant ainsi des groupes variés de chercheuses et chercheurs. La GDR soutient de tels efforts et facilite la collaboration. Enfin, quelques universitaires en fin de carrière veulent laisser à la postérité des produits fondés sur des données qui expliquent ces dernières au-delà de ce qui est inclus dans les métadonnées habituelles, comme pourquoi et comment une méthodologie ou une théorie en particulier a été choisie pour générer les données. Une pratique améliorée de GDR permet également aux chercheuses et chercheurs d’expérience de relier des données provenant d’études connexes, parfois à travers des décennies. Une meilleure gestion (particulièrement de la documentation) fait en sorte que l’utilisation future de telles données respecte ce qui se peut – et ne se peut pas – en matière d’analyse secondaire.

Reconnaître les moteurs de la GDR nous aide à comprendre pourquoi la gestion des données est importante et quels sont nos propres objectifs en matière de données. Si vous êtes chercheuse ou  chercheur, votre priorité est-elle simplement de satisfaire aux exigences de GDR de votre organisme de financement? Ou cherchez-vous également à définir un programme de recherche exhaustif au fil du temps? Si vous êtes bibliothécaire de données et aidez les chercheuses et chercheurs à préparer leurs données pour les verser dans un dépôt, que devez-vous savoir au sujet des différentes attentes disciplinaires en GDR? Quel est le niveau de service que vous voulez offrir? Plusieurs raisons motivent la GDR et plusieurs degrés de gestion sont possibles. Par conséquent, il est essentiel que la stratégie de GDR et la finalité d’un projet précis soient harmonisées avec des facteurs contextuels plus vastes.

Qui est responsable?

La volonté d’adopter davantage des approches systématiques en GDR s’accompagne d’une interrogation sur la responsabilité des gens impliqués. Qui organise les données? Comment? Qui décide des normes de métadonnées à respecter? Qui choisit le dépôt? La liste des tâches et des décisions est longue. En principe, la chercheuse ou le chercheur ayant le plus d’ancienneté est responsable de gérer les données, nommément la chercheuse principale ou le chercheur principal. Dans la pratique, la personne responsable délègue régulièrement les travaux en lien avec la GDR (p. ex., la collecte de données, le nettoyage, l’organisation, l’archivage) à d’autres membres de son équipe, surtout aux chercheuses ou chercheurs au postdoctorat et les associées ou associés de recherche. C’est là que s’effectue la plus grande partie de la gestion des données.

La délégation de la responsabilité s’accompagne d’au moins deux complications. La première, c’est que les personnes les plus près des données et qui, souvent, les connaissent le mieux, sont employées en vertu de contrats à court terme. Lorsqu’elles passent à autre chose (comme c’est souvent le cas), leurs connaissances partent avec elles à moins que des mesures aient été prises pour documenter celles-ci le mieux possible. Malheureusement, ceci ne se produit pas toujours, ce qui a des répercussions sur la gestion efficace et uniforme des données pour la durée d’une étude. La deuxième, c’est que selon l’expérience et la formation des membres de l’équipe, il s’agit soit d’adeptes de la GDR qui requièrent peu de surveillance, soit de novices en matière de principes et de bonnes pratiques en GDR. Dans ce dernier cas, ces personnes auront besoin d’un suivi serré, d’une formation efficace et de soutien en gestion des données par des spécialistes ne faisant pas partie de l’équipe de recherche.

Sur la scène internationale, deux modèles sont apparus pour offrir des services de soutien en GDR : celui dirigé par les bibliothécaires puis celui mené par les chercheuses et chercheurs. Tous deux tentent d’améliorer les compétences des chercheuses et chercheurs à tous les paliers et à faciliter la gestion des données conformément aux attentes des organismes subventionnaires, aux exigences des périodiques,  et à l’évolution des pratiques spécifiques à chaque discipline. Ce qui distingue principalement les deux modèles? La personne qui offre son soutien.

L’approche de la GDR menée par les bibliothécaires est courante en Amérique du Nord. La responsabilité des services de GDR incombe alors aux bibliothèques universitaires où les bibliothécaires de données, entre autres spécialistes, aident à former et à soutenir les chercheuses et chercheurs dans la gestion de leurs données de recherche et participent à la stratégie de GDR à l’échelle de l’établissement.

L’approche de la GDR menée par les chercheuses et chercheurs est courante en Europe où les services de GDR sont affectés aux nouvelles divisions créées à cette fin au sein des universités. Ces bureaux se trouvent dans la bibliothèque universitaire, sans nécessairement en faire partie. Ceci signifie que les services de GDR sont mis sur pied et gérés indépendamment des services de la bibliothèque. Généralement, les travaux de soutien à la GDR sont assurés par la communauté étudiante des cycles supérieurs (avec un doctorat ou, à tout le moins, une maîtrise fondée sur la recherche).

Exercice : qui est embauché?

Ces deux modèles sont très bien illustrés par les offres d’emploi publiées. En règle générale, les postes en GDR en Amérique du Nord exigent des compétences distinctes de celles exigées en Europe. Les trois listes de diffusion ci-dessous comprennent régulièrement des postes connexes à la GDR. Envisagez de vous y abonner pour suivre les discussions qui s’y déroulent et comparer les emplois afin d’examiner les compétences exigées des candidats (elles sont également profitables si vous vous intéressez davantage à la GDR en général).

Liste de diffusion CANLIB-DATA (principalement en anglais) (Canada et États-Unis) : https://researchdata.library.ubc.ca/learn/canlib-data-listserv/

Liste de diffusion RESEARCH-DATAMAN (en anglais uniquement) (R.-U./UE) : https://www.jiscmail.ac.uk/cgi-bin/webadmin?A0=RESEARCH-DATAMAN

Liste de diffusion Forum-DataQc (en français) (Canada) : https://mailman.uquebec.ca/mailman/listinfo/forum-dataqc

Chaque modèle a ses forces et ses limites. Les bibliothécaires universitaires ont de l’expertise en gestion de l’information et, en Amérique du Nord, ont généralement une qualification commune (c’est-à-dire, diplôme de MLIS avec agrément d’ALA). Par conséquent, les bibliothécaires ont une base commune en ce qui a trait aux principes et aux pratiques de gestion de l’information. Si quelques bibliothécaires universitaires effectuent de la recherche ou détiennent un doctorat, leur rôle professionnel principal est de soutenir la recherche, ce qui signifie une expérience limitée dans la réalisation de projets de recherche de plus grande envergure ou dans la collecte et l’analyse de données complexes.

Les chercheuses et chercheurs développent une expertise en données en progressant vers l’obtention de leur doctorat. Tout au long de leur carrière, les personnes qui font de la recherche passent des années ancrées dans des cultures de recherche particulières, à travailler directement avec des données. Du même souffle, ces mêmes chercheuses et chercheurs ont probablement moins de compétences au chapitre des manières normalisées de gérer et d’organiser l’information et les données. Il n’est pas rare dans le milieu de la recherche que des systèmes singuliers qui fonctionnent parfaitement pour un individu ou une équipe soient créés.

Étude de cas : le programme en GDR à la TU Delft, aux Pays-Bas

TU Delft est la plus grande université technique aux Pays-Bas. Son programme en GDR compte parmi les plus avancés et les plus créatifs. Elle offre un contraste intéressant aux services élaborés par les universités canadiennes. Lancé en 2018, le programme de Delft repose sur deux principes centraux : 1) les chercheuses et chercheurs se trouvent au cœur de la science ouverte; 2) les personnes responsables de l’intendance des données peuvent avoir un rôle-conseil pour améliorer la culture et la pratique de GDR à l’échelle de l’établissement. D’entrée de jeu, le programme a pour objectif d’améliorer la culture de gestion des données et non sa conformité.

L’approche de Delft se distingue de plusieurs manières. D’abord, elle affecte une personne responsable de l’intendance des données à chaque faculté; la GDR est présente là où s’effectue la recherche plutôt que d’attendre que les chercheuses et chercheurs fassent appel à ses services. Ainsi, les personnes responsables de l’intendance de données sont en bonne posture pour évaluer ce qui se produit sur le terrain. Ensuite, en règle générale, ces gens ont un doctorat, ce qui sous-entend des compétences avancées en recherche et, souvent, de l’expérience en la matière. Enfin, le programme a été mis sur pied en tant qu’initiative d’apprentissage actif qui investit temps et énergie à analyser ses services et à rapporter ses principales conclusions dans des revues et lors de congrès.

Pour comprendre l’approche de Delft, visitez leur site Web (en anglais uniquement) et découvrez-en davantage sur le rôle de la personne responsable de l’intendance des données ainsi que sur les gens embauchés pour le jouer.

Plomp, E., Dintzner, N. J. R., Teperek, M. et Dunning, A. (2019). Cultural obstacles to research data management and sharing at TU Delft. Insights, 32(1). https://doi.org/10.1629/uksg.484

Les différents modèles et leur efficacité sont peu étudiés dans la littérature. C’est probablement le reflet d’une élaboration et d’une intégration des services de GDR encore en cours dans les structures et cultures universitaires. Cependant, les modèles indiquent que la GDR exige la participation de plusieurs groupes. Si la responsabilité ultime de la GDR repose sur les épaules des chercheuses principales ou chercheurs principaux, la gestion courante des données ainsi que la supervision et les services de soutien est l’affaire d’autres personnes. Il est important de souligner que les chercheuses et chercheurs, bibliothécaires et autres spécialistes des données apportent une expertise particulière et leurs perspectives quant à la manière dont les données peuvent être gérées et la forme que devrait prendre la GDR à l’avenir.

Où se trouve l’avant-garde?

Bien que la GDR soit un phénomène relativement récent, il est important de rappeler que la recherche et les données évoluent. De nouveaux sujets à découvrir et de nouvelles technologies de recherche ne cessent de voir le jour (p. ex., la crise des opioïdes, l’édition de gènes), tout comme les nouveaux types de données et les manières de les analyser (p. ex., les données des médias sociaux, l’analyse augmentée). De tels progrès permettent la réalisation de recherches qu’il aurait été impossible de mener il y a à peine quelques années. Si le rythme de ce changement varie au fil du temps et des domaines d’étude, il a une incidence sur la manière dont nous abordons la GDR, y compris les services de soutien disponibles et la manière dont ils sont offerts. Cette section met en évidence deux exemples de l’importance de réfléchir de manière critique à la pratique actuelle et de rester à l’affût des progrès réalisés ailleurs.

Le premier exemple porte sur l’utilisation fréquente en formation sur la GDR d’infographie du cycle de vie pour illustrer le processus de recherche et la gestion des données qu’elle contient (voir le chapitre 1). De telles images ont pour but de jeter une lumière sur les étapes standards en recherche, de la planification initiale à l’archivage et à la réutilisation des données. Les modèles de cycle de vie sont efficaces, car ils sont accessibles; toutefois, une telle représentation ne concorde pas toujours bien à la manière dont certaines formes de recherche se déroulent. Ceci peut mener à des compréhensions erronées du fonctionnement – réel ou potentiel – de la GDR. Par exemple, la plupart des données des sciences sociales sont recueillies de manière itérative, ce qui signifie que les chercheuses et chercheurs entreprennent une réflexion en temps réel et une modification méthodologique tout au long du processus de collecte de données. Par exemple, un sociologue peut ajouter de nouvelles questions ou de nouvelles personnes participantes peuvent se joindre à des groupes de discussion. De telles études ne se déroulent pas de la même manière que la recherche en laboratoire.

Malgré la circularité de l’image, les modèles de cycle de vie sont bizarrement linéaires et supposent un processus du début à la fin qui ne se superpose pas bien à certaines méthodologies. De tels modèles ne mettent pas en évidence l’importance des relations dans la collecte des données entre des études connexes ou sur des périodes données (p. ex., en recherche longitudinale). Ils peinent à représenter comment les données historiques sont utilisées de plus en plus pour générer de nouvelles données par le biais d’analyses secondaires et de liens entre les données; le résultat ainsi obtenu accroît la capacité d’effectuer davantage de recherche. Le défi en matière de pratique et de prestation de service en GDR consiste à suivre l’évolution des méthodes de recherche  et des types de données générées.

Exercice : évaluer le cycle de vie de la recherche

En 2018, Cox et Tam ont publié un article qui remet en question l’utilisation des modèles de cycle de vie pour représenter le processus de recherche. Ils ont opposé l’utilité de ces modèles à leur propension à simplifier à l’excès les activités concernées. Les auteurs ont interpellé les chercheuses et chercheurs de divers domaines à participer davantage à l’élaboration de tels modèles. Lisez leur publication et réfléchissez à la manière dont les prestataires de GDR (p. ex., les bibliothécaires qui offrent une formation en GDR) peuvent mieux représenter les complexités de la recherche et les intégrer à la gestion des données.

Cox, A. M. et Tam, W. W. T. (2018). A critical analysis of lifecycle models of the research process and research data management. Aslib Journal of Information Management, 70(2), 142-157. https://doi.org/10.1108/AJIM-11-2017-0251

Le deuxième exemple démontre la nécessité de garder un œil sur l’avant-garde en matière de GDR en ce qui a trait aux structures administratives et de gouvernance. Un refrain fréquemment entendu au chapitre du partage des données, surtout lorsqu’il est question des dépôts, dit que les données doivent être les plus ouvertes possibles, mais aussi limitées que nécessaires. Comment cela se traduit-il, concrètement? Habituellement, les approches actuelles comprennent un accès ouvert, l’imposition d’une période d’embargo (c’est-à-dire, l’accès est refusé pendant un certain temps), ou exigent peut-être une permission de la part de la chercheuse ou du chercheur d’origine. Quelles autres options sont possibles?

Dans certains domaines de recherche, des infrastructures ont été mises en place pour examiner les utilisations suggérées des données avant de publier ces dernières. De tels systèmes de gouvernance aident à veiller à la conformité aux restrictions éthiques d’origines, empêchent d’endommager la propriété intellectuelle de la chercheuse ou du chercheur original (ou de l’équipe de recherche originale) et préviennent les risques, comme la réidentification, pour les personnes qui ont participé à l’étude (Murtagh et al., 2018). La révision accrue des données peut également aider les gens hors de la sphère de la recherche à accéder aux données (p. ex., les journalistes, les groupes politiques, les citoyennes et citoyens scientifiques) tout en faisant en sorte que le travail de la chercheuse ou du chercheur ne soit pas discrédité, intentionnellement ou non (Murtagh et al., 2018).

Les comités d’accès aux données (CAD) représentent une forme de gouvernance. Présents surtout en Europe et aux États-Unis, il s’agit d’organismes décisionnaires indépendants ayant pour but de superviser l’accès aux jeux de données à des fins de recherche, un peu comme un comité d’éthique, mais à la conclusion de la recherche. Ils réglementent l’accès aux données déjà recueillies. Les CAD sont plus présents dans des domaines comme la recherche biomédicale humaine où la combinaison de données permet une analyse plus poussée d’un plus grand nombre d’échantillons. Par exemple, une équipe peut souhaiter regrouper les données provenant de plusieurs biobanques internationales afin d’étudier le lien entre un variant génomique et un état de santé en particulier. Parce que de telles données sont grandement confidentielles, il y a très peu de chances qu’elles soient un jour accessibles librement. Certains CAD ont recours à des outils de prise de décision par ordinateur pour prendre des décisions en fonction du niveau de risque; d’autres s’en remettent aux examens de spécialistes dans le domaine. Des comités composés de personnes sont généralement préférés lorsqu’il s’agit de recherches d’avant-garde, où les données sont utilisées de manières novatrices, ou lorsque le domaine d’étude est particulièrement sensible.

Étude de cas : METADAC

De 2015 à 2020, j’ai fait partie d’une équipe qui a réalisé une ethnographie de METADAC (Managing Ethico-social, Technical and Administrative issues in Data ACcess), un comité sur l’accès aux données au Royaume-Uni. Ce comité a supervisé l’accès à des données génomiques et biosociales détenues par plusieurs études de cohortes longitudinales. Les membres du comité ont examiné les demandes de chercheuses et chercheurs de partout dans le monde qui suggéraient une recherche complexe sur le plan sociotechnologique et avant-gardiste sur le plan technologique (p. ex., relier des profils génétiques à des modes de scrutin). METADAC a cessé ses activités en décembre 2020 à la suite de changements à sa structure de financement; toutefois, son site Web est encore accessible pour y obtenir des détails au sujet de sa structure et des projets qu’il a approuvés (https://www.metadac.ac.uk).

Murtagh, M. J., Blell, M. T., Butters, O. W., Cowley, L., Dove, E. S., Goodman, A., Griggs, R. L., Hall, A., Hallowell, N., Kumari, M., Mangino, M., Maughan, B., Mills, M. C., Minion, J. T., Murphy, T., Prior, G., Suderman, M., Ring, S. M., Rogers, N. T., … Burton, P. R. (2018). Better governance, better access: practising responsible data sharing in the METADAC governance infrastructure. Human Genomics, 12(1), 1-12. https://doi.org/10.1186/s40246-018-0154-6

Il est important d’être au courant de travaux importants, comme celui de Cox et Tam, ou de nouvelles infrastructures d’accès aux données, comme METADAC, car une telle connaissance aide à orienter la manière dont les données sont gérées et comment les services de soutien à la GDR sont organisés. L’objectif de la GDR évoluera à mesure que la gestion des données se développera pour englober davantage de disciplines et de types de données et en même temps que la nature de la recherche et des données évoluera. Votre travail dans ce domaine doit être dirigé par les pratiques exemplaires actuelles et une nécessité de s’adapter au changement et de rester au fait des progrès réalisés ailleurs.

Les réalités en matière de gestion des données de recherche

Même lorsque des processus bien systématisés sont en place, la gestion des données ne deviendra jamais un exercice qui consiste à cocher des cases d’une liste. Il faudra toujours prendre des décisions et il y aura toujours des données qui ne correspondent pas tout à fait à la pratique existante. Dans cette dernière section, nous étudions la réalité de la GDR sur la ligne de front  de la recherche. Comment les chercheuses et chercheurs (et les personnes qui les appuient) recueillent les données de recherche, y accèdent, les traitent, les organisent, les analysent et les archives de façon à satisfaire aux exigences des organismes subventionnaires et des établissements hôtes tout en s’inscrivant de manière pragmatique dans le travail de l’équipe de recherche?

Selon la complexité d’un projet, la gestion méthodique des données de recherche peut s’avérer accablante, désorganisée ou simplement négligée à une étape ou l’autre du processus. Les choses peuvent mal tourner qu’il s’agisse de planifier la GDR au début de l’étude, lors de la résolution de problèmes au milieu d’une étude, lorsque vous tentez de trouver un sens à des données existantes ou pendant que vous aidez d’autres personnes dans l’une ou l’autre de ces situations. En dépit des embûches, les données de recherche peuvent être gérées efficacement, même dans les situations les plus complexes, si vous faites preuve d’un esprit critique, que vous êtes conséquent, que vous documentez ce que vous faites et que vous recherchez les pratiques exemplaires ainsi que du soutien, le cas échéant.

Vous trouverez ci-après les grandes lignes de ce que vous devriez prendre en considération lorsque vous gérez activement des données de recherche sur le terrain. Elles ressemblent vaguement à un PGD, bien qu’elles aient été conçues du point de vue d’effectuer la GDR au lieu de la planifier. Si les PGD constituent des documents évolutifs, rien n’est plus immédiat pour les chercheuses et chercheurs que de devoir gérer des données en même temps qu’un certain nombre d’autres tâches urgentes. Le fait est que la GDR est casée dans un monde où le temps est déjà une denrée rare. Les idées formulées ici sont issues de ce que j’ai appris moi-même et de ce que des collègues ont appris au cours de leur carrière de chercheuse et chercheur et de gestionnaire de données pendant plus d’une décennie. Les sept éléments qui suivent mettent l’accent sur les chercheuses et chercheurs; toutefois, ils devraient être aussi utiles aux bibliothécaires de données et à d’autres spécialistes pour leur donner un meilleur aperçu de la GDR.

  1. La GDR repose autant sur la réflexion et la résolution de problèmes que sur l’action. La gestion des données est une activité à grande échelle. Elle ne porte pas uniquement sur les données et leur gestion. Il s’agit d’un élément (relativement nouveau) d’un processus de recherche plus large. Inversement, au moment d’entreprendre une recherche précise, il peut y avoir très peu d’informations sur la manière de gérer les données. Pour utiliser une analogie fondée sur la recherche, les logiciels d’analyse comme SPSS et NVivo simplifient le travail avec des données. En revanche, de tels programmes ne les analysent pas. C’est le travail de la chercheuse ou du chercheur. Si les approches en GDR peuvent guider la gestion des données, les chercheuses, les chercheurs et les personnes qui les soutiennent doivent réfléchir de manière critique aux données en question et à la manière de mettre en application les principes et pratiques de façon pragmatique (et souvent novatrice) qui améliorent les processus et les résultats de recherche. En d’autres termes, en situation de GDR, en plus d’agir, il faut s’accorder suffisamment d’espace pour réfléchir de manière critique.
  2. Rédigez un plan de gestion des données. Les PGD sont utiles, car ils forcent les chercheuses et chercheurs à réfléchir aux aspects essentiels de la manière dont les données seront gérées au cours de l’étude. Même si une demande de subvention n’exige pas la présence d’un PGD, pensez à en créer un. Lorsque vous avez terminé, demandez-vous ce qu’il comprend et ce qu’il ne comprend pas. Souvenez-vous que les PGD sont à la fois ambitieux et orientés vers un objectif : ils vous indiquent votre destination et la manière dont vous souhaitez y arriver. Ils ne prennent pas en considération les réalités de la gestion quotidienne des données de recherche, comme composer avec une personne dans l’équipe de recherche qui ne nomme pas les fichiers correctement ou éprouver de la difficulté à trouver un dépôt convenable. C’est alors que le point 1 ci-dessus entre en jeu.
  3. Réfléchissez à ce qui stimule vos efforts en GDR. De nos jours, la plupart d’entre nous qui participons à la recherche améliorons nos compétences en GDR, car nous croyons que nous devons le faire, surtout depuis que les organismes subventionnaires exigent de plus en plus une bonne gestion des données. Quels autres facteurs entrent en jeu dans votre projet? En tant que chercheuse ou chercheur en milieu de carrière, vous pourriez constater qu’une meilleure organisation de vos données peut avoir une incidence positive sur vos résultats de recherche ou sur votre capacité à collaborer avec d’autres personnes. En tant que membre de la communauté étudiante des cycles supérieurs, vous pourriez remarquer que la personne responsable de votre étude est nouvelle en GDR, elle aussi, ce qui vous permet d’étoffer vos compétences afin de jouer un rôle de premier plan dans ce domaine. Si vous entreprenez une analyse secondaire, vous pourriez devoir retourner vos données à la personne responsable de l’étude originale et devrez connaître quel niveau de gestion des données est attendu. Peu importe la situation, il est avantageux pour vous de définir pourquoi la GDR compte pour vous.
  4. À quoi ressemblerait le résultat idéal? Cette étape est importante pour toute personne qui travaille dans une discipline où il y a peu de lignes directrices ou de pratiques exemplaires bien définies en GDR. Prenez le temps de réfléchir à l’approche idéale relativement à la gestion et à l’archivage de vos données. Si vous êtes une chercheuse ou un chercheur en quête de données pour réaliser une analyse secondaire, à quoi ressemblerait le jeu de données idéal au chapitre de l’organisation, de la documentation, des métadonnées, des ententes d’accès, et ainsi de suite? Si une solution parfaite n’existe pas, il existe sûrement des exemples qui s’en approchent quelque part dans le monde. Réfléchissez de manière critique à l’endroit où vous pourriez les trouver et commencez à les chercher. Posez des questions jusqu’à ce que vous obteniez des réponses avec lesquelles vous pouvez travailler.
  5. Préparez-vous à aborder vos données et leur gestion de manière itérative. Les données de recherche ne sont presque jamais recueillies dans leur état définitif. Elles ont besoin d’être nettoyées, reformatées, anonymisées, agrégées, entre autres, avant d’atteindre un état convenable pour l’analyse et l’archivage. En tant que chercheuse ou chercheur, vous devez décider si toutes vos données ont une importance égale (pour le projet, pour la communauté de recherche). Il est essentiel que vous documentiez vos données et leur provenance, car ces détails offrent à d’autres personnes (les membres de l’équipe, les utilisatrices et utilisateurs secondaires) des renseignements importants, notamment sur l’analyse que les données peuvent ou ne peuvent pas supporter. De tels efforts évoluent au fil du temps : ce que vous croyez et faites au début de l’étude peut changer en cours de projet. La GDR est rarement une entreprise unique. Le simple protocole pour nommer les fichiers, à lui seul, peut ne plus fonctionner adéquatement à l’étape de l’analyse.
  6. Qui fait quoi? Une gestion des données efficaces, surtout lorsqu’il est question d’équipes de recherche, exige que les rôles et responsabilités soient définis et qu’ils soient continuellement examinés pour vérifier que ce qui est prévu correspond à ce qui se produit. Pour certains membres de l’équipe, voire l’ensemble des membres de l’équipe, il peut s’avérer nécessaire d’améliorer des compétences; par conséquent, évaluez la situation et déterminez les ressources externes en début de processus. Les réunions peuvent gruger un temps précieux, mais le fait de vous rencontrer régulièrement pour échanger de l’information au sujet de la GDR sur un projet vous permettra d’aborder les défis qui surviendront, à coup sûr, comme une postdoctorante ou un postdoctorant qui quitte le projet pour occuper un poste menant à la permanence. Comme toujours, faites en sorte que vous et votre équipe documentiez systématiquement vos efforts de GDR avec des ressources comme les pistes de vérification et les procédures opérationnelles standards.
  7. Convenez que tout ne se déroulera peut-être pas sans heurts; néanmoins, vous pourriez obtenir un résultat raisonnable. La GDR ressemble aux processus de recherche qu’elle soutient : en constante évolution et jamais parfaite. Faites de votre mieux et mettez vos apprentissages en application au fur et à mesure que vous allez les acquérir.

Conclusion

Ce manuel constitue un excellent point de départ quant aux enjeux principaux en gestion des données de recherche au Canada. Les divers chapitres présentent un large éventail de principes, de politiques, de stratégies et de pratiques très utiles que vous devriez connaître en tant que chercheuse ou chercheur, bibliothécaire universitaire ou spécialiste des données. Le principal point à retenir de ce chapitre est simple : la gestion des données requiert toujours de la réflexion et une ouverture pour les nouvelles idées et pratiques. Essentiellement, la GDR demeure la responsabilité des chercheuses et chercheurs qui travaillent en première ligne, dont la plupart sont encore novices, non pas tant en ce qui concerne la gestion des données de recherche que la gestion de ces données conformément aux nouvelles exigences externes. Malheureusement, de telles exigences ne se transposent pas facilement en pratique de recherche, ce qui crée plusieurs défis continus. Les bibliothécaires et d’autres spécialistes des données offrent un soutien précieux à ce travail, bien que leurs efforts doivent être évalués d’un point de vue critique alors que divers modèles de service émergent. La GDR n’est pas un élément unique ni une entreprise statique. L’apprentissage à partir de ce manuel est essentiel, mais il faut aussi garder une perspective critique et faire preuve de curiosité quant à la manière dont les choses peuvent être faites ailleurs.

Éléments clés à retenir

  • En plus de soutenir le partage et la réutilisation, la gestion efficace des données fait partie intégrante du processus de recherche; l’essentiel du travail de GDR se produit pendant le projet, plutôt qu’à la fin de celui-ci. La gestion cohérente des données est également importante entre des études interreliées, au fil du temps.
  • La responsabilité de la GDR risque d’incomber à plus d’une personne. Les membres de l’équipe de recherche assument divers domaines de responsabilité et peuvent avoir des points de vue divergents ainsi que des niveaux de compétences variées. Les tâches quotidiennes en matière de GDR sont souvent déléguées à des chercheuses ou chercheurs en début de carrière qui n’auront pas de liens avec les données à long terme.
  • Les approches actuelles et les pratiques exemplaires en GDR sont dynamiques. Préparez-vous à devoir vous adapter, à changer, à rester à l’affût de tendances émergentes et des autres façons de faire au chapitre de la résolution de problèmes.
  • Ne vous attendez pas à tout réussir, car la « bonne » façon de faire n’existe peut-être pas encore!

Lectures et ressources supplémentaires

Cheah, P. Y. et Piasecki, J. (2020). Data access committees. BMC Medical Ethics, 21(12), 1-8. https://doi.org/10.1186/s12910-020-0453-z

Kruse, F. et Thestrup, J. B. (2017). Research data management – A European perspective. De Gruyter Saur. https://www.degruyter.com/document/doi/10.1515/9783110365634

Pasek, J. E. (2017). Historical development and key issues of data management plan requirements for National Science Foundation grants: A review. Issues in Science and Technology Librarianship, 87https://doi.org/10.5062/F4QC01RP

Rice, R. et Southall, J. (2016). The data librarian’s handbook. Facet Publishing.

Thompson, K. et Kellam, L. M. (dir.). (2016). Introduction to databrarianship: The academic data librarian in theory and practice. Dans  L. M. Kellam et K. Thompson (dir.), Databrarianship: The academic data librarian in theory and practice. Association of College and Research Libraries. https://scholar.uwindsor.ca/cgi/viewcontent.cgi?article=1047&context=leddylibrarypub

Whyte, A. et Tedds, J. (2011). Making the case for research data management. Digital Curation Centre.

Bibliographie

Cox, A. M. et Tam, W. W. T. (2018). A critical analysis of lifecycle models of the research process and research data management. Aslib Journal of Information Management, 70(2), 142-157. https://doi.org/10.1108/AJIM-11-2017-0251

Murtagh, M. J., Blell, M. T., Butters, O. W., Cowley, L., Dove, E. S., Goodman, A., Griggs, R. L., Hall, A., Hallowell, N., Kumari, M., Mangino, M., Maughan, B., Mills, M. C., Minion, J. T., Murphy, T., Prior, G., Suderman, M., Ring, S. M., Rogers, N. T., … Burton, P. R. (2018). Better governance, better access: practising responsible data sharing in the METADAC governance infrastructure. Human Genomics, 12(1), 1-12. https://doi.org/10.1186/s40246-018-0154-6

Pinfield, S., Cox, A. M. et Smith, J. (2014). Research data management and libraries: Relationships, activities, drivers and influences. PLoS ONE, 9(12), e114734. https://doi.org/10.1371/journal.pone.0114734

Plomp, E., Dintzner, N. J. R.,. Teperek, M. et Dunning, A. (2019). Cultural obstacles to research data management and sharing at TU Delft. Insights, 32(1). https://doi.org/10.1629/uksg.484

 

definition

About the author

Joel T. Minion, PhD MLIS MA BA (spécialisé) est un chercheur qualitatif en santé, un bibliothécaire, un gestionnaire de données et un éducateur ayant de l’expérience en gestion de données de recherche (GDR) au Canada et en Europe. Il est actuellement chercheur scientifique au sein du programme Translating Research in Elder Care (TREC) de la Faculty of Nursing de l’Université de l’Alberta où il est responsable de la planification de l’héritage des données longitudinales du TREC. Joel était auparavant responsable de la recherche qualitative pour la Health Technology Assessment Unit de l’Université de Calgary au sein du O’Brien Institute for Public Health et avant cela, il était associé principal de recherche au centre de recherche PEALS (Policy, Ethics and Life Sciences) de l’Université Newcastle au Royaume-Uni. Il est titulaire d’un doctorat en informatique de la santé de l’Université de Sheffield et d’un diplôme MLIS de l’Université Western. Depuis 2010, Joel est activement impliqué dans la gestion des données de recherche qualitative et dans les efforts en cours pour les intégrer dans des cadres de GDR plus larges.

definition

Licence

identificateur d’objets numériques (DOI)

https://doi.org/10.5206/NXGP7548

Partagez ce livre