"

Point de départ en gestion des données de recherche

2 Les principes FAIR et la gestion des données de recherche

Minglu Wang et Dany Savard

Objectifs d’apprentissage

À la fin de ce chapitre, vous pourrez :

  1. Expliquer l’historique des principes FAIR.
  2. Comprendre les principales significations et exigences, en plus des mécanismes qui sous-tendent les principes FAIR.
  3. Connaître les outils et les cadres disponibles pour améliorer la conformité des données aux principes FAIR.
  4. Comprendre la façon dont les principes FAIR sont inclus et cités dans les politiques de recherche et de disponibilité des données.
  5. Évaluer comment les dépôts de données soutiennent les principes FAIR.
  6. Trouver les communautés ou les initiatives qui utilisent les principes FAIR dans leur écosystème de gestion des données de recherche.

Introduction

L’écosystème de données actuel est complexe et en pleine croissance. Les principes FAIR (Facile à trouver, Accessible, Interopérable, Réutilisable) sont des principes directeurs qui encouragent les personnes qui s’occupent de l’intendance des données à améliorer la repérabilité et la réutilisation des données de recherche par les systèmes informatiques. Dans ce chapitre, nous explorerons l’étendue des principes et des outils utilisés pour évaluer et améliorer la conformité aux principes FAIR d’un jeu de données. Nous discuterons également de l’impact de ces principes et nous examinerons de quelle façon ils ont été adoptés.

Un petit historique des principes FAIR

Pourquoi avons-nous besoin de principes directeurs pour les données de recherche?

La nécessité d’établir des exigences pour la gestion des données de recherche (GDR) a d’abord été proposée par quelques organismes nationaux de financement de la recherche en Europe, en raison de l’essor de la science fondée sur l’utilisation intensive de données. Depuis, les exigences en matière de plans de gestion des données, de citations de données et de disponibilité des données sont toutes devenues essentielles à la conduite responsable de la recherche et elles ont introduit de nouvelles conditions auxquelles doivent adhérer les chercheuses et chercheurs qui souhaitent publier ou recevoir du financement public (Hrynaszkiewicz et al., 2020). Les personnes qui s’occupent de l’intendance des données ont aidé les chercheuses et chercheurs à répondre aux exigences associées à la GDR en encourageant la préservation des données, en fournissant des formations sur la préparation des données et en développant des infrastructures pour le stockage sécuritaire des données. Alors que les progrès dans les infrastructures technologiques ont rendu possible l’analyse computationnelle d’importantes quantités de données, l’augmentation correspondante du nombre de dépôts de données et de normes créées pour diffuser les données dans différentes disciplines et différents secteurs a contribué à la création de silos. Cette situation empêche le regroupement des données en vue de produire des recherches utiles. Conséquemment, l’élaboration de principes plus larges pour encadrer le partage responsable de données est devenue de plus en plus nécessaire pour les différents membres de la communauté élargie de données de recherche.

Les origines des principes directeurs FAIR

C’est en 2014, lors d’une « non-conférence » tenue aux Pays-Bas intitulée Jointly Designing a Data FAIRport que les principes fondamentaux pour les données de recherche interopérables ont été abordés pour la première fois (Data FAIRport, 2014). L’année suivante, une ébauche de guide a été rédigée et publiée par le FAIR Data Publishing Group de la coalition FORCE11 afin de recevoir des commentaires et l’approbation de la communauté. (FORCE11, 2014a). En 2016, Barend Mons avec un groupe de contributrices et contributeurs a rédigé un article dans Scientific Data pour discuter de la nécessité d’établir des principes directeurs FAIR pour les actifs numériques (Wilkinson et al., 2016). Ces principes sont conçus pour aider les humains et les machines à surmonter les obstacles liés à la découvrabilité, l’accessibilité, la réutilisation et la citation des données de recherche.

Depuis cette première publication, une version des principes FAIR a été mise à jour par GO FAIR (en anglais uniquement). Avec le temps, ces principes ont influencé non seulement les chercheuses et chercheurs qui souhaitent préparer leurs données au partage, mais aussi les dépôts de données qui souhaitent évaluer et améliorer leur infrastructure, en plus d’autres parties prenantes qui souhaitent évaluer et améliorer leurs politiques pour soutenir un écosystème de données FAIR.

Que sont les principes directeurs FAIR?

Les principes directeurs FAIR

L’objectif premier de ces principes est d’assurer que les machines et les humains peuvent facilement trouver, accéder, interopérer avec et réutiliser de façon appropriée la grande quantité d’informations disponibles à des fins scientifiques. Ils se veulent des principes de haut niveau et indépendants du domaine, ce qui veut dire qu’ils ont une large portée et peuvent être appliqués à différents types de données à travers une multitude de disciplines. En évitant l’attribution de spécifications techniques, les principes directeurs FAIR permettent différentes mises en œuvre pour les normes et caractéristiques de gestion des données qu’ils proposent.

Les principes FAIR énumérés ci-dessous ne sont qu’un aperçu de la liste plus complète des principes et sous-catégories, disponible ici (en anglais uniquement) : https://www.go-fair.org/fair-principles/:

 

Faciles à trouver

Les humains et les systèmes informatiques doivent pouvoir trouver les données et les métadonnées. Les métadonnées lisibles par machine sont essentielles à la découverte automatique de jeux de données et de services.

F1. Les (méta)données sont assorties d’un identifiant unique pérenne à l’échelle internationale (IUP).

F2. Les données sont décrites au moyen de métadonnées riches (tel que défini par R1 ci-dessous).

F3. Les métadonnées incluent clairement et de façon explicite l’identifiant des données qu’elles décrivent.

F4. Les (méta)données sont enregistrées et indexées dans une ressource recherchable.

 

Accessibles

Une fois que la personne utilisatrice a trouvé les données, elle doit savoir comment y accéder, ce qui peut nécessiter des détails relatifs à l’authentification ou l’autorisation.

A1. Les (méta)données sont récupérables par leur identifiant au moyen d’un protocole de communication normalisé.

        A1.1 Le protocole est ouvert, gratuit et il est possible de l’implémenter de manière universelle.

        A1.2 Le protocole permet une procédure d’authentification et d’autorisation lorsque requis.

A2. Les métadonnées sont accessibles, même quand les données ne le sont plus.

 

Interopérables

Les données ont généralement besoin d’être intégrées à d’autres données et doivent interopérer avec des applications ou des processus de travail pour permettre l’analyse, le stockage et le traitement.

I1. Les (méta)données utilisent un langage formel, accessible, partagé et applicable globalement à des fins de représentation de la connaissance.

I2. Les (méta)données utilisent des vocabulaires qui adhèrent aux principes FAIR.

I3. Les (méta)données comprennent des références qualifiées aux autres (méta)données.

 

Réutilisables

L’objectif principal de FAIR est de maximiser la réutilisation des données, donc les données et métadonnées doivent être bien décrites pour qu’elles puissent être reproduites et/ou combinées dans différents contextes.

R1. Les (méta)données ont une pluralité d’attributs précis et pertinents.

        R1.1. Les (méta)données sont diffusées selon une licence d’utilisation claire et accessible.

        R1.2. Les (méta)données sont associées à une provenance détaillée.

        R1.3. Les (méta)données se conforment aux normes de leurs communautés respectives.

 

Dans le chapitre 10, « Soutenir la recherche reproductible avec la curation active de données, » vous en saurez plus sur les mesures à appliquer pour rendre les données interopérables et réutilisables dans le cadre de la curation active des données.

Les mécanismes clés des principes directeurs FAIR: les métadonnées, les identifiants pérennes et les licences

L’utilisation appropriée des métadonnées (des informations sur les données) est fondamentale aux principes FAIR. Au même titre que le matériel de recherche traditionnel (comme les livres et articles avec des informations bibliographiques), les données de recherche doivent être décrites de façon structurée en utilisant des vocabulaires contrôlés qui peuvent être lisibles pour les humains et les machines, permettant ainsi aux données d’être repérées et réutilisées. Ainsi, les métadonnées représentent une partie intégrante des données de recherche parce qu’elles fournissent aux utilisatrices et utilisateurs d’importantes informations au sujet d’un jeu de données telles que sa documentation, ses identifiants, ses licences et autres éléments applicables. Les métadonnées qui décrivent les données de recherche originales devraient être riches et assez précises pour permettre aux humains et aux machines de comprendre le contexte et les limites d’un jeu de données, mais elles devraient aussi être offertes par le biais de descriptions normalisées pour que l’interprétation des données de recherche puisse se faire à travers différents domaines. Pour réussir cet équilibre, des chercheuses et chercheurs d’une variété de disciplines ont adopté des normes bien élaborées pour les métadonnées, telles que celles énumérées par le Research Data Alliance (RDA) (en anglais uniquement).

Les autres mécanismes qui garantissent la repérabilité et la réutilisation des données sont les identifiants uniques pérennes (IUP ou Persistent IDentifier, PID) et les licences qui encadrent la façon dont les données peuvent être utilisées. Un IUP enregistré fournit à chaque jeu de données et ses métadonnées un moyen d’identification stable et unique qui permet de suivre tout changement ou mouvement en ligne. Les chercheuses et chercheurs qui partagent des données sur leur propre site Web ne peuvent généralement pas attribuer de tels identifiants et sont plutôt encouragés à déposer leurs données dans des dépôts de données pour avoir accès à du soutien en matière d’utilisation d’identifiants uniques pérennes, dont les identifiants numériques d’objets (DOI) (p. ex., https://doi.org/10.1000/182).

Plusieurs chercheuses et chercheurs s’inquiètent que leurs données soient mal utilisées et hésitent à les partager (Wiley et al., 2019, p.5). Les personnes qui utilisent des données, quant à elles, n’arrivent souvent pas à réutiliser et repartager en toute confiance les données secondaires issues d’un jeu de données de recherche original en raison d’un manque de clarté lié aux permissions de réutilisation des données. Pour remédier à ce problème, des licences de données standard, telles que les licences Creative Commons, les licences Open Data Commons, ou des ententes personnalisées d’utilisation des données peuvent encourager la réutilisation des données tout en protégeant les droits des gens qui les ont créées en matière de crédit et d’attribution. La licence fournit des informations sur l’utilisation légale et éthique des données permettant ainsi de définir les modalités de la relation entre les personnes qui créent, éditent et utilisent un même jeu de données. Vous en saurez davantage sur les licences dans le chapitre 12, « Planification de la gestion des données pour les processus de travail en science ouverte. »

Les principes FAIR et l’ouverture des données

Les efforts mis en place pour rendre les données FAIR n’impliquent pas forcément le partage ouvert et sans restriction des données. Par exemple, les jeux de données peuvent comporter des identifiants pérennes et des métadonnées FAIR sans qu’ils puissent être réutilisés en raison des conditions de leur licence. Le Fair Principles Working Detailed Document propose quatre niveaux de conformité aux principes FAIR pour des jeux de données à l’intérieur d’un dépôt de données. Ces niveaux décrivent les différents degrés potentiels d’accès aux données :

  1. Chaque jeu de données comporte un identifiant unique pérenne et offre des métadonnées FAIR.
  2. Chaque jeu de données comporte des métadonnées définies pour les gens qui utilisent les données afin de fournir des informations riches sur la provenance.
  3. Les éléments de données à l’intérieur des jeux de données sont FAIR mais ne sont pas en libre accès et comportent des restrictions précises en matière de réutilisation.
  4. Les jeux de données et éléments de données sont FAIR, ouverts au public et comportent des licences bien définies (FORCE11, 2014b).

Les principes directeurs FAIR permettent aux responsables de l’intendance des données de participer aux importantes décisions en matière de publication et offrent la possibilité de recourir à d’autres principes. Par exemple, les principes CARE (avantages Collectifs, Autorité pour contrôler, Responsabilité et Éthique) pour la gouvernance des données autochtones, publiés en 2019 par la Global Indigenous Data Alliance, reconnaissent l’importance de la souveraineté des données autochtones et de centraliser les droits et intérêts des peuples autochtones dans le traitement des données autochtones. À plusieurs égards, les principes CARE et FAIR se complètent et incitent les chercheuses et chercheurs à tenir compte de la variété des personnes participantes et des objectifs associés aux données de recherche. La souveraineté des données autochtones est abordée plus en détail dans le chapitre 3.

Comment rendre vos données FAIR: outils et conseils

Les principes directeurs FAIR et les plans de gestion des données

Certaines opportunités de financement exigent la rédaction de plans de gestion des données (PGD), conformément à la Politique des trois organismes sur la gestion des données de recherche (Gouvernement du Canada, 2021). Dans ces PGD, les chercheuses et chercheurs doivent décrire leurs méthodologies et stratégies en tenant compte des principes directeurs FAIR. Par exemple, les chercheuses et chercheurs devraient documenter les données de façon efficace dès les premières étapes d’un projet pour que des métadonnées complètes et de grande qualité puissent être générées pour la diffusion. En outre, pour déposer et préserver leurs données dans des dépôts qui adhèrent aux principes directeurs FAIR, les chercheuses et chercheurs devraient négocier des licences pour le partage de données avec les différentes parties prenantes et obtenir tôt dans le processus de collecte la permission des personnes qui participent à la recherche de partager les données.

Des outils destinés à la communauté de recherche pour évaluer et améliorer la conformité aux principes FAIR

Une variété d’outils a été développée pour aider les chercheuses et chercheurs à comprendre les principes FAIR et à mettre en œuvre des pratiques qui s’alignent sur ces principes. Ces outils vont  de simples listes de contrôle à des ressources personnalisées conçues en fonction des pratiques des chercheuses et chercheurs. Vous trouverez ci-dessous une liste d’outils d’évaluation disponibles ou en développement dotés de différentes caractéristiques selon qui les utilise. Nous recommandons d’utiliser ces outils lorsque vous préparez vos données pour les rendre FAIR.

  1. La liste de contrôle How FAIR Are Your Data? (Jones et Grootveld, 2017)

Développée par un réseau de service de données européen, il s’agit simplement d’une liste d’une page basée sur les principes directeurs FAIR avec de légères modifications qui rendent les concepts et la terminologie plus faciles d’accès pour les chercheuses et chercheurs. Cette liste de contrôle constitue un bon outil d’initiation pour les chercheuses et chercheurs qui travaillent depuis peu dans le domaine de la GDR.

  1. Le FAIR Data Self Assessment Tool (Australian Research Data Commons, 2022)

Cet outil a été développé par le Australian Research Data Commons. En répondant à des questions associées aux principes directeurs FAIR, les chercheuses et chercheurs peuvent évaluer la conformité de leurs pratiques par rapport à chacun des sous-principes FAIR ainsi que de déterminer leur conformité dans le contexte plus large des quatre principes FAIR. L’outil permet de  comparer leurs méthodes de traitement des données avec les meilleures pratiques leur permettant ainsi d’identifier ce qui peut être amélioré.

  1. L’outil FAIR Aware (Data Archiving and Networked Services, 2021) traduit et rendu disponible en français par DoRANum

Élaboré par le Data Archiving and Networked Services des Pays-Bas, l’outil FAIR Aware permet une évaluation plus détaillée pour aider les chercheuses et chercheurs à comprendre et à mieux mettre en œuvre les principes FAIR. La chercheuse ou le chercheur doit identifier son domaine de recherche, son rôle et l’organisme associé, mais le contenu de l’outil d’évaluation est le même, peu importe qui l’utilise. Les chercheuses et chercheurs doivent répondre à 10 questions en lien avec chacun des principes directeurs FAIR puis évaluer leur volonté de se conformer aux pratiques recommandées. Une fois les réponses soumises, un rapport est fourni et celui-ci donne non seulement un aperçu du niveau de connaissance des principes FAIR de la chercheuse ou du chercheur, mais aussi des conseils et des ressources pour les aspects à améliorer.

  1. Le F-UJI Automated FAIR Data Assessment Tool (Devaraju et Huber, 2020)

L’outil F-UJI (FAIRsFAIR Research Data Object Assessment Service) est conçu pour évaluer la conformité aux principes FAIR des jeux de données de recherche à partir de paramètres mesurables complets et détaillés établis par le projet FAIRsFAIR (Devaraju et al., 2020).

Des conseils supplémentaires pour rendre vos données FAIR

Outre les outils d’évaluation, des services de données de recherche au niveau international et national ont élaboré des lignes directrices pour rendre les données FAIR, tant de façon générale que pour des disciplines particulières. En voici quelques  exemples :

  • OpenAIRE (un organisme qui soutient le développement de la science ouverte en Europe) a créé des guides pour les chercheuses et chercheurs, dont How to make your data FAIR (OpenAIRE, s.d.);
  • How to FAIR (Danish National Forum for Research Data Management, s.d.) élaboré par le biais d’entrevues avec un groupe composé d’une variété de chercheuses, chercheurs et de bibliothécaires;
  • Top 10 FAIR Data & Software Things  (Library Carpentry, s.d.) offre de petits guides autonomes sur une variété de sujets et de disciplines qui peuvent être utilisés par les membres de la communauté de recherche (p. ex., l’astronomie, l’imagerie médicale, la musique, etc.);
  • Sustainable and FAIR Data Sharing in the Humanities  (ALLEA, 2020) fournit des conseils pratiques pour les chercheuses et chercheurs qui souhaitent rendre plus FAIR leurs données numériques en sciences humaines.

Au Canada, les chercheuses et chercheurs de l’Institut de cardiologie de l’Université d’Ottawa et de l’Institut de recherche de l’Hôpital d’Ottawa ont développé une série de cours sur le traitement des données, dont FAIR Principles (Centre for Journalology, s.d.). Le contexte canadien n’offre pas beaucoup plus en matière de conseils sur les principes FAIR. Pour les chercheuses, chercheurs et bibliothécaires intéressés par ce domaine, il est possible de consulter le guide How to Be FAIR with Your Data : A Teaching and Training Handbook for Higher Education Institutions (Engelhardt et al., 2022) pour des exemples de formations en lien avec les principes FAIR offertes par différents établissements européens d’enseignement supérieur.

Les impacts politiques des principes FAIR

Les principes FAIR ont été utilisés par des agences gouvernementales, des établissements universitaires, des organismes de financement de la recherche, des sociétés savantes, des maisons d’édition et de nombreuses autres parties prenantes pour mettre en valeur l’importance de l’intendance des données de recherche tant au niveau culturel, économique et social. Conséquemment, les principes sont devenus fondamentaux pour les structures organisationnelles qui cherchent à influencer les chercheuses et chercheurs dans leurs méthodes de gestion et de partage des données. Certains exemples d’impacts politiques comprennent la Commission européenne qui cite les principes FAIR comme ayant directement influencé le développement du nuage européen pour la science ouverte (Hill, 2019, p. 284), en plus du National Institutes of Health des États-Unis qui cite l’application des principes FAIR pour les données dans leur Data Management and Sharing Policy (National Institutes of Health, 2020).

Au Canada, une des principales recommandations du gouvernement dans sa Feuille de route pour la science ouverte (Bureau du conseiller scientifique en chef du Canada, 2020) est à la mise en œuvre des principes FAIR pour les agences et départements fédéraux. Ce plan vise à assurer la mise en œuvre complète, à partir de janvier 2025, de l’interopérabilité des données scientifiques et de recherches ainsi que des normes de métadonnées de toutes les données liées aux agences et départements gouvernementaux. En matière de subventions de recherche, la Politique des trois organismes pour la gestion des données de recherche stipule que les trois agences fédérales de financement de la recherche du Canada – les Instituts de recherche en santé du Canada (IRSC), le Conseil de recherches en sciences naturelles et en génie du Canada (CRSNG) et le Conseil de recherches en sciences humaines du Canada (CRSH) – appuient les principes FAIR et s’attendent à ce que les chercheuses et chercheurs partagent leurs données conformément à ces principes et aux normes propres à leur discipline, sans enfreindre d’exigences éthique, culturelle, juridique ou commerciale (2021).  De plus, les maisons d’édition canadiennes de publications savantes, comme les Éditions Sciences Canada (s.d.), s’inspirent des efforts d’autres maisons d’édition spécialisées qui utilisent les principes FAIR pour circonscrire le contenu de leur politique d’accès aux données. La conformité à ces politiques peut impliquer l’utilisation d’outils pour les chercheuses et chercheurs – comme ceux énumérés plus tôt – afin d’assurer que les données soient aussi alignées que possible sur les principes FAIR avant d’être diffusées. Outre la préparation des données, ces exigences cherchent également à influencer l’opinion de la communauté de recherche quant au choix d’un dépôt de données de recherche et la façon dont ce choix pourra maintenir la conformité aux principes FAIR au-delà de la publication initiale des données.

Les principes FAIR et les dépôts

Les principes FAIR permettent de reconnaître la valeur actuelle et potentielle des dépôts de données. Wilkinson et al. (2016) font la promotion de cette idée en discutant des avantages et des limites des dépôts de données de recherche. Ils soutiennent aussi que les dépôts devraient évoluer en fonction des besoins des chercheuses et chercheurs au niveau de la découvrabilité et de la réutilisation (p. 2-4). La chercheuse ou le chercheur doit déterminer si un dépôt de données répond aux besoins spécifiques en GDR de sa discipline, si celui-ci lui permet de se conformer aux exigences éthiques et juridiques pertinentes et si les fonctionnalités offertes reflètent les principes FAIR.

Les dépôts de données de recherche sont des contenants de données spécialement conçus pour stocker des données de recherche, des fichiers associés et des métadonnées afin de permettre un accès stable et à long terme aux données (Boyd, 2021, p. 25-26). Les dépôts constituent des éléments cruciaux de l’infrastructure numérique; ils sont établis pour encourager la découvrabilité des données de recherche et pour aider les chercheuses et chercheurs à publier et à diffuser leurs données. Choisir un dépôt plutôt qu’un autre dépendra souvent de facteurs tels que les normes  disciplinaires, les exigences des maisons d’édition ou des organismes subventionnaires ou les lignes directrices en matière de partage des données. Le choix peut aussi se faire selon d’autres éléments comme la simplicité ou l’aspect pratique du processus de dépôt des données, le type de fichiers acceptés, le soutien offert pour la curation des données ou les schémas de métadonnées et les vocabulaires contrôlés que le dépôt utilise pour décrire les jeux de données de recherche qui sont stockés. La prise en compte de tous ces éléments incitera la chercheuse ou le chercheur à choisir soit un dépôt propre à sa discipline, soit à sa communauté ou un dépôt plus généraliste. La chercheuse ou le chercheur pourra ensuite déterminer si le dépôt de son choix met en pratique les principes FAIR en évaluant la présence ou l’absence de certaines fonctionnalités particulières.

Dans leur article sur l’amélioration de l’interopérabilité entre différents types de dépôts, Hahnel et Valen (2020) soutiennent que pour fonctionner conformément aux principes FAIR, un dépôt doit appliquer les directives suivantes  :

  • attribuer des identifiants uniques pérennes (DOI, ORCID et GRID) à ses données et au matériel connexe;
  • fournir avec ses données des interfaces de programmation d’applications (API) documentés;
  • soutenir des options robustes pour la curation des données et souscrire à des lignes directrices en matière d’accessibilité Web;
  • offrir des licences bien définies qui appuient la réutilisation des données;
  • décrire sa démarche vers la durabilité en documentant les processus de travail en matière de préservation et de reprise après sinistre (p. 195-197).

Ces conseils à propos des caractéristiques optimales pour les dépôts s’inspirent de recommandations semblables émises par OpenAIRE et par l’initiative FAIR Sharing (Cannon et al., 2021). Certains de ces éléments se retrouvent également dans les principes TRUST pour les dépôts numériques, publiés par Lin et al. (2020).

Pour évaluer la façon dont certains dépôts de données importants au Canada et à l’international ont documenté leur engagement envers les principes FAIR, consultez les exemples suivants :

Il est aussi possible de trouver des dépôts appropriés en consultant le répertoire re3data, un outil multidisciplinaire qui liste plus de 2800 entrées de dépôts de données. Il est possible d’effectuer des recherches dans le répertoire re3data selon des critères particuliers tels que le type d’API et les normes de métadonnées. Un autre répertoire intéressant est celui de FAIRsharing, appuyé par le Research Data Alliance. Ce dernier fournit une plateforme multidisciplinaire où les chercheuses et chercheurs peuvent consulter les entrées pour trouver des dépôts, des normes de données et des politiques de données. Ces deux outils sont d’excellentes options pour trouver des dépôts en fonction des disciplines particulières.

Certains dépôts plus importants à vocation commerciale, communautaire ou éditoriale peuvent offrir des options plus flexibles et spécialisées qui s’alignent sur l’orientation FAIR. Toutefois, en choisissant un dépôt, il faut évaluer s’il permet d’adhérer à certaines normes disciplinaires, s’il donne accès au soutien nécessaire pour la conformité aux exigences éthiques ou juridiques et s’il aide à assumer certaines responsabilités envers des communautés qui ont des attentes en matière d’accès à leurs données. Le choix d’un dépôt plutôt qu’un autre devrait se faire en équilibrant la conformité aux principes FAIR contre ces autres exigences toutes aussi importantes.

Pour s’impliquer

Pour les personnes qui souhaitent appuyer la mise en œuvre plus large des principes FAIR, l’initiative GO FAIR rassemble des individus, des établissements et des organismes pour collaborer à l’élaboration de politiques, au développement de compétences et à l’élaboration de normes techniques et de technologies. Cette collaboration est réalisée par le biais des réseaux de mise en œuvre GO FAIR qui rassemblent des partenaires qui travaillent à soutenir la création de produits uniques. Pour en savoir plus sur les réseaux de mise en œuvre ou sur comment en faire partie, consultez https://www.go-fair.org/implementation-networks/ (en anglais uniquement).

Conclusion

Les principes FAIR ont clarifié les mesures à prendre pour réaliser certains objectifs du mouvement de GDR. Ces principes, combinés à d’autres principes directeurs, ont été adoptés par les organismes subventionnaires, les maisons d’édition et par une variété de communautés de recherche. Ils ont contribué à rassembler et à harmoniser les efforts pour soutenir l’accès et la réutilisation des données. Les chercheuses et chercheurs devraient continuer à suivre l’évolution des principes FAIR en ce qui a trait à leur influence non seulement sur l’écosystème des données de recherche au niveau national et international, mais aussi sur la réutilisation des données dans leur propre discipline.

Questions de réflexion

  1. Utilisez l’outil FAIR Aware pour évaluer vos connaissances et vos compétences pour rendre les données FAIR.
  2. En utilisant les principes FAIR comme référence, évaluez la conformité aux principes FAIR des jeux de données suivants et faites des suggestions pour améliorer leur conformité :
    1. Don Valley Historical Mapping Project: https://doi.org/10.5683/SP2/PONAP6
    2. Soil and Plant Phytoliths from the Acacia-Commiphora Mosaics at Olduvai Gorge (Tanzania): https://doi.org/10.20383/101.0122
    3. CLOUD: Canadian Longterm Outdoor UAV Dataset: https://www.dynsyslab.org/cloud-dataset

 

 

Éléments clés à retenir

  • Les principes directeurs FAIR représentent des objectifs de haut niveau qui orientent l’optimisation continue des données de recherche, des métadonnées et des environnements de publication des données pour faciliter l’accès et la réutilisation des données à travers différents domaines grâce aux identifiants uniques pérennes, aux métadonnées riches et normalisées ainsi qu’aux licences.
  • Les chercheuses et chercheurs peuvent suivre des orientations ou utiliser des outils pour en savoir plus sur les principes FAIR, pour évaluer leurs pratiques actuelles de GDR et pour planifier des stratégies pour rendre plus FAIR leurs données de recherche et leurs activités de publication.
  • Les principes FAIR ont influencé les politiques liées à la disponibilité des données tant au niveau des gouvernements, des organismes de financement en recherche et des maisons d’édition.
  • Les chercheuses et chercheurs peuvent rendre leur gestion des données et leurs activités de partage plus conformes aux principes FAIR en s’assurant de choisir des dépôts de données qui offrent des caractéristiques alignées sur ces principes.
  • Les registres des dépôts de données de recherche constituent des outils importants pour identifier les dépôts qui offrent des options conformes aux principes FAIR et aux normes de certaines disciplines ou autres exigences de nature juridique, éthique et/ou communautaire.

Lectures et ressources supplémentaires

Les principes FAIR et CARE

The Global Indigenous Data Alliance. (2019). CARE principles for Indigenous data governance. https://www.gida-global.org/care

GO FAIR. (s.d.). FAIR principles. https://www.go-fair.org/fair-principles/

Research Data Alliance. (s.d.). Metadata standards catalogue. https://rdamsc.bath.ac.uk/

Les principes et les dépôts FAIR

Le répertoire re3data. https://www.re3data.org

Le répertoire FAIRsharing. https://fairsharing.org/databases/

Pour s’impliquer

La mise en œuvre GO FAIR. https://www.go-fair.org/implementation-networks/

Bibliographie

ALLEA. (2020). Sustainable and FAIR data sharing in the humanities: Recommendations of the ALLEA working group e-humanities. Digial Repository of Ireland. https://doi.org/10.7486/DRI.TQ582C863

Australian Research Data Commons. (2022). FAIR data self assessment tool. https://ardc.edu.au/resources/aboutdata/fair-data/fair-self-assessment-tool/

Boyd, C. (2021). Understanding research data repositories as infrastructures. Proceedings of the Association for Information Science and Technology, 58(1), 25–35. https://doi.org/10.1002/pra2.433

Bureau du conseiller scientifique en chef du Canada. (2020). Feuille de route pour la science ouverte. Gouvernement du Canada. https://science.gc.ca/site/science/fr/bureau-conseillere-scientifique-chef/science-ouverte/feuille-route-pour-science-ouverte

Cannon, M., Graf, C., McNeice, K., Chan, W. M., Callaghan, S., Carnevale, I., Cranston, I., Edmunds, S. C., Everitt, N., Ganley, E., Hrynaszkiewicz, I., Khodiyar, V. K., Leary, A., Lemberger, T., MacCallum, C. J., Murray, H., Sharples, K., Soares E Silva, M., Wright, G., … (Moderator) Sansone, S-A. (2021). Repository features to help researchers: An invitation to a dialogue. Zenodo. https://doi.org/10.5281/zenodo.4683794

Centre for Journalology. (s.d.). FAIR principles. https://journalologytraining.ca/courses/fair-principles/

Danish National Forum for Research Data Management. (s.d.). How to FAIR. https://www.howtofair.dk/

Data Archiving and Networked Services. (2021). FAIR Aware. https://fairaware.dans.knaw.nl/

Data FAIRport. (2014). Data FAIRport conference: Jointly designing a data FAIRport. https://www.datafairport.org/component/content/article/8_news/9_item1/index.html

Devaraju, A. et Huber, R. (2020). F-UJI – An Automated FAIR Data Assessment Tool (v1.0.0). Zenodo. https://doi.org/10.5281/zenodo.4063720

Devaraju, A., Huber, R., Mokrane, M., Herterich, P., Cepinskas, L., de Vries, J., L’Hours, H., Davidson, J. et Angus W. (2020). FAIRsFAIR data object assessment metrics (0.5). Zenodo. https://doi.org/10.5281/zenodo.6461229

Éditions Science Canada (s.d.). Principes et politique relatifs à la disponibilité des données. https://cdnsciencepub.com/pb-assets/resources/csp/About_Data_Principles_and_Policy_F-1601768276523.pdf

Engelhardt, C., Biernacka, K., Coffey, A., Cornet, R., Danciu, A., Demchenko, Y., Downes, S., Erdmann, C., Garbuglia, F., Germer, K., Helbig, K., Hellström, M., Hettne, K., Hibbert, D., Jetten, M., Karimova, Y., Kryger Hansen, K., Kuusniemi, M. E., Letizia, V., McCutcheon, V., … Zhou, B. (2022). D7.4 How to be FAIR with your data. A teaching and training handbook for higher education institutions. Zenodo. https://doi.org/10.5281/ZENODO.5665492

FORCE11. (2014a, 1 septembre). FAIR data publishing group. Archived groups. https://force11.org/group/fair-data-publishing-group/

FORCE11. (2014b, 10 septembre). Guiding principles for findable, accessible, interoperable and re-usable data publishing version b1. 0. https://force11.org/info/guiding-principles-for-findable-accessible-interoperable-and-re-usable-data-publishing-version-b1-0/

Gouvernement du Canada. (2021). Politique des trois organismes sur la gestion des données de recherche. https://science.gc.ca/site/science/fr/financement-interorganismes-recherche/politiques-lignes-directrices/gestion-donnees-recherche/politique-trois-organismes-gestion-donnees-recherche

Hahnel, M. et Valen, D. (2020). How to (easily) extend the FAIRness of existing repositories. Data Intelligence, 2(1–2), 192–198. https://doi.org/10.1162/dint_a_00041

Hill, T. (2019). Turning FAIR into reality: Review. Learned Publishing, 32(3), 283–286. https://doi.org/10.1002/leap.1234

Hrynaszkiewicz, I., Simons, N., Hussain, A., Grant, R. et Goudie, S., 2020. Developing a research data policy framework for all journals and publishers. Data Science Journal, 19(1), 1-15. http://doi.org/10.5334/dsj-2020-005

Jones, S. et Grootveld, M. (2017). How FAIR are your data? Zenodo. https://doi.org/10.5281/ZENODO.1065990

Library Carpentry. (s.d.). Top 10 FAIR data & software things. Zenodo. https://doi.org/10.5281/zenodo.2555498

Lin, D., Crabtree, J., Dillo, I. Downs R. R., Edmunds R., Giaretta, D., De Giusti, M., L’Hours, H., Hugo, W., Jenkyns, R., Khodiyar, V., Martone, M. E., Mokrane, M., Navele, V., Petters, J., Sierman, B., Sokolova, D. V., Stockhause, M. et Westbrook, J.  (2020). The TRUST principles for digital repositories. Scientific Data, 7, 144. https://doi.org/10.1038/s41597-020-0486-7

National Institutes of Health. (2020). Final NIH policy for data management and sharing. https://grants.nih.gov/grants/guide/notice-files/NOT-OD-21-013.html

OpenAIRE. (s.d.). How to make your data FAIR. https://www.openaire.eu/how-to-make-your-data-fair

Wiley, C. A. et Burnette, M. H., (2019). Assessing data management support needs of bioengineering and biomedical research faculty. Journal of eScience Librarianship, 8(1), 1-19. https://doi.org/10.7191/jeslib.2019.1132

Wilkinson, M. D., Dumontier, M., Aalbersberg, Ij. J., Appleton, G., Axton, M., Baak, A., Blomberg, N., Boiten, J-W., da Silva Santos, L. B., Bourne, P. E., Bouwman, J., Brookes, A. J., Clark, T., Crosas, M., Dillo, I., Dumon, O., Edmunds, S., Evelo, C. T., Finkers, R., … Mons, B. (2016). The FAIR guiding principles for scientific data management and stewardship. Scientific Data, 3(1), 160018. https://doi.org/10.1038/sdata.2016.18

definition

À propos des auteurs

Minglu Wang est une bibliothécaire en gestion des données de recherche (GDR) à l’Université York. Elle a publié des articles de recherche, des chapitres de livre, des documents de travail et des communications lors de colloques au sujet des bibliothèques universitaires et des services de GDR. Mme Wang est une membre active de l’Association of College & Research Libraries (ACRL), une division de l’American Library Association. Pendant plusieurs années, elle a rédigé des articles et des livres blancs pour les publications Top Trends et Environmental Scan de l’ACRL. Elle fait partie du Groupe d’experts sur la recherche et l’intelligence de l’équipe de GDR de l’Alliance de recherche numérique du Canada. Elle a participé à la conception et à la rédaction du rapport sur le sondage sur les capacités en GDR des établissements canadiens. Courriel : mingluwa@yorku.ca  | ORCID : 0000-0002-0021-5605

definition

Dany Savard est bibliothécaire associé pour les collections et les services de recherche à la bibliothèque de l’Université de Toronto à Mississauga. Il a contribué à des articles de recherche sur les thèmes de la découverte des données de recherche et des dépôts de données. Il est membre du Groupe d’experts sur la découverte et les métadonnées du réseau d’expertes et experts de l’Alliance de recherche numérique du Canada et préside actuellement le groupe de travail sur le paysage des dépôts de données canadiens. Il est titulaire d’un MLIS de l’Université Western et d’une maîtrise en politique publique et en administration de l’Université métropolitaine de Toronto. Courriel : dany.savard@utoronto.ca | ORCID : 0000-0001-7472-7390

definition

Licence

Symbole de License Creative Commons Attribution - Pas d’utilisation commerciale 4.0 International

La gestion des données de recherche dans le contexte canadien Droit d'auteur © 2023 par Sous la direction de Kristi Thompson; Elizabeth Hill; Emily Carlisle-Johnston; Danielle Dennie; et Émilie Fortin est sous licence License Creative Commons Attribution - Pas d’utilisation commerciale 4.0 International, sauf indication contraire.

Identificateur d’objets numériques (DOI)

https://doi.org/10.5206/LOJM2483