Publication et archivage de vos données

➔Modèle de flux de données : Partage et préservation

Question de la chercheuse ou du chercheur :

Estce que la curation et le partage des données correspondent à la même chose ? La curation des données m’aide-t-elle à publier des articles évalués par des pairs ou seulement des publications numériques comme des balados, des sites Web et des expositions en ligne ? Que sont les documents de données ?

? ? ? ! *

*Questions sur le modèle de flux de données qui contribuent à votre réflexion sur ces éléments complexes :

  • Quelles données doivent être préservées à long terme ?
  • Les données seront-elles publiées ou partagées avec des publics autres que la communauté de recherche partenariat ?
  • Les métadonnées seront-elles partagées ?

Si vous êtes rendu aussi loin dans le flux de gestion de la curation des données, la décision concernant ce qu’il faut partager ou archiver (préserver) devrait être plus claire. Comme point de départ, vous pouvez suivre le principe FAIR de la RÉUTILISATION. Si vous voulez que vos données soient réutilisables, il faut déterminer ce qui doit être partagé pour vous assurer que vos données peuvent être utilisées et comprises. Ensuite, il faut vous assurer que vous respectez également les sections sur le consentement et le droit d’auteur; ce qui doit être d’accès restreint et de quelle façon. Comme la curation des données est une entreprise qui nécessite beaucoup de ressources, une autre pratique exemplaire à suivre est de déterminer ce que vous pouvez rendre réutilisable de façon durable et éthique. Encore une fois, cela est propre au contexte de vos attributs de projet, de financement et d’ensemble de données. 

Les projets en sciences humaines numériques peuvent générer de nombreux types de publications sur de multiples plateformes médiatiques, y compris les publications traditionnelles (monographies, articles), le partage de données, la mobilisation du savoir au moyen de formats numériques non traditionnels, de documents de données et de pages Web. Ces actifs numériques peuvent également être archivés dans un dépôt avec les données à des fins de conservation à long terme. Mais ces produits peuvent aussi exister en deux versions différentes dans deux endroits différents. L’archivage des données n’est pas la même chose que la préservation d’autres produits de recherche numériques. En outre, la solution de stockage de travail (qui permet aux AR et aux chercheuses et chercheurs de travailler, de sauvegarder et de partager leurs données pendant la réalisation du projet) et la solution de préservation des données ont toutes deux des exigences différentes en matière de droits, de formats, de capacité, de protection et de durée de vie. Une solution doit être élaborée concurremment pour les deux. Enfin, dans le cadre de partenariats, le partage et la préservation doivent être planifiés de manière à reconnaître les contributions, à veiller au respect des licences ainsi qu’à l’exécution des accords de publication et de partage. Certains établissements et infrastructures peuvent déjà avoir mis en place des ententes d’utilisation qui traitent de la même façon tous les partenaires/propriétaires de recherche. 

Une « copie de diffusion » ou une « copie d’accès » d’une vidéo didactique d’un atelier peut être publiée sur un site Web et hébergée sur une plateforme commerciale telle que YouTube afin de rejoindre le plus grand nombre possible de personnes et de faciliter la diffusion en continu, mais cette approche ne garantit pas la conservation à long terme de la vidéo. Pour cela, vous pourriez archiver une copie de conservation dans un dépôt sous forme de « données ». À noter que dans les secteurs des sciences humaines numériques, le terme « dépôt » peut être utilisé comme terme métaphorique pour décrire une solution de gestion des actifs numériques conçue sur mesure et hébergée par le secteur privé sans plan de préservation à long terme. De même, vous pouvez toujours stocker des données, des travaux de recherche ou d’autres produits liés à des projets que vous ne voulez pas partager publiquement, mais que vous voulez conserver ou partager à court terme en utilisant un stockage caché. Toutefois, dans les réseaux de gestion des données de recherche un dépôt de données axé sur la préservation est une plateforme logicielle spécialisée conçue pour archiver les données aussi longtemps que l’infrastructure technologique est maintenue. Voici quelques exemples de dépôts de données susceptibles d’intéresser les spécialistes des humanités numériques; de nombreux partenariats de grande ampleur dans ce domaine sont de portée internationale et les options de dépôt sont donc mondiales : 

  • Zenodo (portée internationale) 
  • Borealis, le dépôt Dataverse canadien et DFDR (offert aux cheurcheuses et chercheurs qui travaillent au Canada ou à leurs partenaires internationaux; des équivalents existent dans d’autres contextes nationaux) 

Ces plateformes constituent une option qui vous permet à la fois de publier vos données aux fins de partage avec le public et d’archiver vos données sur une plateforme stable destinée à la préservation. Soumettez vos fichiers de données finaux à un dépôt qui attribue un identificateur permanent (p. ex., pointeurs ou identificateurs d’objet numérique [DOI]). Fournissez de bonnes métadonnées pour votre étude afin que d’autres puissent les trouver (la norme de métadonnées de votre discipline peut être utilisée, p.ex. Dublin Core, DDI, etc.). Encore une fois, vous voudrez peut-être consulter la bibliothèque et les archives de votre établissement qui peuvent offrir des services de préservation numérique aux chercheuses et chercheurs. 

Les documents de données constituent un type de plus en plus courant de documents de méthodologie computationnelle qui accompagnent un ensemble de données publiées. Par exemple, le Journal of Cultural Analytics (en anglais seulement) est une tribune évaluée par les pairs pour ce type de publication de données. Parmi les autres sites évalués par les pairs, on retrouve le Journal of Open Humanities Data. Non seulement il partage vos données tout en fournissant votre cadre théorique et critique pour la collecte et l’utilisation de vos données, mais il constitue également une précieuse ressource éducative pour les générations futures de chercheuses et chercheurs en sciences humaines numériques qui apprendront comment effectuer des calculs sur des ensembles de données soigneusement préparés et bien documentés. 

Licence

Symbole de Licence Creative Commons Attribution 4.0 International

Manuel d'introduction aux données : rendre publiques les données de recherche en sciences humaines numériques Droit d'auteur © 2022 par Felicity Tayler; Marjorie Mitchell; Chantal Ripp; et Pascale Dangoisse est sous licence Licence Creative Commons Attribution 4.0 International, sauf indication contraire.