Transformer la gestion des données en travaux scientifiques et créatifs

➔Modèle de flux de données : analyse critique

Questions de la chercheuse ou du chercheur :

Après avoir consacré de nombreuses années de travail à mon projet, comment puis-je m’assurer de retrouver tous les fichiers, images numérisées et autres éléments numériques dont j’ai besoin pour rédiger mes documents, faire des balados, des exposés de conférence, etc. ? Je veux partager des fichiers avec ma communauté et mes partenaires de recherche, mais je ne veux pas qu’ils soient rendus publics. Mes adjointes et adjoints de recherche ne travaillent plus au projet et je ne sais pas comment accéder aux dossiers auxquels ils ont travaillé.

? ? ? ! *

*Questions sur le modèle de flux de données qui contribuent à votre réflexion sur ces éléments complexes :

  • Quelle est l’utilisation prévue des données par l’équipe de recherche – les collaboratrices et collaborateurs de partenariats pluri-institutionnels ontils besoin d’avoir accès aux fichiers?
  • Le stockage des fichiers assure-t-il un équilibre entre la sécurité et le partage de fichiers entre collaboratrices et collaborateurs? 

Une fois que vous aurez recueilli et traité les données, vous devez veiller à ce que les organisations et les personnes appropriées aient facilement accès à tout ce qui vous permettra d’exécuter vos travaux scientifiques et créatifs. Les différents membres de votre équipe de recherche ou partenaires doivent avoir accès à divers fichiers, et ce ne sont pas tous les membres de l’équipe qui accèdent aux fichiers à la même fin ou à partir du même endroit. Pour nombre de chercheuses et chercheurs des humanités numériques qui travaillent en équipe, la phase d’« analyse critique » repose sur des fichiers bien organisés et accessibles. Les données doivent être préparées, décrites et rendues accessibles pour que les théories, les histoires, les récits, les discours ou les dialectiques puissent être glanés. 

Avant d’envisager une solution technique particulière pour le partage des fichiers, vous devez avoir une stratégie de gestion des fichiers distincte du système qui comprend : 

1) Avoir des conventions de nommage de fichiers et de répertoires afin que les fichiers individuels puissent être repérés même s’ils sont retirés de leur contexte d’origine;

2) S’assurer que les références aux fichiers de données/métadonnées sont valides; 

3) Consigner les conventions dans un fichier README (oui, encore le fichier README!) afin que les collaboratrices et collaborateurs futurs du projet puissent apprendre le plan de gestion des dossiers et faire la mise à jour de la documentation à mesure qu’évolue la portée.

Prenez également en considération les différences entre les données de recherche partagées par votre équipe et les processus pour la durée du projet, par rapport au format des données que vous partagez au moment de la publication et de la conservation. Ces différences peuvent inclure diverses restrictions en matière de licence et de réutilisation, mais aussi des questions pratiques comme la taille des données, le format et les exigences en matière de bande passante. Vous devez stocker en toute sécurité, assurer le contrôle des versions et sauvegardez les fichiers, tout en ayant un système qui permet un accès restreint pendant que les AR et les chercheuses et chercheurs travaillent avec ces fichiers. De plus, la confidentialité et le droit d’auteur peuvent restreindre l’accès aux fichiers de différentes façons. Vous devez également examiner les diverses pratiques de partage entre les partenaires ou les établissements : si les données se trouvent dans un établissement dans un projet pluriinstitutionnel, y a-t-il des problèmes d’accès pour les membres de l’équipe qui ne sont pas installés dans ces établissements? Vous devrez peut-être collaborer avec des équipes de soutien des TI dans différents endroits – cela prend du temps et de la planification! 

Pour établir votre plan de recherche global, prenez le temps de faire une pause et de déterminer si les solutions de gestion et de partage des données que vous avez élaborées au début du projet correspondent toujours à la portée, aux enjeux et aux sources qu’englobe votre projet de recherche en évolution. Il se peut que vous ayez maintenant beaucoup plus de fichiers (ou des fichiers beaucoup plus volumineux) à gérer; votre convention de nommage des fichiers originale est peutêtre fondée sur l’hypothèse que les objets provenaient d’un établissement. Or, vous intégrez maintenant des éléments provenant d’autres établissements et vous devez faire un suivi explicite de ces diverses sources. Au départ, vous avez uniquement travaillé avec des collaboratrices et collaborateurs de votre établissement et vous voulez maintenant faire appel à des collaboratrices et collaborateurs externes, etc. 

Comment gérerez-vous l’intégration des nouvelles et nouveaux AR à votre projet de recherche? Et toutes les autres nouvelles personnes participantes? Prenez le temps de donner une orientation à votre groupe de recherche et d’établir un ensemble commun de « lignes directrices » ou de « règles » sur ce qui est acceptable et ce qui ne l’est pas, et aux questions courantes et aux « pires scénarios ». Par exemple, que se passe-t-il si une ou un AR estime qu’il est correct de copier des fichiers de recherche sur son ordinateur portable personnel? Est-ce une pratique acceptable? Avec qui ces personnes peuvent-elles partager ces fichiers? Ou pas? L’énoncé explicite des attentes permet à l’ensemble des membres de l’équipe d’en avoir une compréhension commune. Parfois, la façon la plus pratique de procéder est d’avoir un cahier de projet (reliure souple ou rigide) créé par la ou le chef de projet et propre à chaque flux de travail dans lequel tous les protocoles de projet et les pratiques exemplaires sont consignés. 

Remarque: Dans le cadre de projets en sciences humaines numériques, les AR ont des occasions uniques d’acquérir des compétences techniques et des connaissances en saisie de métadonnées. Ce sont d’excellents ensembles de compétences à acquérir pour l’obtention d’un diplôme. En outre, il est probable qu’un bon pourcentage d’AR combleront des besoins en main-d’œuvre d’un projet en sciences humaines numériques. Il importe de considérer que ces membres du personnel contribuent de façon significative aux travaux scientifiques dans les publications futures, même si leur contrat est échu. Nous vous recommandons d’utiliser un protocole comme la Credit Taxonomy (en anglais seulement) ou la Student Collaborator’s Bill of Rights (en anglais seulement) pour tenir compte du travail des étudiantes et étudiants qui ont participé à titre de coauteures et coauteurs ou dans un autre rôle pertinent; l’acquisition anonyme de compétences ne suffit pas pour les aider à bâtir leur carrière universitaire.

L’université Concordia a demandé à Compute Canada de se joindre à SpokenWeb à titre de partenaire institutionnel; dans ce rôle, ce service national d’infrastructure de données fournit un espace de stockage infonuagique et des services de base à tous les partenaires de SpokenWeb qui choisissent de ne pas utiliser les options d’infrastructure locale. D’autres partenaires de SpokenWeb, comme l’UBCO, ont choisi d’utiliser leur propre infrastructure locale de stockage infonuagique fournie par l’établissement, mais versent des métadonnées au catalogue partagé, SWALLOW. 

Le « dépôt » de SpokenWeb contient actuellement des fichiers de Concordia, de l’université Simon Fraser et de l’université de l’Alberta. Chaque niveau de la structure de fichiers est contrôlé par les mots de passe et les permissions des utilisatrices et utilisateurs. Si des membres veulent effectuer une recherche dans les fonds détenus par d’autres établissements, ils effectuent une recherche dans les métadonnées décrivant les fichiers se trouvant dans SWALLOW. 

Licence

Symbole de Licence Creative Commons Attribution 4.0 International

Manuel d'introduction aux données : rendre publiques les données de recherche en sciences humaines numériques Copyright © 2022 by Felicity Tayler; Marjorie Mitchell; Chantal Ripp; et Pascale Dangoisse is licensed under a Licence Creative Commons Attribution 4.0 International, except where otherwise noted.