Perspectives sur la gestion des données de recherche

17 Gestion des données de recherche et mouvement de la science ouverte: positions et enjeux

Cynthia Lisée et Édith Robert

Objectifs d’apprentissage

À la fin de ce chapitre, vous pourrez:

  • Connaître les écoles de pensée influençant les pratiques de science ouverte
  • Catégoriser les grands domaines d’activité de la science ouverte
  • Caractériser la présence de pratiques de gestion des données de recherche dans la science ouverte
  • Remettre en question le discours dominant sur la science ouverte

Évaluation préliminaire

Selon vous, quelle place la GDR occupe-t-elle dans les pratiques de science ouverte ?

Introduction 

Le mouvement international en faveur de l’ouverture de la science n’est pas étranger à l’intérêt accordé par nos décideuses et décideurs politiques aux pratiques de gestion des données de recherche (GDR) et participe à l’élaboration de nouvelles pratiques dans la conduite de la recherche. Cette effervescence autour des données de recherche invite tout un chacun à valoriser ses résultats de recherche. Il est de mise de clarifier la place de la GDR dans ce grand mouvement de la science ouverte et de soulever au passage quelques enjeux. À cette fin, en première partie nous résumerons les diverses écoles de pensée qui façonnent la science ouverte et mettrons en évidence les grands axes et principes d’élaboration de pratiques de science ouverte en signalant leur lien avec la GDR. La deuxième partie exposera quelques vertus qu’on attribue à la science ouverte tout en les liant auxdites écoles de pensée. Nous poursuivrons la contextualisation de la GDR. La dernière partie cherchera à dépasser le discours dominant résolument optimiste sur les bienfaits de la science ouverte. Nous proposons de faire deux petits pas de côté pour explorer un territoire de controverses : 1) ce que nous enseigne l’expérience historique du libre accès à la publication 2) ce que l’angle de la recherche qualitative révèle de la pertinence du discours positif sur le partage de données de recherche. Nous conclurons ce chapitre par une invitation aux praticiennes et praticiens de la GDR à considérer comment les composantes de ce chapitre viennent éclairer les pratiques professionnelles courantes et comment ces composantes peuvent offrir de nouvelles perspectives pour revisiter ces pratiques.

Positionnement de la GDR dans la science ouverte

À la suite d’une analyse conceptuelle sur un corpus de 75 études sélectionnées rigoureusement, Vicente-Saez et Martinez-Fuentes (2018, p. 434) proposent la définition suivante pour la science ouverte :

« La science ouverte est un savoir transparent et accessible qui est partagé et développé au travers des réseaux de collaboration[1] » [traduction].

La qualité de transparence fait référence à la façon de présenter les résultats de l’activité scientifique d’une manière qui favorise sa réutilisation et couvre toutes les phases d’un processus de recherche scientifique. C’est un peu comme si la production des connaissances devait être menée de façon à permettre sa vérification, sa reproductibilité et un contrôle qualité par les pairs.

Le caractère accessible des connaissances implique leur diffusion rapide auprès de tous les publics, gratuitement, normalement sur le Web. Les produits de connaissance concernés sont variés : articles, opinions scientifiques, données, communication dans les conférences, manuels, codes. Le caractère repérable de ces produits constitue également une facette qui caractérise l’accessibilité.

La notion de partage est à considérer sous l’éclairage de la transparence et de l’accès : le partage englobe tant les étapes intermédiaires de la recherche scientifique que l’étape de publication. L’accès et la transparence soutiennent le partage. Ainsi, l’accès concerne diverses modalités, comme les personnes qui auront accès aux contenus, selon quel modèle de sécurité, par consultation in situ ou transfert de fichiers, etc. La transparence est relative à la mise à la disposition du public approprié des contenus pour des fins de reddition de compte, de validation de la recherche (p. ex., publication du protocole de recherche) et de partage de connaissances (p. ex., prépublication, rapport d’évaluation).

Finalement, le caractère collaboratif de la science ouverte engage principalement le recours à des technologies pour faciliter la collaboration entre scientifiques, mais embrasse aussi le dialogue entre nations, disciplines et rôles.

Ces clarifications ayant été établies, nous retenons cette définition de la science ouverte comme socle commun pour comprendre comment la GDR s’inscrit dans la science ouverte.

Écoles de pensée de la science ouverte

Les pratiques de la science ouverte couvrent un large spectre de pratiques influencées par plusieurs écoles de pensée que Fecher et Friesike (2014) ont proposées pour comprendre les divers points de vue des parties prenantes : la communauté de recherche, les gens en politique, les organismes de financement, les éditeurs commerciaux, la population citoyenne. Bien que leur analyse de la documentation remonte déjà à une dizaine d’années, ce découpage est toujours d’actualité dans le domaine si l’on prend en considération les nombreuses citations dont elle fait encore l’objet. Ils résument ainsi les développements de la science ouverte en cinq écoles de pensée.

École publique

L’école publique milite pour que la science soit accessible aux citoyennes et citoyens et que les responsables de la recherche entretiennent une conversation, voire une collaboration, avec la population. L’interaction citoyenne est possible à deux niveaux : soit par la vulgarisation du produit final afin qu’il soit compréhensible par toutes et tous, soit en rendant le processus de recherche accessible en y intégrant la citoyenne et le citoyen.

École démocratique

L’école démocratique milite pour que les produits de la recherche comme les articles, les livres, les données de recherche, les codes logiciels soient accessibles librement et gratuitement par toutes et tous.

École pragmatique

L’école pragmatique veut que la science soit plus efficace et mise sur le développement du travail collaboratif.

École des infrastructures

L’école des infrastructures concentre ses efforts sur l’amélioration des technologies, si possible, non propriétaires, et de leur interopérabilité pour mieux soutenir la recherche. C’est l’idée que, grâce aux technologies, la science progressera différemment.

École des indicateurs

Finalement, les adeptes de l’école des indicateurs cherchent à évaluer l’impact de la recherche selon d’autres normes qui s’éloignent des dérives bibliométriques actuelles (Gingras, 2014) et en tenant compte du contexte numérique dans lequel s’insère la recherche.

Tableau 1. Exemple de pratiques de GDR selon les écoles de pensée.
École de pensée Exemples d’activité de GDR
École publique
  • Planification de la collecte de données par des citoyennes et citoyens. Consulter des cas de science citoyenne dans la plateforme Zooniverse;
  • Documentation du contexte de production des données pour permettre leur réutilisation, voire une documentation compréhensible pour des personnes utilisatrices provenant d’horizons plus variés que les chercheuses et chercheurs d’origine;
  • Visualisation des données ou infographie qui facilite la compréhension des résultats pour les personnes qui décident ou la population. Exemple : infographie (en anglais uniquement) d’une synthèse de connaissances sur le déclin en efficacité des vaccins contre la Covid (SPOR Evidence Alliance, 2021) [2].
École démocratique
  • Publication de données ouvertes par divers paliers de gouvernement; par extension, l’ouverture complète de certaines données de recherche pour permettre aux entreprises et aux citoyennes et citoyens de réaliser des innovations ou de mieux s’informer;
  • Politique des trois organismes sur la gestion des données de recherche qui encourage le dépôt des données de recherche dans le respect des principes FAIR. La composante « A » (accessible) est comprise selon un spectre d’ouverture : du plus ouvert (données ouvertes) à l’accès restreint et protégé (protocoles d’entente);
  • Intégration d’une déclaration d’accessibilité des données dans un article scientifique. Consultez, notamment, les modèles (en anglais uniquement) de Taylor & Francis.
École pragmatique
  • Vérification de la possibilité de réutiliser des données avant de décider d’en produire de nouvelles;
  • Reconnaissance des contributions se qualifiant pour l’auteurité sur un jeu de données et remerciement des personnes ayant contribuées qui ne se qualifient pas pour la propriété intellectuelle;
  • Dépôt des données de recherche ou publication de leurs métadonnées pour faire connaître l’existence de ces données et favoriser l’établissement de nouvelles collaborations.
École des infrastructures
École des indicateurs
  • Introduction de statistiques d’utilisation des jeux de données dans les plateformes;
  • Citations aux jeux de données.

Chaque école de pensée offre sa propre conjecture sur les développements de la science, ce qui mène à des travaux répondant à une variété d’objectifs. L’ensemble de ces travaux induisent des pratiques dans la conduite et l’administration de la recherche et forment ce que l’on appelle le mouvement de la science ouverte. La section suivante présente une catégorisation de ces différents travaux, ou domaines d’activités.

Domaines d’activités de la science ouverte

Le portail Foster Open Science est une plateforme d’apprentissage en ligne couvrant l’ensemble des thématiques relatives à la science ouverte. Il est destiné aux personnes qui souhaitent intégrer des pratiques de science ouverte à leurs processus de travail. Il est le fruit du projet européen Fostering the practical implementation of Open Science in Horizon 2020 and beyond financé par Horizon 2020 de 2017 à 2019. Dans sa section What is Open Science ? Introduction, on trouve une représentation des facettes d’activités de la science ouverte conçue par Gema Bueno de la Fuente (s.d.). La science ouverte dissémine ses principes d’ouverture, de transparence, de partage et de collaboration dans des domaines d’activités couvrant l’ensemble de la démarche de recherche, de sa conception à sa diffusion. Le tableau ci-dessous résume les faits saillants de ces facettes de la science ouverte auxquels nous ajoutons la facette « Protocole de recherche ouvert » au début de la phase de conception pour mieux rendre compte des développements récents. Pour chaque facette, nous proposons l’école de pensée qui semble davantage orienter ce domaine d’activité. Nous fournissons également quelques actions de GDR pour illustrer qu’elle est bien présente dans toutes les sphères de la science ouverte.

Tableau 2. Ubiquité des pratiques dans les domaines d’activités de la science ouverte
Phases de la recherche Domaine École de pensée Résumé Exemple d’action en GDR

Conception

 

 

Diffusion

Protocole ouvert Pragmatique Publication de la méthodologie avant de commencer la collecte de données dans un registre comme OSF Registries Transparence pour mieux contrôler la manipulation des données au sein d’une équipe
Journal de bord ouvert Pragmatique Gestion de tous les fichiers de données afin d’assurer la reproductibilité d’une démarche de recherche Facilite la gestion de l’accès sécuritaire aux données en phase active
Données ouvertes Démocratique Partage dans le respect des principes FAIR Choix d’un dépôt FAIR
Révision par les pairs ouverte Pragmatique On renonce complètement ou partiellement à l’anonymat des gens qui font l’évaluation et la rédaction Accessibilité de le jeu de données pour les personnes qui font la révision avec documentation adéquate
Libre accès à la publication Démocratique Accès immédiat, gratuit, et sans barrière technique avec attribution de licences d’utilisation Introduire dans la publication une déclaration d’accessibilité des données
Code source ouvert Infrastructure Les logiciels de recherche financés par les fonds publics de même que ceux utilitaires à la recherche doivent favoriser l’autonomie technologique de l’entreprise scientifique en utilisant et en produisant du code source ouvert Codes produits pour traiter et analyser les données devraient être inclus dans le partage des données
Réseaux sociaux universitaires Pragmatique Favorise le réseautage et la valorisation des résultats de la recherche Jeux de données publiés deviennent aussi des résultats de recherche à valoriser dans ses réseaux
Science citoyenne Publique Collaboration entre les responsables de la recherche et le public en faisant participer ces derniers, possiblement à toutes les étapes de la démarche de recherche Outre la formation des citoyennes et citoyens aux pratiques GDR, leur apport  devient en soi une nouvelle source de données à prendre en compte dans la gestion du projet
Ressources éducatives libres (REL) Publique L’accès ouvert aux connaissances scientifiques passe aussi par des pratiques éducatives qui offrent un contenu auquel tous ont accès Les données ouvertes deviennent une REL lorsqu’utilisées en contexte pédagogique (Atenas et Havemann, 2015)

Comme on le comprend désormais grâce aux chapitres précédents, les pratiques de GDR sont utiles tout au long des phases d’un projet de recherche. Il est intéressant de relever que les domaines d’activités spécifiques de la science ouverte sont tous interpellés également par des actions de GDR. Par ailleurs, on constate qu’aucune pratique en émergence n’est directement associée à l’école des indicateurs alors que la majorité d’entre elles sont plus fortement influencées par l’école pragmatique (quatre catégories sur neuf). Rappelons que l’école pragmatique vise essentiellement à rendre la science plus efficace, notamment en favorisant la collaboration.

Les vertus de la GDR en contexte

On prête aux pratiques de science ouverte de nombreuses vertus, notamment ce qu’illustre la Feuille de route pour la science ouverte du Canada. Le tableau ci-dessous accompagne d’une question quelques-uns des avantages des pratiques de science ouverte souvent mis de l’avant par les gens qui en font la promotion. Chaque question est une invitation à prendre le temps de réfléchir.

Tableau 3. Les vertus de la science ouverte remises en question par le prisme de la GDR.
L’ouverture de la science… École de pensée dominante Question sur le contexte de la GDR
Facilite la reddition de compte Pragmatique La gouvernance autour de la politique des trois organismes en gestion de données de recherche permet-elle les suivis nécessaires à cette reddition ?
Accroît la reproductibilité des résultats Pragmatique Comment se conçoit la reproductibilité des résultats dans le cas de la recherche qualitative ?
Augmente la confiance du public à l’égard de la science Publique Comment contribuer à la littératie en matière de données (data literacy) des citoyennes et citoyens ?
Réduit le dédoublement des efforts Pragmatique Comment valoriser la reproductibilité ?
Accélère l’innovation Pragmatique Quels types de données pour quels types d’innovation ?
Valorise la diversité des systèmes de connaissance Publique Comment concrètement prendre en compte les savoirs marginalisés (p. ex., principes PCAP®) ?
Crée des synergies internationales et nationales Pragmatique Comment maintenir les spécificités locales à travers le besoin d’harmonisation ?

Il faut éviter de voir dans les pratiques de science ouverte une panacée à des problématiques qui existent depuis toujours. Même si ces pratiques et les activités de GDR connexes participent à une certaine redéfinition des façons de faire et ouvrent la voie vers de nouvelles solutions, les réalités structurelles à la source de certains problèmes ne sont pas nécessairement prises en compte; par conséquent, ces derniers ne peuvent pas être réellement endigués. Voici quelques exemples de réflexion suscitée par les questions du tableau 3.

  1. Faciliter la reddition de compte : d’après la Feuille de route pour la science ouverte du Canada, « [le] libre accès aux résultats de la recherche scientifique permet une plus grande reddition de comptes aux contribuables et aux bailleurs de fonds de la recherche » (Bureau du conseiller scientifique en chef du Canada, 2020). En revanche, la reddition de compte nécessite une politique de GDR forte des paliers gouvernementaux, ce dont on peut douter étant donné le peu de suivi de demandes effectué dans le cas de la politique fédérale sur le libre accès (Paquet et al., 2022).
  2. Augmenter la confiance des citoyennes et citoyens en la science : cette confiance ne peut s’établir qu’en fournissant simplement plus de données (et plus d’articles). Il faut aussi travailler au rehaussement de la littératie de données (et informationnelle) de la population. Le risque de mettre en œuvre des pratiques de GDR en vase clos, sans arrimage avec les objectifs de science ouverte et des enjeux de littératie, est encore bien présent et pourrait nuire au potentiel d’amélioration de cette confiance.
  3. Accélérer l’innovation : la science ouverte prône une pratique du partage et de réutilisation des données qui peuvent soutenir l’innovation. Voilà une proposition louable, particulièrement si elle comprend l’innovation sociale qui répondrait, selon nous, aux plus grands besoins de la société, et qui bénéficierait de données probantes alimentant les décisionnaires. Cependant, il existe des défis méthodologiques et épistémologiques à la production des données probantes en sciences humaines et sociales ainsi que dans le développement d’infrastructures permettant leur exploitation par les gens qui prennent les décisions. Le Canada, ainsi qu’une douzaine d’autres pays, travaille à établir des mécanismes et des flux d’information qui rendraient accessibles les données probantes aux décideuses et décideurs (Commission mondiale sur les données probantes pour relever les défis sociétaux, 2023).

Au-delà du discours optimiste sur l’ouverture

Mirowski (2018) croit que la science ouverte prendrait ses racines dans le présent régime néolibéral de la science. Il postule que la reconfiguration de nos institutions et de la nature des connaissances est due aux impératifs du marché plutôt qu’à de réels nouveaux problèmes dans la conduite de la recherche. Pour celles et ceux qui sont moins familiers avec ce courant politique, nous vous suggérons l’article de McKeown (2022) qui énumère quelques caractéristiques de l’université néolibérale.

Dans cette section, nous proposons d’accepter d’un œil plus critique ces nouveaux développements en nous penchant sur deux situations. La première cherche à dégager un enseignement de l’évolution historique de la publication en libre accès; la deuxième, à relever des défis relatifs au partage de données en contexte de recherche qualitative, particulièrement s’il est compris selon des normes étrangères à ce type de recherche.

Ce que nous enseigne le libre accès à la publication

Les éditeurs commerciaux ont joué un rôle non négligeable dans l’évolution des pratiques de communication savante des dernières décennies. De fait, le contexte de la récente pandémie de Covid a permis de démontrer le rôle qu’ils pouvaient jouer dans l’accès libre à la connaissance. Au cours de l’année 2020, une impressionnante augmentation de l’accessibilité aux publications scientifiques sur les coronavirus a été rapportée comparativement aux deux décennies précédentes, et ce, grâce à la coopération des éditeurs commerciaux (Belli et al., 2020). Il reste toutefois à voir si cette ouverture se maintiendra, car cette forte croissance du libre accès a été de type bronze, c’est-à-dire qu’une bonne partie de ces articles n’ont pas de licence garantissant la pérennité de ce libre accès. L’accessibilité à ce matériel est encore dépendante de la bonne volonté des éditeurs commerciaux.

Tableau 4. Les types de libre accès.
Type de libre accès Définition Gratuit pour le lectorat Gratuit pour les autrices ou auteurs
Diamant Publication dans une revue dont le contenu est en libre accès immédiat selon divers modèles d’affaires. X X
Initiative de publication en libre accès immédiat contrôlée par les milieux universitaires et financée par des fonds publics, des dons. X X
Hybride Certains articles sont mis en libre accès sur paiement de frais de traitement d’article (FTA); d’autres exigent un abonnement. Les revues totalement financées par des FTA sont associées à la voie dorée. X Cela dépend si l’autrice ou l’auteur choisit de publier en accès libre en payant un FTA.
Bronze Article rendu librement accessible sur décision de la maison d’édition, mais sans licence pérennisant cette décision d’ouverture. X
(possiblement temporaire)
X
Voie verte Autoarchivage d’une des versions du manuscrit dans un dépôt. X X

Plusieurs organismes de financement se sont rassemblés pour exercer une pression dans le but d’inciter fortement les éditeurs commerciaux de revues à transitionner leur modèle d’affaires vers le libre accès. Lors de la 14e conférence de Berlin sur le libre accès, en 2018 (Max Planck Digital Library), des organisations de 37 pays réparties sur les 5 continents ont fait une déclaration commune de soutien au Plan S[3]. Il s’agit d’une stratégie soutenue par un consortium d’organismes de financement, cOAlition S, qui vise à faire du libre accès aux publications une réalité. Les Fonds de recherche du Québec (FRQ) est l’un des premiers organismes de financement nord-américains à avoir rejoint cOAlition S en 2021. Ce vaste mouvement évolutif dans l’écosystème de l’économie de l’information savante signifie qu’à terme, les bibliothèques ne géreront que très peu d’abonnements. Selon toute vraisemblance, ils seront remplacés par des ententes financières avec les éditeurs commerciaux, et ce, jusqu’à payer les frais de traitement d’articles des chercheuses et chercheurs provenant de leurs établissements respectifs.

Fort est de constater que les éditeurs commerciaux de revues savantes tirent encore largement leur épingle du jeu, car selon une étude de 2017 rapportée par Zhang et ses collègues (2022), les frais de traitement d’article évoluent plutôt à la hausse, davantage que l’indice des prix à la consommation. Un écho familier rappelant comment l’évolution des coûts d’abonnement avait pris à la gorge les bibliothèques universitaires partout dans le monde. Case départ : comme à l’époque où les fonds publics servaient à payer des abonnements dont le coût était devenu intenable pour les bibliothèques universitaires, ces fonds vont maintenant en large partie se retrouver dans les poches des éditeurs commerciaux qui contrôlent cette augmentation – au détriment de l’essor des modèles de type diamant. Ces derniers permettent « aux scientifiques de publier en accès ouvert et sans frais » (Institut Pasteur, 2021) et sont plus cohérents avec les principes de science ouverte, car les revues sont financées par des fonds publics, des fonds d’universités, ou par des fondations. Les modèles de type diamant sont aussi en parfaite harmonie avec les motivations initiales des premières initiatives de libre accès comme la Déclaration de Bethesda et la Déclaration de Berlin (site en anglais uniquement) en 2003 : redonner aux communautés de recherche le pouvoir sur la diffusion de leurs produits de connaissance.

De nombreuses parties prenantes participent à l’économie de l’information savante; certaines ont des intérêts corporatistes plus axés sur le profit que sur le soutien à la conduite même de la recherche. Si l’on considère l’état de balbutiement actuel du partage de données en tant qu’acte de communication savante, c’est-à-dire avec ses propres « coutumes » de publications, on peut se demander si des forces économiques similaires ne cherchent pas à en configurer les normes et usages et à en contrôler les infrastructures. L’expérience du libre accès aux publications renseignera-t-elle les nouvelles pratiques en matière de partage de données ?

L’angle de la recherche qualitative sur le partage des données

Les chercheuses et chercheurs œuvrant dans le domaine de la recherche qualitative s’interrogent sur l’impact de la science ouverte sur les conditions de production des savoirs dans leur discipline. Ce questionnement découle à la fois de la définition souvent attribuée aux données de recherche ainsi que par la tendance observée dans plusieurs pays de favoriser la libre circulation des données de recherche. Par exemple, les Principes et les lignes directrice de l’OCDE pour l’accès aux données de la recherche financée sur fonds publics indiquent que :

L’accès ouvert aux données de la recherche financée sur fonds publics et leur partage contribuent non seulement à maximiser l’impact des nouvelles technologies et des nouveaux réseaux numériques sur le potentiel de recherche, mais permettent aussi un retour plus important sur l’investissement public dans la recherche. (OCDE, 2007, p. 12)

Les organismes de financement qui encouragent le partage de données en ont souvent une définition sommaire. Les trois organismes subventionnaires définissent les données de recherche comme étant « des faits, des mesures, des enregistrements ou des observations recueillies par des chercheurs et d’autres personnes, assortis d’une interprétation minimale de leur contexte. » (Gouvernement du Canada, s.d.)

Nous présentons quelques explications quant à la manière dont la définition et le partage des données soulèvent des préoccupations.

Question du contexte et reproductibilité

Comme indiqué dans le tableau 3, une des vertus attribuées à l’ouverture de la science est qu’elle accroît la reproductibilité. Cependant, une des inquiétudes soulevées par de nombreuses parties prenantes du milieu de la recherche qualitative est l’importance du contexte avant de pouvoir envisager toute possibilité de reproductibilité des résultats d’un projet de recherche. Dans la perspective positiviste du secteur des sciences de la nature ou biomédicales, les données sont généralement considérées comme indépendantes du contexte, comme en fait foi la définition ci-dessus. En contrepartie, dans la recherche qualitative, qui utilise souvent une perspective constructiviste, le contexte est indissociable de la problématique de recherche (Hesse, 2019, p. 566). Ainsi, la question de la reproductibilité des résultats de la recherche ne se pose pas de la même façon qu’en sciences pures. Avec une telle toile de fond, comment des données issues de projets de recherche qualitatifs pourront-elles être partagées et réutilisées? Sera-t-il concrètement possible de tenir compte du contexte de production des données ?

Mythe de la donnée brute et de la donnée neutre

En contexte de recherche qualitative, il importe d’être conscient que les données partagées auront préalablement fait l’objet d’un travail d’interprétation. Un jeu de données, peu importe la discipline, est une construction qui ne peut s’abstraire des sujets humains qui la conçoivent. Avant d’être déposé dans une plateforme, le jeu de données a fait l’objet de délibérations, de négociations et de décisions d’inclusion et d’exclusion bien ancrées dans des discours dominants, dans des réalités historico-socioéconomiques. Par conséquent, il est impossible de prétendre à la neutralité des données partagées (Neff et al., 2017). La documentation des jeux de données révèle particulièrement toute son importance tout en laissant ouverte la question des connaissances tacites pouvant échapper à cet effort de documentation, connaissances précieuses pour bien comprendre un jeu de données. Dans cette perspective, le partage des données se présente comme un exercice éminemment complexe.

Type de recherche favorisé et hiérarchisation des méthodologies

Selon l’OCDE, pour qu’un jeu de données soit partageable, il doit correspondre à certains critères, dont celui d’être idéalement numériquement exploitable (OCDE, 2007). Ce caractère numérique des données peut tendre à une valorisation de l’utilisation du Big Data, puisque ces données massives, produites rapidement et dans divers formats, se multiplient et sont faciles d’accès. Cette valorisation de la recherche sur de gros corpus de données soulève le risque que les méthodologies qualitatives soient subordonnées aux méthodologies quantitatives. De plus, un glissement pourrait s’opérer pour que les techniques privilégiées par les analyses qualitatives servent uniquement à confirmer les résultats apportés par les méthodes quantitatives (Hesse et al.,  2019). Finalement, Hesse et al. rapporte aussi la crainte que les recherches utilisant de petits échantillons soient moins reconnues que celles qui utilisent de gros corpus (2019).

Conclusion : ouverture sur l’ouverture

Nous avons vu comment les activités de la GDR imprègnent les pratiques de science ouverte et avons abordé comment le discours dominant, enthousiaste et résolument optimiste sur l’adoption de ces propositions visant à ouvrir la science fait l’économie de la complexité du réel. L’espace accordé pour ce chapitre et l’objectif général de formation de ce manuel limitent le traitement approfondi des fondements idéologiques de cet appel à ouvrir la science. Il est toutefois intéressant de noter que les préoccupations suscitées par ces nouvelles pratiques ont donné naissance à un nouveau domaine d’étude, soit les études de données critiques (critical data studies). Ce domaine de recherche récent propose des pistes de solutions favorables à des pratiques de GDR prenant en compte des particularités disciplinaires. Plus particulièrement, puisque la conduite de la recherche qualitative commence à changer avant même que d’importants consensus disciplinaires n’aient émergé, nous sommes d’avis qu’éclairer la pratique professionnelle en GDR par ce courant des études de données critiques outillera ses praticiennes et praticiens à éviter d’acculturer ces communautés de recherche.

Une approche critique ou sociopolitique pour lire les développements de la science ouverte permettrait de faire plus facilement un pas de côté pour éclairer différemment le discours enthousiaste autour du mouvement de la science ouverte et de ses pratiques. Nous sommes ravies de conclure ce chapitre avec une invitation aux praticiennes et praticiens de la GDR à responsabiliser leurs pratiques professionnelles en creusant les discours, en écoutant les diverses voix qui s’expriment dans ce vaste mouvement de la science ouverte pour ainsi tenter d’élaborer des réponses potentielles aux questions suivantes : quel(s) systèmes économiques et politiques produisent les structures sociales, valeurs, normes, idéologies, biens et produits financiers? Pour qui? Avec quelle technologie? Pourquoi celle-là? Où se trouvent les infrastructures de science ouverte ? Dans les faits, qui bénéficie de l’ouverture de la science ?

Questions de réflexion

  1. Comparez la définition de la science ouverte du portail Foster Open Science avec celle proposée dans ce chapitre. Quelles différences et ressemblances pouvez-vous relever ? Définition de Foster Open Science :

    La science ouverte est la pratique de la science de manière à ce que d’autres puissent collaborer et contribuer, où les données de recherche, les notes de laboratoire et d’autres processus de recherche sont librement accessibles, dans des conditions qui permettent la réutilisation, la redistribution et la reproduction de la recherche et de ses données et méthodes sous-jacentes[4] [traduction].

  2. Par quelle(s) école(s) de pensée pensez-vous que la GDR est surtout traversée ?
  3. Vrai ou faux : Considérant comment s’est développé la publication en libre accès, il n’y a aucune raison de craindre que quelques entreprises avec des intérêts commerciaux bâtissent un oligopole sur des produits facilitant l’exploitation des données de recherche.
  4. Pourquoi la question de la reproductibilité des résultats de la recherche ne se pose pas de la même façon en recherche qualitative qu’en contexte de recherche en sciences pures ?
  5. Quel nouveau domaine de recherche vous permettrait de repérer des points de vue plus critiques sur les pratiques de GDR?

Voir le solutionnaire pour les réponses.

Éléments clés à retenir

  • Cinq écoles de pensée façonnent les pratiques de science ouverte : école publique, école démocratique, école pragmatique, école des infrastructures, école des indicateurs.
  • Les pratiques de science ouverte peuvent se catégoriser en neuf grands secteurs d’activités touchant l’ensemble des étapes d’un projet de recherche, de sa conception à sa diffusion : ouverture des protocoles de recherche, utilisation de journaux de bord électroniques, données ouvertes, ouverture du processus de révision par les pairs, libre accès à la publication, code source ouvert, réseaux sociaux scientifiques, science citoyenne et ressources éducatives libres.
  • Les fonds publics sont encore largement attribués aux éditeurs commerciaux dans la configuration du libre accès à la publication et la question demeure, à savoir si les infrastructures de science ouverte, actuelles et futures, pouvaient être soumises au même risque oligopolistique.
  • Les pratiques d’ouverture et de partage des données de recherche présentent des enjeux épistémologiques particuliers dans les domaines des sciences humaines et sociales et dans les méthodologies de recherche qualitative : la complexité de partager des données de recherche qualitative, la hiérarchisation des méthodologies de recherche, l’impossible neutralité des données.

Lectures et ressources supplémentaires

  • Portail Foster Open Science, une plateforme d’apprentissage en ligne couvrant l’ensemble des thématiques relatives à la science ouverte
  • Iwasiński, Łukasz. (2020). Theoretical Bases of Critical Data Studies. Teoretyczne podstawy critical data studies, 115A(1A), 96-109.

Bibliographie

Belli, S., Mugnaini, R., Baltà, J. et Abadal, E. (2020). Coronavirus mapping in scientific publications: When science advances rapidly and collectively, is access to this knowledge open to society? Scientometrics, 124(3), 2661-2685. https://doi.org/10.1007/s11192-020-03590-7

Bueno de la Fuente, G. (s.d.). What is Open Science? Introduction. Foster. https://web.archive.org/web/20181229190240/https:/www.fosteropenscience.eu/content/what-open-science-introduction

Bureau du conseiller scientifique en chef du Canada. (2020). Feuille de route pour la science ouverte. Gouvernement du Canada. https://science.gc.ca/site/science/fr/bureau-conseillere-scientifique-chef/science-ouverte/feuille-route-pour-science-ouverte

Coalition S. (s.d.) About Plan S. https://www.coalition-s.org/

Commission mondiale sur les données probantes pour relever les défis sociétaux (2023). Renforcer les systèmes nationaux d’appui aux preuves. https://www.mcmasterforum.org/networks/evidence-commission/domestic-evidence-support-systems

Fecher, B. et Friesike, S. (2014). Open Science: One Term, Five Schools of Thought. Dans Bartling S. et Friesike S. (dir.) Opening Science: The Evolving Guide on How the Internet is Changing Research, Collaboration and Scholarly Publishing (pp. 17-47). Springer. https://doi.org/10.1007/978-3-319-00026-8_2

Gingras, Y. (2014). Les dérives de l’évaluation de la recherche. Du bon usage de la bibliométrie. Raisons d’agir.

Gouvernement du Canada. (s.d.). Politique des trois organismes sur la gestion des données de recherche – Foire aux questions. https://science.gc.ca/site/science/fr/financement-interorganismes-recherche/politiques-lignes-directrices/gestion-donnees-recherche/politique-trois-organismes-gestion-donnees-recherche-foire-aux-questions#1a

Hesse, A., Glenna, L., Hinrichs, C., Chiles, R. et Sachs, C. (2019). Qualitative Research Ethics in the Big Data Era. American Behavioral Scientist, 63(5), 560–583. https://doi.org/10.1177/0002764218805806

Institut Pasteur. (2021, 23 avril). La voie diamant de l’Open Access. Open science: évolutions, enjeux et pratiques. https://openscience.pasteur.fr/2021/04/23/la-voie-diamant-de-lopen-access/

McKeown, M. (2022). The View from Below: How the Neoliberal Academy Is Shaping Contemporary Political Theory. Society, 59(2), 99-109. https://doi.org/10.1007/s12115-022-00705-z

Mirowski, P. (2018). The future(s) of open science. Social Studies of Science, 48(2), 171203. https://doi.org/10.1177/0306312718772086

Neff G., Tanweer A., Fiore-Gartland B. et Osburn L. (2017). Critique and Contribute: A Practice-Based Framework for Improving Critical Data Studies and Data Science. Big Data. 5(2), 85-97. https://doi.org/10.1089/big.2016.0050

OCDE – Organisation de coopération et de développement économique. (2007). Principes et lignes directrices pour l’accès aux données de la recherche financée sur fonds publics. https://www.oecd.org/fr/science/inno/38500823.pdf

Paquet, V., van Bellen, S. et Larivière, V. (2022). Measuring the prevalence of open access in Canada: A national comparison. The Canadian Journal of Information and Library Science / La Revue canadienne des sciences de l’information et de bibliothéconomie, 45(1), 1–21. https://doi.org/10.5206/cjilsrcsib.v45i1.14149

SPOR Evidence Alliance. (2021). Vaccine Effectiveness Over Time in Vaccinated Individuals: A Living Review. https://sporevidencealliance.ca/wp-content/uploads/2021/10/COVIDEND_MBMC_rapidreview_VE_infographic_final.pdf

Vicente-Saez, R. et Martinez-Fuentes, C. (2018). Open Science now: A systematic literature review for an integrated definition. Journal of business research, 88, 428-436. https://doi.org/10.1016/j.jbusres.2017.12.043

Zhang, L., Wei, Y., Huang, Y. et Sivertsen, G. (2022). Should open access lead to closed research? The trends towards paying to perform research. Scientometrics, 127, 7653–7679.  https://doi.org/10.1007/s11192-022-04407-5


  1. "Open Science is transparent and accessible knowledge that is shared and developed through collaborative networks"
  2. D'autres infographies sont offertes sur le site COVID-END, Scan Evidence Products, https://www.mcmasterforum.org/networks/covid-end/covid-end-evidence-syntheses/scan-evidence-products
  3. cOAlition S définit ainsi le Plan S : "le Plan S est une initiative lancée en septembre 2018 soutenant la publication en libre accès. Il repose sur cOAlition S, un consortium international d’organisations de financement de la recherche d’organisations de recherche. Le Plan S exige que les publications scientifiques qui résultent de recherches financées par des subventions publiques soient publiées en libre accès dans des revues ou sur des plateformes se conformant à certaines exigences" [traduction] (Coalition S, s.d.).
  4. "Open Science is the practice of science in such a way that others can collaborate and contribute, where research data, lab notes and other research processes are freely available, under terms that enable reuse, redistribution and reproduction of the research and its underlying data and methods." https://www.fosteropenscience.eu/foster-taxonomy/open-science-definition
definition

About the authors

Cynthia Lisée est impliquée dans le dossier GDR de l’Université du Québec à Montréal (UQAM)  depuis 2018 et elle agit à titre de bibliothécaire en soutien à la recherche depuis 2020. Elle participe ou a participé à divers groupes de travail GDR (Alliance de recherche numérique, Partenariat des bibliothèques universitaires du Québec et UQAM). À l’UQAM, elle fait notamment partie de l’équipe pilotant la mise en œuvre de la stratégie institutionnelle GDR. Le soutien aux revues savantes fait également partie de son portefeuille de dossiers. Elle détient un baccalauréat en physique et a exploré la géologie. Elle détient également d’autres diplômes universitaires et scolarité en sciences humaines et sociales, notamment la maîtrise en sciences de l’information de l’Université de Montréal. ORCID : 0000-0003-3883-3676

definition

Édith Robert est bibliothécaire à l’École des sciences de la gestion à l’Université du Québec à Montréal. Titulaire d’une maîtrise en sociologie, elle a travaillé de nombreuses années dans différents centres de recherche. Cumulant ses intérêts pour la profession de bibliothécaire universitaire avec les approches théoriques développées par la sociologie des sciences, elle s’intéresse aux enjeux de la communication savante et à la question des savoirs «marginalisés», dans le développement des collections. Elle est également membre du service conseil de l’ACFAS et enseigne au Collège Rosemont dans le programme Techniques de recherche et gestion de données.

definition

Licence

Symbole de License Creative Commons Attribution - Pas d’utilisation commerciale 4.0 International

La gestion des données de recherche dans le contexte canadien Droit d'auteur © 2023 par Cynthia Lisée et Édith Robert est sous licence License Creative Commons Attribution - Pas d’utilisation commerciale 4.0 International, sauf indication contraire.

identificateur d’objets numériques (DOI)

https://doi.org/10.5206/NOQD6943

Partagez ce livre