Types de données de recherche

16 Les données de recherche géospatiales au Canada: un survol des projets régionaux

Martin Chandler; Kara Handren; Stéfano Biondo; Amber Leahey; Sarah Rutley; et Rhys Stevens

Objectifs d’apprentissage

À la fin de ce chapitre, vous pourrez :

  • Comprendre l’état actuel de l’infrastructure et des services de données de recherche géospatiales à travers les différentes régions du Canada.
  • Expliquer quelques-unes des considérations uniques relatives à la gestion des données géospatiales.
  • Fournir des exemples et des modèles de gestion des données géospatiales.
  • Reconnaître l’avenir de la gestion des données de recherche géospatiales au Canada.

Introduction

Les bibliothèques au Canada offrent une variété de services pour la découverte, l’accès et la préservation des données de recherche géospatiales. Les infrastructures et services ont été développés au niveau régional, principalement par les établissements universitaires, pour soutenir la gestion des collections et des ressources de données géospatiales, créant ainsi une mosaïque de services de données de recherche à travers le pays. Ce chapitre fera un survol des approches et des principaux projets d’infrastructures dans la gestion des données de recherches géospatiales au Canada.

Les données spatiales/géospatiales (ci-après désignées « géospatiales ») n’ont pas toujours été perçues comme des données auxquelles une attention particulière doit être accordée du point de vue de la gestion des données de recherche (GDR). Toutefois, en raison des aspects uniques de leur création, utilisation et accès, les données géospatiales nécessitent des considérations particulières de gestion qui se distinguent des autres domaines de la GDR.

Règle générale, la curation des données géospatiales tombe sous la responsabilité des bibliothécaires ou gestionnaires de données géospatiales qui possèdent une expertise en la matière, puisque ces deux groupes sont mieux outillés pour répondre aux défis associés aux données géospatiales. Ce chapitre vise justement à préciser les défis qui sont propres à la GDR géospatiales; à énumérer les nombreux projets régionaux actuellement en cours ou en développement qui cherchent à répondre aux défis en matière de préservation et d’accès aux données de recherche géospatiales et à discuter des tendances futures pour la GDR géospatiales au Canada.

Les données géospatiales et les SIG

Que sont les données géospatiales? Et qu’est-ce qui distingue les données de recherche géospatiales des données de recherche dans leur ensemble? Toutes données relatives à des objets ou à des événements associés à un lieu sont des données géospatiales. Elles peuvent inclure des instances où le lieu est statique (dans un lieu défini sur une période donnée comme un immeuble ou un tremblement de terre) ou dynamique (qui manifeste un changement ou un mouvement sur une période donnée tel que la croissance urbaine ou les effets d’une sécheresse sur les nappes phréatiques environnantes). Les données géospatiales combinent des informations de localisation avec les caractéristiques d’un objet, d’un événement ou d’un concept (les données descriptives) et aussi parfois, mais pas toujours, avec des informations temporelles (Stock et Guesgen, 2016).

Les données géospatiales dépendent souvent de l’utilisation d’un système d’information géographique (SIG) tel que QGIS, ArcGIS ou Google Earth. Ce système offre de nombreux moyens et méthodes de développer, d’utiliser et d’exporter des données géospatiales, y compris la création et le partage de jeux de données. Les données de recherche géospatiales combinent ou relient des points de données spatiales (ou caractéristiques) avec d’autres données sources et variables pour faciliter l’utilisation des données. Ces variables peuvent souvent inclure des données de nature géographique telles que les données de recensement au niveau des secteurs de recensement ou des codes postaux.

Les considérations de GDR géospatiales dépendent beaucoup de l’exportation des données vers différents formats (l’interopérabilité des formats), de la possibilité d’afficher et de réutiliser les cartes statiques, de l’utilisation et de la réutilisation des données statistiques et géographiques, de la réutilisation d’applications de données interactives et de l’utilisation de fonctionnalités et de composantes cartographiques.

Étant donné la nature de la GDR géospatiales, de son utilisation dans les SIG et de la façon dont les données y sont traitées, une connaissance préalable de la gestion des données est souvent nécessaire. Une introduction à l’utilisation des données géospatiales est disponible dans le guide Learn QGIS de Anita Graser ou des ouvrages de Esri Press, Getting to know ArcGIS ou sa série GIS Tutorial for… Bien qu’il soit possible de créer des données dans un SIG, l’outil est plus souvent utilisé pour faire des liens entre des données géospatiales et d’autres types de données (p. ex., des données tabulaires avec des données géospatiales préexistantes).

D’autres chapitres de ce manuel abordent des sujets de GDR plus généraux, dont la gestion des fichiers. Avec les projets décrits ci-dessous, la création de données géospatiales et la gestion des données de recherche géospatiales sont mises de l’avant. Ce chapitre abordera principalement les différents projets régionaux qui ont été entrepris ou qui sont en cours dans les bibliothèques universitaires canadiennes pour gérer et préserver les données de recherche géospatiales au pays.Parmi ces projets, l’accent sera mis sur ceux qui visent à rendre les données de recherche géospatiales repérables, accessibles et réutilisables pour une grande variété de publics et de personnes susceptibles d’utiliser les données.

La gestion et la réutilisation des données de recherche géospatiales nécessitent une réflexion sur les espaces physiques à partir desquels les données ont été recueillies ou auxquels elles se rapportent. Il y a une tendance vers la découverte géospatiale qui intègre des cartes de base avec une recherche utilisant les mots-clés. Un affichage géographique et un aperçu des jeux de données sont souvent offerts (consultez, par exemple, Scholars GeoPortal de l’OCUL ou CarrefourGéo de l’Information sur les terres de l’Ontario). Les données sont ensuite affichées dans un format réduit directement sur la carte de base ou elles sont représentées par une étendue géographique (bounding box) qui illustre leur ampleur géographique. Il est important de noter que la gestion des données de recherche géospatiales nécessite une infrastructure robuste; il en sera question dans quelques-uns des projets régionaux décrits plus loin dans le chapitre. Puisque cette infrastructure est généralement plus coûteuse, la gestion de données géospatiales pour le stockage à long terme et la découverte implique souvent des projets consortiaux plutôt qu’individuels.

Les formes de données géospatiales

Bien que de nombreuses formes de données puissent comprendre des éléments géospatiaux (p. ex., une variable de ville, de division de recensement ou d’adresse), les données géospatiales peuvent aussi comprendre des formats distincts sous forme de données matricielles ou vectorielles. Les données matricielles (ou raster) sont des  matrices de cellules organisées en rangées et en colonnes, dont chaque cellule comporte une information et une représentation visuelle. Par exemple, une carte ou un dessin numérisé ainsi qu’une image satellite constituent des données matricielles (Esri, 2016).

Figure 1 - Carte numérisée du port de Louisbourg, en Nouvelle-Écosse, datant de 1764, illustrant l'utilisation de données matricielles dans les systèmes d'information géographique.
Figure 1. Données matricielles d’une carte numérisée : Bellin, 1764.

Les données vectorielles sont une représentation de caractéristiques ou de phénomènes réels dans un SIG avec des données sous-jacentes qui permettent de faire des liens entre la(les) caractéristique(s) et d’autres formes de données. Les données vectorielles peuvent être divisées en point, ligne ou polygone. Les points de données sont des endroits uniques dans l’espace (p. ex., l’emplacement d’un arbre); les lignes de données ou polylignes sont deux ou plusieurs de ces points, des sommets, dont le premier et le dernier ne sont pas égaux, montrant une ligne ou une série de lignes (p. ex., une route) et les données en polygone sont trois ou plus sommets dont le dernier est équivalent au premier, formant ainsi une figure fermée (p. ex., les frontières d’une propriété, d’une région ou d’une province) (QGIS Documentation, s.d.).

Figure 2 - Carte moderne de Louisbourg, Nouvelle-Écosse, illustrant les données vectorielles dans les systèmes d'information géographique.
Figure 2. Des données en polygone: Statistiques Canada (2019) et des personnes contribuant à OpenStreetMap (2023).

Les données géospatiales tabulaires existent souvent dans un tableau ou un format où les valeurs sont séparées par des virgules (CSV). Elles peuvent être aussi simples qu’une adresse ou le nom d’un lieu géographique (p. ex., Unama’ki) ou aussi complètes qu’un ensemble de points, d’étendues, d’identifiants spatiaux et de hiérarchies de noms ou d’identifiants géographiques.

Les données géospatiales comme interaction

Puisque les données géospatiales impliquent une représentation de l’espace, elles sont rarement créées en tant que jeu de données unique. Elles dépendent plutôt d’interactions avec d’autres jeux de données spatiales dont les données spatiales sous-jacentes qui servent à les localiser à l’intérieur d’un SIG et/ou qui impliquent le développement de données spatiales supplémentaires pour commencer, faire avancer ou conclure une analyse des données en question. La GDR peut nécessiter une planification des interactions avec des données abstraites. Mais la GDR géospatiales nécessite une attention particulière à la planification des interactions entre les données aussi bien abstraites que physiques, aux différents modes et méthodes nécessaires à ces interactions et à la façon dont le logiciel d’analyse traitera ces interactions. L’utilisation d’un SIG implique en soi une planification soigneuse de la gestion des données puisque le logiciel monte les données à partir d’un endroit numérique plutôt que de les copier dans le logiciel. En faisant la sauvegarde d’un projet dans un SIG, l’emplacement des données est sauvegardé. Ainsi, le déplacement d’un jeu de données peut rendre le projet intraitable à moins que la personne responsable corrige l’emplacement du jeu de données.

Il est important de préciser que la création de données géospatiales est aussi bien une fin en soi qu’un développement vers d’autres fins, dont l’analyse, la visualisation ou l’analyse préalable avant la conception d’un projet. Les données géospatiales peuvent être créées en guise de résultats de recherche ou comme appui pour la préparation, l’analyse ou la visualisation d’une autre source de données. Elles représentent donc une fin et un intermédiaire. Autrement dit, elles servent comme résultat de recherche (comme peut l’être tout autre jeu de données), comme outil d’analyse (avec SPSS, NVivo, Voyant, etc.) et comme outil de présentation des données (avec Tableau, ggplot, etc.). De plus, tandis qu’un jeu de données numériques peut se présenter comme un fichier unique à utiliser, le jeu de données géospatiales nécessite des données géospatiales d’appui, des projections de cartes (p. ex., la variété de moyens utilisés pour représenter un globe tridimensionnel dans une représentation en deux dimensions) et des systèmes de référence des coordonnées (p. ex., les différents systèmes qui déterminent où et comment un jeu de données géospatiales doit être affiché sur une carte).

Les données en tant qu’objet ou en tant que processus

Enfin, en raison de la nature interconnectée et interactive des données géospatiales en recherche, il faut  tenir compte de la GDR géospatiales aussi bien en matière de données produites par la recherche qu’en termes de données utilisées au cours du processus de recherche. Par exemple, une chercheuse peut avoir besoin d’une partie de fichier des limites de recensement de Statistiques Canada. Dans son analyse, elle pourrait alors extraire une partie du fichier des limites. Ce faisant, ces données constituent un produit de recherche au même titre que l’extraction des données de recensement constituerait des données de recherche. L’extrait du fichier des limites peut alors représenter une étape préalable à l’analyse et peut être modifié en utilisant différents systèmes de référence des coordonnées et/ou différentes projections (p. ex., une projection conforme de Lambert modifiée en une projection Web Mercator).  La frontière entre les données préparées pour une utilisation en recherche et les données créées en raison d’une utilisation en recherche devient alors plus floue pour les données géospatiales. Ainsi, la GDR géospatiales inclura – du moins pour les besoins de ce chapitre – la gestion aussi bien des jeux de données préparés que des données issues de la recherche. La suite de ce chapitre présente des projets réalisés dans diverses régions du Canada qui répondent à l’un ou l’autre de ces trois objectifs :

  1. Contribuer actuellement à la GDR géospatiales;
  2. Contribuer dans le futur à la GDR géospatiales;
  3. Identifier les difficultés liées à la GDR géospatiales.

Les projets géospatiaux régionaux

Tels que noté plus tôt, les besoins en gestion des données géospatiales impliquent que l’accès et la préservation soient surtout réalisés par le biais de solutions en consortium plutôt que par des établissements individuels. Nous discuterons ci-dessous de la variété de solutions de différents consortiums régionaux pour la gestion des données de recherche géospatiales.

Les provinces de l’Atlantique

En date de 2023, les provinces de l’Atlantique n’ont toujours pas accès à des méthodes partagées ou consortiales pour le stockage et la livraison des données, malgré le rôle de premier plan des bibliothèques de la Nouvelle-Écosse en matière de systèmes partagés (Marshall, 1999, p.134). Toutefois, les bibliothécaires de données des établissements universitaires ont discuté de cette problématique et l’ont identifiée comme étant un besoin. De plus, des discussions ont été entamées avec des organisations ayant des systèmes consortiaux, particulièrement celui de Scholars GeoPortal en Ontario. Il y a un certain optimisme vis-à-vis de l’établissement d’un système national qui serait géré soit par un système partagé en consortium, soit par les bibliothèques universitaires associées à l’Alliance de recherche numérique du Canada. Ces discussions préliminaires demeurent informelles, mais il importe de soulever qu’elles ont lieu (IDD-Atlantique, communications personnelles, fév-mars 2022).

Comme il n’existe pas de systèmes partagés au niveau provincial ou régional, la mise en œuvre de la GDR géospatiales est entièrement entre les mains des établissements locaux dans les situations où les données de recherche géospatiales ont été reconnues. Chaque établissement a développé une approche de la gestion des données de recherche qui lui est propre, déterminée surtout en fonction des capacités de l’établissement ou de la bibliothèque à soutenir leur communauté. De la même manière, chaque établissement a développé son approche en matière de GDR géospatiales. Souvent, surtout dans le cas d’établissements plus petits, le traitement de ces questions se fait selon les besoins (p. ex., si la bibliothèque reçoit une demande d’un membre du corps professoral, le personnel cherchera des solutions appropriées selon ce qui est réalisable, souvent sous la forme d’un dépôt Dataverse ou d’un jeu de données hébergé localement). Bien que de tels systèmes ad hoc ne constituent pas des solutions idéales pour le stockage, l’utilisation et la découverte de données de recherche géospatiales, ils demeurent les meilleures options quand les ressources sont limitées (IDD-Atlantique, communications personnelles, fév-mars 2022).

Plusieurs établissements ont choisi d’utiliser des instances de Borealis (anciennement Dataverse de Scholars Portal) en tant que dépôt de données pour héberger les données créées par ses chercheuses et chercheurs. (Consultez Lunaris (s.d.) pour la liste des dépôts de données des établissements et des plateformes d’hébergement.) Lunaris (anciennement le service de découverte du DFDR) est distinct de Borealis, mais moissonne les dépôts des établissements pour offrir un outil qui permet d’accéder aux données et de naviguer les dépôts locaux). Les instances de Dataverse offrent une bonne découvrabilité. Toutefois, Dataverse n’offre pas d’outil robuste d’affichage géospatial ou de plateforme de découverte. L’outil Geodisy a pallié en partie ce manque (consultez ubc-library (2022) et autres références dans ce chapitre), mais il a été remplacé par Lunaris. Le système dans sa forme actuelle ne permet pas l’affichage des données et le découpage de zones précises; il ne permet qu’un affichage de base de la couverture des données. Il y a d’importantes lacunes au niveau de la recherche et de l’utilisation de données géospatiales ainsi que du stockage et des services de données de recherche géospatiales.

Le centre du SIG de l’Université Dalhousie est le système le plus développé de la région des provinces atlantiques. Construit à partir du ArcGIS Hub d’Esri, le portail est en cours de développement et vise à donner accès à tous les jeux de données détenus par ou avec une licence de l’Université. Ainsi, il permet les recherches géospatiales et des méthodes de visualisation, en plus du découpage préliminaire avant le téléchargement. Toutefois, comme il héberge des jeux de données sous licence, le portail est uniquement réservé à la communauté  de Dalhousie et n’est pas accessible aux autres établissements. Cette situation ne peut que décevoir la communauté externe qui voudrait accéder à ces données.

Le Québec

Au Québec, chaque bibliothèque universitaire assurait la gestion et la diffusion des données géospatiales de façon indépendante, et ce de manière plus ou moins automatisée jusqu’en 2019. En 2015, une entente historique entre le Bureau de coopération interuniversitaire (BCI) et le ministère de l’Énergie et des Ressources naturelles (MERN) a ouvert la porte à un nouveau mode de gestion et de diffusion des données géospatiales au sein du réseau universitaire québécois.

Jusqu’en 2015, toutes les universités québécoises devaient acheter les données gouvernementales individuellement et ne pouvaient se les prêter entre elles en raison des contrats de licence. Du jour au lendemain, grâce à l’entente BCI-MERN, les universités ont pu utiliser et se partager plus de 250 couches qui représentent 50 téraoctets (To). Comment gérer et partager cette masse de données? Ce ne sont pas toutes les universités qui possèdent une plateforme adéquate pour organiser et diffuser ces données géospatiales au profit de l’enseignement et de la recherche.

Dans une vision de collaboration interuniversitaire et de mutualisation des processus et des ressources, la Bibliothèque de l’Université Laval s’est montrée ouverte à partager son expertise et son savoir-faire dans le domaine géospatial via la création d‘une plateforme partagée, gérée par l’Université Laval et accessible aux bibliothèques participantes. Leur solution intégrerait l’ensemble des fonctionnalités nécessaires à la découverte, la visualisation et l’extraction des données géospatiales, ainsi que leur chargement dans un environnement sécuritaire et performant.

Le résultat est Géoindex, une infrastructure unique accessible aux 18 établissements universitaires québécois via 18 portes d’entrée paramétrées par chacun d’eux selon leurs préférences. Grâce à son moteur de recherche spatial et textuel performant, cette plateforme permet de facilement découvrir, de visualiser et d’extraire des données géospatiales et des photographies aériennes pour appuyer l’enseignement et la recherche. Géoindex se décline en deux modules : le module Géospatial et le module Géophoto, qui sont décrits ci-dessous.

L’entente BCI-MERN a servi de levier pour développer Géoindex, mais cette nouvelle plateforme permet d’héberger et diffuser d’autres données géospatiales provenant de sources diverses gérées selon différentes licences. On retrouve donc dans Géoindex des données sous licences provenant de l’entente, dont des données LiDAR qui offrent aux chercheuses et chercheurs de nouvelles interprétations du territoire. Mais il comprend aussi des données issues de projets de recherche comme celles de L’Atlas des vulnérabilités, qui illustre entre autres l’indice de sensibilité face aux vagues de chaleur, ou encore les données bathymétriques de l’Arctique recueillies par le brise-glace scientifique Amundsen.  Chaque couche d’information est décrite selon un profil de métadonnées (Profil UL) qui répond aux critères du Profil nord-américain (PNA) de la norme ISO 19115. L’utilisation du Répertoire de vedettes-matière de l’Université Laval (RVM) est mise à profit pour la standardisation des descriptions des sujets utilisés.

Figure 3 - Capture d'écran de GéoIndex, la plateforme de données géospatiales partagée par les universités du Québec, montrant les données vectorielles disponibles sur la plateforme.
Figure 3. Exemple de données de recherche géospatiales : La cartographie des anciens cours d’eau de Montréal, réalisée par une chercheuse de l’Université de Montréal.

Les données sont accessibles à l’ensemble du réseau universitaire, mais certaines sont aussi ouvertes et accessibles au grand public, dont plus de 250 cartes topographiques datant de 1909 à 2000. Géoindex permet aussi de mettre en valeur des documents historiques provenant des collections des bibliothèques, comme les cartes topographiques, mais aussi des documents encore plus anciens comme cette carte relatant la première expédition de John Franklin dans le Grand Nord canadien en 1819, que la bibliothèque de l’Université Laval a numérisée et géoréférencée afin de lui donner une seconde vie.

Figure 4 - Capture d'écran de GéoIndex, montrant les cartes historiques disponibles sur la plateforme.
Figure 4. Exemple de données géospatiales pouvant lancer un projet de recherche: Carte historique géoréférencée et trajet vectorisé de l’expédition Coppermine menée par Sir John Franklin entre 1819-1822.

Toujours dans une perspective de soutien à l’enseignement et à la recherche en facilitant la découverte d’information géographique, le module Géophoto dédié au repérage des photographies aériennes intégré à Géoindex, a été bonifié au cours de l’année 2022. En basculant vers ce module, les usagers peuvent consulter l’ensemble des inventaires de photographies aériennes détenues par les universités québécoises, soit plus de 1 200 000 photographies aériennes datant du 20e siècle. Il s’agit d’une information primaire, ou donnée brute, d’une grande importance pour comprendre le territoire tel qu’il était à un moment précis. Une entente signée de nouveau entre le BCI et le MERN permettra également d’ajouter d’ici 2026 plus d’un million de photographies aériennes numérisées par le MERN. En février 2023, on dénombrait 400 000 exemplaires numérisés disponibles dans le module Géophoto.

Figure 5 - Capture d'écran de Géophoto, montrant les photos aériennes disponibles sur la plateforme GéoIndex.
Figure 5. Le module Géophoto de la plateforme GéoIndex qui permet de consulter par le biais d’un accès unique l’ensemble des collections de photographies aériennes des universités québécoises.

Bien que la plateforme Géoindex puisse héberger et diffuser des données géospatiales issues de projets de recherche, elle n’a pas été conçue spécifiquement pour ce type de données. Par exemple, il n’y a pas d’émission de DOI et les métadonnées de ce géocatalogue ne sont pas exposées sur le Web, elles ne peuvent donc pas être moissonnées par d’autres moteurs de recherche. Il est prévu, lors d’une future mise à jour, de rendre les métadonnées se trouvant dans Géoindex ouvertes et accessibles aux autres moteurs de recherche.

Pour l’instant, les cas de données géospatiales issues spécifiquement de projets de recherche sont peu fréquents dans Géoindex. Toutefois, ses fonctionnalités de découverte, de visualisation et d’extraction feront probablement augmenter ce nombre au cours des prochaines années sans toutefois remplacer les dépôts de données de recherche traditionnels comme Dataverse. Géoindex doit être perçu comme un complément aux dépôts traditionnels avec des liens entre eux pour faciliter la découverte et la consultation.

L’Ontario

Les bibliothèques en Ontario collaborent depuis longtemps à la mise en place de systèmes de découverte et de gestion pour des collections partagées, coordonnée par le biais de l’Ontario Council of University Librairies (OCUL). Tel que précisé dans le chapitre 4, « Historique et paysage canadien de la gestion des données de recherche, » l’OCUL a été établi en 1967 et représente un consortium des vingt et une bibliothèques universitaires dans la province de l’Ontario. L’organisme s’implique dans les activités collectives telles que l’achat, le stockage et la fourniture de  ressources et de services aux bibliothèques. L’infrastructure derrière ces systèmes partagés est soutenue par Scholars Portal, le fournisseur d’infrastructure numérique de l’OCUL qui regroupe des bibliothécaires, des personnes responsables de l’administration des systèmes et d’autres du développement. Le personnel de Scholars Portal est à l’emploi des bibliothèques de l’Université de Toronto. Cette infrastructure provinciale, gérée par le consortium, héberge une variété de collections partagées. Elle a été impliquée dans l’établissement, le maintien et le soutien d’une panoplie de plateformes d’accès pour la collection et la livraison des données ainsi que dans le soutien à la clientèle. Ces initiatives comprennent des collections de publications, telles que Scholars Portal Périodiques et Scholars Portal Livres, ainsi que des plateformes axées sur les microdonnées et les données géospatiales, dont Scholars GeoPortal, Odesi et Borealis. Une variété de collections sous licence partagée, de collections numériques ouvertes et de collections d’archives sont hébergées et accessibles aux chercheuses et chercheurs universitaires des établissements membres participants.

L’OCUL Geo Community (anciennement le Map Group de l’OCUL) a joué un rôle déterminant dans le développement de Scholars GeoPortal en 2012. Scholars GeoPortal est un outil Web de découverte des données qui fournit un accès aux données commerciales et à celles sous licence, aux collections nationales de données brutes, aux données des gouvernements régionaux, aux données ouvertes et aux données d’imagerie matricielles (notamment les projets, acquisitions et cartes numérisées issus des gouvernements). L’application est une construction personnalisée qui utilise une combinaison des technologies d’Esri et d’autres logiciels déjà en usage chez Scholars Portal. Elle exploite ArcGIS Server comme base de données et serveur en arrière-plan et elle utilise les outils API fournit par Esri pour la visualisation et le téléchargement des données stockées dans ces serveurs par le biais d’un SIG frontal personnalisé. Ce SIG sert également de catalogue partagé et d’outil de découverte des données et est soutenu par un robuste éditeur de métadonnées qui produit des métadonnées conformes à la norme ISO 19115 stockées dans une base de données MarkLogic XML. Actuellement, un nouveau projet de développement est en cours pour remettre à jour le GeoPortal afin de garantir la pérennité de la plateforme et d’assurer qu’elle continue de répondre aux besoins de la communauté. Dans le cadre de ce travail de refonte, des intégrations à Borealis sont explorées (le sujet est abordé  au chapitre 4 dans un contexte national et régional).

Les bibliothèques de l’OCUL ont travaillé à faciliter l’accès aux données géospatiales rendues disponibles grâce au développement d’infrastructures et de licences partagées. Elles ont également activement participé à des projets spéciaux et des initiatives, aussi bien en Ontario que dans le contexte canadien plus large. Le projet des cartes topographiques historiques a mené à la numérisation de plus de 1000 cartes topographiques aux échelles de 1:25 000 et 1:63 360, couvrant les années 1906 à 1977. Les bibliothèques travaillent actuellement sur un projet plus important qui vise à réutiliser ces processus de travail sur la collection de cartes à 1:50 000 du Système national de référence cartographique (SNRC) et d’intégrer ces cartes au GeoPortal et à Borealis, fournissant ainsi une plus grande intégration de la collection avec l’infrastructure de données de recherche nationale du Canada (p. ex., Lunaris). À ce jour, plus de 6000 cartes de la collection à 1:50 000 ont ainsi été rendues disponibles.

Figure 6 - Capture d'écran du Scholars GeoPortal, la plateforme de données géospatiales partagée par les bibliothèques universitaires de l'Ontario.
Figure 6. Une carte du SNRC de Hamilton, Ontario (Fiche 030M05), telle qu’affichée dans GeoPortal.

L’Ontario Library Research Cloud (OLRC) est une collaboration entre les bibliothèques universitaires de l’Ontario visant à construire un réseau de stockage infonuagique à grande capacité et géographiquement distribué en utilisant des technologies à code source libre. L’OLRC est conçu pour héberger d’importants volumes de contenus numériques permettant la préservation à long terme économique et durable ainsi que le soutien aux outils de recherche en matière d’exploration de données et de textes (text and data mining). Cette ressource est actuellement exploitée par de nombreux établissements de l’OCUL pour la préservation de leurs données géospatiales afin d’assurer un accès à long terme. Permafrost s’appuie sur l’OLRC en soutenant les processus de travail pour la création de paquets d’informations archivés (AIP) en utilisant une instance d’Archivematica qui est gérée et appuyée par le consortium. Archivematica est une suite d’outils en source libre qui a été développée par Artefactual pour appuyer le versement et la préservation des objets numériques. Dans certains cas, Permafrost est connecté aux dépôts. L’instance de Islandora de la bibliothèque de l’Université McMaster, qui comprend plus de 12 000 cartes, plans et photos aériennes de la collection de cartes de Lloyd Reeds, représente un bon exemple de l’importance de cette infrastructure. Les données sont copiées de façon automatique et régulière dans l’OLRC et stockées en tant que AIP dans leurs archives numériques.

En raison de l’augmentation continue du volume des données, Scholars Portal a identifié le besoin de fournir de nouvelles solutions techniques pour soutenir le transfert de jeux de données volumineux au sein des services de données des bibliothèques universitaires. Cette recherche de solutions numériques est devenue d’autant plus pressante au cours de la pandémie de COVID-19; les restrictions en matière de contact rendaient impossibles les processus de travail existants dans un environnement à distance. Scholars Portal a développé une solution grâce à l’utilisation de Globus, un outil de transfert des données qui soutient les processus de travail pour les transferts de fichiers lourds et le stockage directement dans les environnements de recherche. L’OCUL explore actuellement une intégration plus approfondie dans le cadre de la refonte de Scholars GeoPortal.

Des métadonnées normalisées sont également essentielles pour faciliter l’accès à la recherche et la découverte de données géospatiales. Au cours du développement de GeoPortal, l’OCUL a réalisé d’importantes transformations en recommandant et en adoptant la norme ISO 19115 et des vedettes-matière canadiennes issues des agences gouvernementales fédérales et provinciales. Ces normes pour la création de jeux de données et de métadonnées au niveau des séries ont mené à une amélioration de la découverte, des capacités de recherche et de l’accès aux collections. L’expertise de Scholars Portal à fournir des formations sur les métadonnées géospatiales a également permis une plus grande compréhension de l’importance des normes pour les métadonnées géospatiales à travers la communauté de l’OCUL. Ces normes ont été appliquées aussi bien aux collections locales qu’aux projets spéciaux.

Les Prairies

Le Council of Prairie and Pacific University Libraries (COPPUL) est une association des bibliothèques universitaires des provinces de l’Ouest canadien qui comprend douze membres des Prairies – l’Alberta, la Saskatchewan et le Manitoba – qui sont énumérés dans le tableau 1. La capacité du personnel de ces bibliothèques de répondre aux besoins pour les services spécialisés en données géospatiales varie de façon considérable. Nombreuses sont les bibliothèques qui n’offrent aucun service géospatial ou de SIG, tandis que les plus grands établissements universitaires (p. ex., Calgary, Alberta, Manitoba) sont en mesure d’offrir un plus large éventail de services de données géospatiales. Les bibliothèques du COPPUL desservent des populations étudiantes et professorales très disparates en grosseur et soutiennent différents programmes académiques avec des exigences en GDR très variées. Ainsi, il existe d’importantes variations dans les types de services offerts par ces bibliothèques. De façon plus précise, ces services impliquent (1) de fournir un accès aux données géospatiales offertes par des agences externes; (2) de créer des produits liés au domaine géospatial et aux SIG utiles à la production de nouvelles recherches; et (3) de gérer les données géospatiales qui ont été produites par les chercheuses et chercheurs de leurs établissements respectifs dans le cadre de leurs activités de recherche.

Tableau 1: Les activités de gestion des données de recherche géospatiales dans les bibliothèques des Prairies membres du COPPUL.
Université Province LibGuide de données géospatiales / SIG Catalogue de données géospatiales/SIG Dépôt Dataverse pour la GDR Disponibilité des jeux de données géospatiales en GDR
Athabasca AB
Concordia AB
MacEwan AB
Mount Royal AB
Alberta AB
Calgary AB
Lethbridge AB
Régina SK
Saskatchewan SK
Brandon MB
Manitoba MB
Winnipeg MB

Les bibliothèques membres du COPPUL ont été activement impliquées dans la création de produits en lien avec le domaine géospatial et les SIG pour aider leurs clientèles à repérer et utiliser des jeux de données géospatiales présents dans leurs collections. Les types les plus courants de matériel géospatial inclus dans ces produits comprennent des cartes historiques, des cartes topographiques, des images aériennes, des modèles numériques d’altitude (MNA) et des documents sur le climat et l’environnement. Voici quelques exemples d’initiatives particulières :

  • Spatial & Numeric Data Services (SANDS) de la bibliothèque de l’Université de Calgary a participé au développement de nombreuses applications cartographiques (en anglais uniquement) qui donnent accès à des cartes historiques rares (p. ex., des cartes sériées des régions des Prairies canadiennes (Three-Mile Sectional Maps of the Canadian Prairies), des plans des cantons de l’Alberta, des plans d’assurance contre les incendies de Calgary). Les cartes originales ont été numérisées et géoréférencées pour permettre la visualisation d’emplacements géographiques sur une carte Web Esri qui peut être téléchargée.
  • La sixième phase du Shared Print Archive Network (SPAN) (site en anglais uniquement) du COPPUL a été mandatée pour identifier des cartes topographiques et historiques de l’Ouest canadien (à l’échelle approximative de 1:25 000 et 1 :63 360) pour la préservation et la recherche. L’identification de ces cartes ouvre la voie à de nouvelles possibilités de numérisation et de visualisation semblables aux cartes topographiques disponibles dans SANDS et Scholars GeoPortal de l’Ontario.
  • La collection de photographies aériennes du sud de l’Alberta (site en anglais uniquement) affiche les emplacements géographiques de photos aériennes verticales téléchargeables en utilisant une carte en ligne de Leaflet et le logiciel de bibliothèque numérique CONTENTdm. Le service de bibliothèque,archives et collections spéciales de l’Université de la Saskatchewan a créé une carte en ligne semblable qui localise les photographies obliques de la collection de photos aériennes de Howdy McPhail (site en anglais uniquement).
Figure 7 - Capture d'écran des plateformes d'accès aux données géospatiales de l'Université de Calgary.
Figure 7. Applications de cartographie, Spatial & Numeric Data Services (SANDS), les bibliothèques et ressources culturelles de l’Université de Calgary.

Les bibliothèques membres du COPPUL se sont impliquées, à des degrés différents, dans la gestion et la curation des données (y compris les données géospatiales) produites par les chercheuses et chercheurs de leur université respective. Actuellement, huit des douze bibliothèques membres du COPPUL utilisent des dépôts Dataverse pour héberger et partager leurs jeux de données au nom des membres de leur communauté savante (voir le tableau 1). Sept bibliothèques utilisent Borealis comme service d’hébergement externe, tandis que l’Université du Manitoba gère sa propre instance de Dataverse. Le nombre global de jeux de données déposés et disponibles dans les dépôts Dataverse des Prairies (un total de 1099 en date de mars 2022) est relativement modeste, mais continue de croître.

Les universités des Prairies publient aussi leurs jeux de données dans des dépôts de données propres à certains domaines (p. ex., Dryad pour les biosciences) ou dans le DFDR du Canada qui a été créé en partenariat avec l’Université de la Saskatchewan et plusieurs autres universités canadiennes. Des recherches peuvent être effectuées dans le DFDR par le biais de Lunaris qui fournit une fonctionnalité importante optimisée par Geodisy qui permet aux gens qui l’utilisent de faire une « recherche sur la carte » pour explorer et localiser, par le biais d’une carte en ligne, les jeux de données issus de régions particulières du Canada.

En mai 2022, les bibliothèques de l’Université du Manitoba ont lancé leur dépôt GISHub pour les données géospatiales. Le projet a été conçu à l’origine comme solution de stockage local sécurisé pour les données géospatiales, mais il a éventuellement été élargi pour y inclure des outils disponibles avec une licence d’exploitation Esri. Il vise à permettre la découverte et l’accès aux données aussi bien propriétaires qu’ouvertes de chercheuses et chercheurs, en plus de fournir un environnement local sécurisé pour une utilisation active des jeux de données géospatiales.

Pour les établissements sans instance de Dataverse, les données de recherche géospatiales créées localement peuvent être partagées dans le DFDR ou ailleurs. Par exemple, bien qu’il ne soit pas un dépôt de données, le dépôt institutionnel de l’Université de la Saskatchewan, HARVEST, héberge un petit nombre de jeux de données de recherche géospatiales. Au fur et à mesure que les bibliothèques du COPPUL mettent en œuvre leurs stratégies de GDR pour répondre aux exigences de la Politique des trois organismes sur la gestion des données de recherche, il est raisonnable de s’attendre à une plus grande uniformité au niveau du comment, quand et où les données de recherche géospatiales seront partagées.

La Colombie-Britannique

L’écosystème des données de recherche géospatiales en Colombie-Britannique est déterminé en fonction des services offerts par les établissements universitaires et organismes publics de la province. Les politiques de la Colombie-Britannique en matière de partage des données ont permis aux utilisatrices et utilisateurs de faire des recherches et d’accéder à une grande variété de données ouvertes en utilisant le BC Data Catalogue ainsi que plusieurs autres plateformes spécialisées conçues pour obtenir des données géospatiales à l’échelle de la province, notamment ParcelMap BC produit par BC Land Title and Survey ainsi que LidarBC. À un niveau plus granulaire, plusieurs districts et municipalités régionales de la Colombie-Britannique ont rendu leurs données disponibles par le biais de plateformes plus locales de découverte des données, telles que le catalogue de données ouvertes de la ville de Surrey et le portail de données ouvertes du Grand Vancouver (sites en anglais uniquement).

Dans le milieu universitaire de la Colombie-Britannique, les établissements postsecondaires utilisent des politiques indépendantes de collecte de données géospatiales fondées sur les exigences locales en matière d’administration, d’enseignement et de recherche. Les bibliothèques de quatre établissements sont les principaux propriétaires des collections de données géospatiales qui font partie du Abacus Data Network : l’Université Simon-Fraser, l’Université de la Colombie-Britannique (UBC), l’Université du nord de la Colombie-Britannique et l’Université de Victoria. L’infrastructure nécessaire au fonctionnement d’Abacus est maintenue par la bibliothèque de UBC. À chacune des universités membres d’Abacus est confié un sous-ensemble du réseau; la communauté de chacun des établissements est authentifiée pour n’utiliser que les données ayant les licences d’utilisation propres à son campus. Il s’agit donc d’une solution locale pour le développement des collections et la curation des données.

Entre 20% à 30% des données stockées dans Abacus sont des données géospatiales. Toutefois, le logiciel sous-jacent qui prend en charge Abacus – Dataverse – n’est pas conçu pour offrir du soutien spécialisé pour le repérage et l’utilisation des données géospatiales. Consciente de cette situation, la bibliothèque de UBC a créé un logiciel intermédiaire qui permet à Dataverse de se connecter à une pile géospécifique de logiciels libres, dont GeoServer et GeoBlacklight. Appelé Geodisy (Phase 1), ce projet a été subventionné par CANARIE entre octobre 2018 et mars 2020. À ce moment-là, une deuxième phase du projet a été entamée sous le financement de la Nouvelle organisation d’infrastructure de recherche numérique (NOIRN, désormais l’Alliance de recherche numérique du Canada ou simplement « l’Alliance ») et est administrée par le service de découverte canadien, Lunaris. Le service est maintenant utilisé pour exploiter la recherche sur la carte Geodisy de Lunaris.

Les orientations futures

La gestion actuelle des données de recherche géospatiales dépend de solutions régionales, développées en fonction des besoins, avec l’aide de bibliothécaires qui travaillent à anticiper les besoins futurs. Les restrictions en matière de temps et de charge de travail impliquent que le domaine n’évolue qu’en réaction à la GDR dans son ensemble. Le domaine géospatial comporte des besoins particuliers qui nécessitent toujours des solutions créatives de gestion des données pour assurer leur utilisation actuelle et future. Les solutions à la majorité des problèmes tendent vers des initiatives partagées ou en consortium et elles semblent continuer à aller en ce sens pour l’avenir, menant possiblement à un dépôt national de données de recherche géospatiales. Des discussions concertées sur les métadonnées géospatiales seront nécessaires ainsi qu’un travail approfondi sur les plateformes d’accès géospatiales; ces solutions seront vraisemblablement développées par le biais de méthodes régionales.

Si les défis actuels et des solutions envisagées ont été examinés, il importe de noter que certaines lacunes dans le contenu sont liées aux données biaisées. Des ateliers de cartographie autochtone, présentés par le Firelight Group, ont encouragé le développement des SIG et des données géospatiales auprès de nations autochtones. Le travail se poursuit dans les milieux universitaires sur les relations colons-autochtones, mais le développement du domaine reste lent. Les données géospatiales souffrent aussi des mêmes biais systémiques envers les communautés noires et non blanches dans la création et l’utilisation générale des données; là aussi, les avancées sont lentes. Au niveau linguistique, le Québec a fait preuve de leadership en matière d’accès multilingue aux données en s’engageant dans la traduction bilingue de métadonnées. Toutefois, les autres provinces tardent à créer et diffuser des métadonnées qui ne sont pas en anglais. Pour terminer, l’environnement canadien a longtemps favorisé le sud et bien qu’on ait tenté de faire appel à des expertises nordiques en matière de GDR géospatiales, le Grand Nord canadien demeure largement sous-exploré.

Il peut sembler banal de décrire le domaine des données de recherche géospatiales comme étant à la fois émergent et développé. Toutefois, un effort concerté est fait pour développer le travail déjà accompli et pour aligner la GDR géospatiales avec les besoins des chercheuses et chercheurs et des bibliothèques à travers le pays. Le travail se poursuit, particulièrement grâce à l’Alliance de recherche numérique du Canada et aux consortiums universitaires mentionnés plus tôt.

Questions de réflexion

  1. Qu’est-ce qui fait l’unicité des données géospatiales et quels sont les impacts sur les considérations en gestion des données de recherche?
  2. La gestion des données de recherche géospatiales est-elle mieux prise en charge par des établissements locaux, par des consortiums régionaux ou par l’entremise d’investissements en infrastructure à l’échelle nationale? Quels sont les avantages et les inconvénients de chacune des méthodes?
  3. La gestion des données de recherche nécessite une infrastructure qui la soutient. Quelles infrastructures existent à l’heure actuelle? Quelles sont les lacunes à combler pour améliorer la préservation, l’accès et l’utilisation des données de recherche géospatiales?

Éléments clés à retenir

  • Les données géospatiales impliquent une interaction complexe de jeux de données, mais nécessitent surtout de réfléchir aux données dans leur rapport à l’espace.
  • La gestion individuelle des données géospatiales est étroitement liée à la gestion des données de recherche et des ressources existent déjà pour en apprendre davantage sur le sujet.
  • Dans tout le pays, des projets régionaux tentent de gérer la préservation et l’accès aux données de recherche géospatiale dans le cadre plus large des données géospatiales.
  • Les établissements postsecondaires dirigent ces projets régionaux en fonction de leur disponibilité.

Lectures et ressources supplémentaires

L’Alliance de recherche numérique du Canada a de nombreuses ressources sur la gestion des données et les meilleures pratiques, ainsi que des groupes de discussion sur ces domaines. Pour plus d’informations, consultez le Réseau d’experts de l’Alliance numérique du Canada et le Guide des pratiques exemplaires sur les métadonnées de Dataverse Nord.

Un livre blanc a été rédigé par la NOIRN (maintenant intégrée à l’Alliance) faisant état des besoins actuels et futurs de l’infrastructure des données géospatiales au Canada. Ce document précise quelques-uns des besoins et particularités relatives aux données géospatiales :

Brodeur, J., Handren, K., Berish, F., Chandler, M., Fortin, M., Leahey, A. et Stevens, R. (2020). Enabling broad reuse of Canada’s geospatial data and digitized cartographic materials. A response to the NDRIO Call for White Papers on Canada’s Future DRI. https://alliancecan.ca/sites/default/files/2022-03/final-enabling-broad-reuse-of-canadas-geospatial-data-and-digitized-cartographic-materials.pdf

Pour une introduction aux SIG, consultez le matériel de formation disponible du QGIS.

Bibliographie

Bellin, J. (1764). Port de Louisbourg. J.N. Bellin.

Esri. (2016). Que sont les données raster? ArcMap. https://desktop.arcgis.com/fr/arcmap/10.3/manage-data/raster-and-images/what-is-raster-data.htm

Lunaris. (s.d.). Dépôts sources. https://www.lunaris.ca/fr/source_repositories

Marshall, P. (1999). Novanet, Inc.–Nova Scotia, Canada. Information Technology and Libraries, 18(3), 130-134. https://www.proquest.com/docview/215830105

OpenStreetMap. (2023). Planet OSM [Jeu de données]. https://planet.openstreetmap.org

QGIS Documentation. (s.d.). Vector data: Overview. https://docs.qgis.org/2.8/en/docs/gentle_gis_introduction/vector_data.html

Statistiques Canada. (2019). Fichiers des limites du recensement de 2016: Aires de diffusion. https://www12.statcan.gc.ca/census-recensement/alternative_alternatif.cfm?l=fra&dispext=zip&teng=lda_000b16a_e.zip&k=%20%20%20%2090414&loc=http://www12.statcan.gc.ca/census-recensement/2011/geo/bound-limit/files-fichiers/2016/lda_000b16a_e.zip

Stock, K. et  Hans G. (2016). Geospatial Reasoning With Open Data. Dans R. Layton et P. A. Walter (dir.), Automating Open Source Intelligence (p. 171–204). Syngress. https://doi.org/10.1016/B978-0-12-802916-9.00010-5

ubc-library. (2022). Geodisy. Github. https://github.com/ubc-library/geodisy

definition

About the authors

Martin Chandler est le bibliothécaire des services de données à l’Université du Cap-Breton. Il soutient la découverte et l’utilisation des données et des données géospatiales ainsi que les intersections créatives dans les arts et les sciences sociales.

definition

Kara Handren est bibliothécaire de données à la bibliothèque des cartes et données de l’Université de Toronto. Elle soutient la découverte et l’analyse de données notamment par le biais de  l’exploration de textes et de données et en s’occupant des systèmes d’information géographique.

definition

Titulaire d’un baccalauréat en géographie de l’Université du Québec à Montréal et d’une maîtrise en sciences de l’information de l’Université de Montréal, Stéfano Biondo a développé une expertise en gestion et en diffusion des données géospatiales au sein des bibliothèques universitaires. À l’origine de la création du Centre GéoStat de la bibliothèque de l’Université Laval, où il occupe la fonction de cartothécaire depuis 2005, il participe à l’acquisition, à la conservation et à la mise en valeur des collections cartographiques et géospatiales.

definition

Amber Leahey est bibliothécaire de données et des systèmes d’information géographique (SIG) ainsi que directrice des services pour Borealis, le dépôt Dataverse canadien, un dépôt de données national sécurisé et bilingue fourni en partenariat avec les bibliothèques universitaires et les établissements de recherche à travers le Canada. Dans son rôle, elle soutient les bibliothèques, les établissements et les chercheuses et chercheurs dans la gestion, le partage, la préservation et la réutilisation des données grâce au développement continu des services de soutien en lien avec les données et la recherche à Scholars Portal et aux bibliothèques de l’Université de Toronto. Elle est titulaire d’une maîtrise en bibliothéconomie et en sciences de l’information de l’Université de Toronto.

definition

Sarah Rutley est bibliothécaire des données et des systèmes d’information géographique (SIG) à l’Université de la Saskatchewan. Ses recherches portent sur la gestion, la découverte et l’accessibilité des données.

definition

Rhys Stevens est bibliothécaire universitaire (bibliothécaire III) à la bibliothèque de l’Université de Lethbridge en Alberta. Il est bibliothécaire et spécialiste de l’information pour l’Alberta Gambling Research Institute et également bibliothécaire responsable de la géographie, l’archéologie, l’anthropologie, les cartes, les documents gouvernementaux et les données spatiales/numériques.

definition

Licence

Symbole de License Creative Commons Attribution - Pas d’utilisation commerciale 4.0 International

La gestion des données de recherche dans le contexte canadien Droit d'auteur © 2023 par Martin Chandler; Kara Handren; Stéfano Biondo; Amber Leahey; Sarah Rutley; et Rhys Stevens est sous licence License Creative Commons Attribution - Pas d’utilisation commerciale 4.0 International, sauf indication contraire.

identificateur d’objets numériques (DOI)

https://doi.org/10.5206/FXQL2330

Partagez ce livre