"

16 Réussir sa thèse avec R-Studio : un tutoriel étape par étape et des exemples d’analyses pratiques

Le tutoriel s’adresse aux personnes étudiantes qui rédigent une thèse et qui veulent tirer profit des atouts de la programmation R pour améliorer leur projet. Que vous soyez novice en programmation ou que vous souhaitiez améliorer vos compétences, vous pourrez avec ce guide, lequel présente les principes fondamentaux de R, effectuer en toute confiance de simples analyses de base et créer des éléments visuels percutants. De la manipulation des données aux graphiques pertinents, acquérez les outils essentiels pour améliorer la profondeur et la rigueur de votre recherche. Rejoignez-nous dans cet apprentissage passionnant où nous vous donnerons les ressources pour comprendre l’environnement de R, démêler des ensembles de données complexes et transformer votre thèse en un récit convaincant étayé par une analyse de données solide. Plongeons dans le grand bain et libérons tout le potentiel de R pour votre réussite!

Ce document est un guide que vous pouvez lire à votre rythme de façon autonome.

Préparation de l’espace de travail

D’abord, téléchargeons toutes les bibliothèques nécessaires!

Les trousses ou bibliothèques R améliorent les capacités de l’outil. Vous pouvez les considérer comme une boîte contenant un ensemble d’outils ou, dans le cas présent, de fonctions de code pour des tâches spécifiques. J’ai dressé une liste de quelques consignes pour cet exercice.

Installez une trousse avec :

install.packages("package_name")

Téléchargez et utilisez le paquet avec :

library(package_name)

Au lieu d’exécuter ces deux fonctions à répétition pour chaque bibliothèque, j’utilise le code inclus ci-dessous. Il est très utile lorsque je le donne à d’autres personnes. Ce code vérifie si l’une des trousses de la liste « my_packages » est téléchargée, et sinon, il procède au téléchargement.

# List your required packages
my_packages <- c("tidyverse", "rstatix", "readxl", "xlsx", "effectsize", "emmeans", "kableExtra", "grid", "gridExtra", "ggpubr", "ggplot2", "ggsci", "cowplot", "devtools")

# Extract packages from the list that are not already installed
not_installed <- my_packages[!(my_packages %in% installed.packages()[ , "Package"])] 

# Install packages that are not already installed
if(length(not_installed)) install.packages(not_installed)

# Load the required libraries
library(tidyverse)    # for data manipulation 
library(rstatix)      # for statistical analyses
library(readxl)       # to read excel files
library(xlsx)         # to create excel files
library(effectsize)   # to calculate measures of effect size
library(kableExtra)   # formatting printable html ANOVA tables 
library(ggpubr)       # for making plots & figures
library(ggplot2)      # for making plots & figures
library(grid)         # for organizing multiple plots 
library(ggsci)        # for Scientific Journal and Sci-Fi Themed Color Palettes for ggplot2
library(gridExtra)    # to arrange multiple grid-based plots on a page
library(cowplot)      # for making plots and figures; an add-on to ggplot

Écrire et exécuter un code R : l’écriture de code dans R-Studio est simple. Vous pouvez le faire dans la console, en tapant le code et en appuyant sur le bouton « retour ». Ou ici dans la source. Pour exécuter une ligne de code, placez le curseur dessus et appuyez sur Ctrl + Entrée (Windows/Linux) ou Commande + retour (macOS). Vous pouvez également exécuter plusieurs lignes ensemble en les mettant en surbrillance et en appuyant sur les touches. L’option run en haut vous indique les touches de raccourci correspondant à la commande. Néanmoins, si vous oubliez les clés, vous pouvez utiliser l’option d’exécution ci-dessus. Pour exécuter une partie de code entier et voir la sortie, cliquez sur la petite flèche verte à côté.

Conseils (syntaxe de base de R) :

  • Vous pouvez attribuer des valeurs aux variables à l’aide de l’opérateur <-.
  • Utilisez le symbole # pour ajouter un commentaire sur une seule ligne.
  • Tout ce qui suit le symbole # sur la même ligne est considéré comme un commentaire et n’est pas exécuté.

Configurer le répertoire de travail

Une fois les bibliothèques enregistrées et téléchargées, il faut configurer le répertoire de travail et charger le jeu de données. Téléchargez toutes les données requises pour ces exercices en cliquant sur ce lien.

Sur votre ordinateur, créez un dossier dans lequel vous stockerez toutes les données de cet exercice. Enregistrez également votre session R actuelle dans ce dossier.

Ensuite, il faut définir le répertoire de travail de notre session R studio actuelle dans ce dossier. Il faut également y exporter les résultats des analyses. Vous pouvez configurer votre répertoire de travail au moyen d’un code utilisant la fonction « setwd() », qui oblige à saisir l’adresse complète du répertoire, qui est difficile à trouver, en particulier sur un appareil Apple. Mais nous pouvons l’associer à une autre fonction, « setwd(file.choose()) », qui permet de choisir sur notre bureau le dossier que nous souhaitons définir comme répertoire de travail. C’est ainsi que nous finalisons la création du fichier, que vous pouvez utiliser dans la fonction « setwd() » pour éviter de sélectionner votre fichier lors des prochaines exécutions du même code.

Vous pouvez également définir votre répertoire de travail dans le menu de R-Studio. En haut de l’écran, cliquez sur l’onglet « Session », puis parmi les options, survolez « Set Working Directory », sélectionnez « Choose Directory » et choisissez votre fichier désigné avec les ensembles de données.

Ensuite, le lien que vous voyez sera le chemin du fichier que vous pouvez copier et coller dans le code « setwd() » de sorte que vous évitiez le travail manuel la prochaine fois que vous exécutez le code.

Conseil : Lorsque vous nommez des fichiers, utilisez des barres « _ » au lieu d’espaces vides pour simplifier le chargement des données par nom.