2.0.1 Résumer, visualiser et communiquer des données – Introduction

 

Figure 2.0.1.1. Sir Francis Galton, photographie probablement prise dans les années 1850 ou au début des années 1860, image tirée de Wikipedia https://en.wikipedia.org/wiki/Francis_Galton#/media/File:Francis_Galton_1850s.jpg et de l’article de Nature Vox Populi 1907, image tirée de https://galton.org/cgi-bin/searchImages/search/essays/pages/galton-1907-vox-populi_1.htm.

Figure 2.0.1.2. William Playfair, images tirées de Wikipedia https://en.wikipedia.org/wiki/William_Playfair.

 

 

 

 

 

 

 

 

 

 

Le polymathe britannique Francis Galton (1822-1911; figure 2.0.1.1) a été un pionnier dans l’utilisation de statistiques synthétiques.  Fasciné par les mesures et la quantification, il a développé des concepts statistiques novateurs (bien que profondément problématiques) pour y répondre.  Il a notamment fait une observation intelligente concernant la médiane lors d’un concours d’estimation du poids d’un bœuf lors d’une foire de bétail. Intrigué par la diversité des estimations, Galton a analysé les données et a constaté que si les estimations individuelles variaient considérablement, la médiane des estimations était étonnamment proche du poids réel du bœuf. Cette découverte a mis en évidence l’efficacité de la médiane en tant que mesure de la tendance centrale, notamment en ce qui concerne sa robustesse face aux valeurs aberrantes et aux données asymétriques. Cette avancée a été publiée dans la revue Nature en 1907.

William Playfair (1759-1832; figure 2.0.1.2) est considéré comme le fondateur des méthodes graphiques en statistiques, et notamment des diagrammes topologiques, à barres, de zones et en secteurs.  Il a révolutionné la manière de présenter les données et a démontré que les graphiques pouvaient communiquer des informations plus efficacement que les tableaux de données.  Une fois qu’on les a décrites et résumées à l’aide de statistiques descriptives, les données peuvent être présentées sous de nombreuses formes de visualisation graphiques, ce qui permet d’en extraire des conclusions.

Le besoin et la croissance des visualisations de données démontrent le rôle critique des graphiques statistiques en tant qu’outils efficaces pour comprendre la distribution et la forme des données. Contrairement à une simple collection de chiffres, les graphiques fournissent une représentation visuelle qui permet de discerner plus facilement les groupes de données, les tendances et les valeurs aberrantes. Il s’agit d’une pratique largement utilisée dans divers médias et industries pour comparer et communiquer les données rapidement et efficacement.

Principaux points à retenir

Les graphiques fournissent une représentation visuelle des données et permettent de communiquer et de décrypter des statistiques descriptives.

Nous nous concentrons sur les méthodes graphiques fondamentales comme les histogrammes, les diagrammes en barres, les diagrammes en boîte, les séries temporelles et les nuages de points (aussi appelés diagrammes de dispersion).  Les applications pratiques de ces concepts sont démontrées par des exercices utilisant des tutoriels Jupyter Notebook basés sur Python.  Nous conclurons en soulignant les principes de l’excellence graphique et l’importance de créer des graphiques informatifs, véridiques et visuellement utiles.

Dans l’ensemble, ce module fournit un bon mélange de concepts théoriques, d’applications pratiques et d’outils de calcul statistique essentiels pour maîtriser la communication graphique des données dans les statistiques en génie biomédical.

Objectifs d’apprentissage

Objectifs d’apprentissage du module 2 :

  • Découvrir les résumés statistiques descriptifs basés sur la tendance centrale et la répartition des données.
  • Apprendre à construire et à interpréter différents types de graphiques tels que les histogrammes, les diagrammes à barres et les diagrammes en boîte.
  • Comprendre comment les statistiques descriptives résument et décrivent les caractéristiques d’un ensemble de données par le biais de visualisations.
  • Créer et interpréter une visualisation appropriée des données et comprendre l’utilité des techniques graphiques pour découvrir et résumer des tendances et des comparaisons dans les données.
  • Comprendre comment utiliser des graphiques simples de séries temporelles pour visualiser les caractéristiques importantes de données temporelles.
  • Appliquer les principes de l’excellence graphique et de la présentation efficace des données.

Objectifs d’apprentissage du module 2 – Tutoriels Jupyter Notebooks:

  • Utiliser un logiciel statistique pour résumer, visualiser et interpréter des données.
  • Apprendre à créer des tracés de base en utilisant les bibliothèques de traçage de Python.

 

Licence

Introduction aux méthodes statistiques en ingénierie© par C. Bassim et Bryan Lee. Tous droits réservés.

Partagez ce livre