"

2.2.6 Statistiques synthétiques et calcul statistique

Les synthèses de données numériques présentées dans ce chapitre sont relativement simples. Pour de petits ensembles de données, elles peuvent être calculées assez facilement à l’aide d’une simple calculatrice de poche. Toutefois, pour les grands ensembles de données ou lorsqu’on voudra peut-être faire d’autre calculs ou produire des graphiques, un logiciel statistique peut être pratique.

Ce Jupyter Notebook utilisant Python est accessible et peut être consulté et téléchargé sur le site GitHub du cours ou sur le site Special GitHub Site for Part 2.

Vous pouvez également ouvrir un environnement informatique interactif pour travailler avec le Jupyter Notebook utilisant Python à travers un site Binder en passant par le site GitHub de l’exemple de la partie 2.  Cliquez sur ce site Binder pour accéder au site Binder pour l’exemple (accessible à l’adresse https://mybinder.org/v2/gh/Statistical-Methods-for-Engineering/Special-GitHub-Site-Part-2-Example-Percent-Waste-by-Weight-on-Bulk-Paper-Rolls/HEAD).

La capture d’écran ci-dessous montre comment utiliser le module statistique de Python pour Jupyter Notebook afin de produire des statistiques synthétiques pour les ensembles de données sur les pourcentages de pertes dont il a été question dans ce chapitre.  La moyenne, la médiane et l’écart-type de correspondent à ce qui a été obtenu dans l’exemple. Cependant, le premier et le troisième quartiles ne correspondent pas exactement à ceux trouvés précédemment.  (Les bibliothèques Python numpy et pandas utilisent des conventions légèrement différentes de celles présentées dans le chapitre 2 pour ces quantités.)

Il y a de nombreux outils informatiques de haute qualité pour les statistiques, dont Python, mais aussi JMP, SAS, SPSS, SYSTAT, SPLUS, MINITAB, MATLAB, R, etc. Tout.e ingénieur.e devrait en avoir un sur son ordinateur de travail. Malheureusement, ce n’est pas toujours le cas et les ingénieur.e.s supposent souvent qu’un logiciel de feuille de calcul standard (potentiellement avec des plugiciels tiers) constitue un substitut viable. C’est souvent vrai, mais pas toujours.  Les ingénieur.e.s modernes ont besoin des statistiques informatiques et d’un certain niveau de compétence en sciences des données.

.

Figure 2.2.6.1.

La figure 2.2.6.1 est un diagramme en boîtes et un histogramme du fournisseur 1 de l’exemple.  Consultez le Jupyter Notebook et commencez à synthétiser ces données et à les représenter graphiquement.

Licence

Introduction aux méthodes statistiques en ingénierie© par C. Bassim et Bryan Lee. Tous droits réservés.