9.1.1 Plans d’expériences : Introduction
9.1.1 Plans et analyses d’expériences en contexte
Ce module explique comment perturber volontairement un système pour mieux le comprendre. Les principes présentés dans les modules précédents, en particulier ceux axés sur les tests d’hypothèse et la régression linéaire, seront appliqués ici.
9.1.2 Terminologie
Dans un souci de clarté, voici la terminologie commune qui sera utilisée dans cette section (tableau 9.1.2.1) lors de la discussion sur les plans d’expérience.
Terme | Définition |
Expérience | Modifier un système et utiliser les informations qui en résultent pour l’améliorer |
Objectif | Une amélioration visée |
Résultat | Le résultat mesurable de l’expérience |
Facteur | Une chose qui peut être activement modifiée pour influencer le résultat |
Niveaux | Échelle en fonction des facteurs |
Objectifs et résultats
Supposons que l’objectif soit d’améliorer le rendement d’un seul lot de biscuits dans une recette. Un tel objectif pourrait être d’augmenter le nombre de biscuits et le résultat mesuré serait donc le nombre de biscuits. Ou encore, l’objectif pourrait être d’améliorer les propriétés esthétiques des biscuits; le résultat serait alors la couleur des biscuits (par exemple, blanc, brun, brun doré). D’autres exemples sont donnés dans le tableau 9.1.2.2 ci-dessous :
Objectif | Résultat mesuré | Résultat quantitatif ou qualitatif |
Augmenter le nombre de biscuits | Nombre de biscuits | Quantitatif |
Améliorer les propriétés esthétiques des biscuits | Couleur des biscuits | Qualitatif |
Réduire le temps de cuisson | Temps de cuisson | Quantitatif |
Améliorer le goût | Évaluations des juges de dégustation | Qualitatif |
Chaque expérience a généralement un objectif qui combine un résultat et la nécessité d’ajuster ce résultat. Cet objectif peut être d’augmenter, de diminuer ou de maintenir un facteur. Les résultats doivent toujours être mesurables, mais ils peuvent être quantitatifs ou qualitatifs. Sans résultats, aucune analyse n’est possible!
Facteurs
Les facteurs sont l’aspect central des plans d’expériences : ce sont les variables que l’on peut modifier pour influencer le résultat. Pour réaliser une expérience, il faut modifier au moins un facteur. Comme pour tous les types de données, il existe des facteurs numériques et catégoriques, et la plupart des expériences comportent les deux.
Si l’on reprend l’exemple de la préparation des biscuits, voici quelques facteurs potentiels :
- la quantité de sucre utilisée dans la recette → facteur numérique
- le type de lait utilisé (lait d’avoine ou d’amande) → facteur catégorique
- le temps passé à mélanger → facteur numérique
- l’utilisation d’un mélangeur automatique ou manuel → facteur catégorique
Les facteurs numériques sont quantifiés par la mesure et, de ce fait, il existe un certain ordre implicite. Si l’on prend l’exemple de la quantité de sucre, deux tasses sont supérieures à une tasse. En revanche, les facteurs catégoriques ont un nombre limité de valeurs. Le choix entre le lait d’avoine et le lait d’amande ne fait l’objet d’aucun ordre implicite. On notera toutefois que de nombreux facteurs catégoriques pourraient être convertis en variables numériques continues. Par exemple, la teneur en calcium du lait d’avoine et du lait d’amande peut être différente, soit respectivement 300 et 400 mg de calcium/tasse.
Niveaux
Dans la forme la plus simple du plan d’expériences, chaque facteur ne comporte que deux niveaux, comme dans l’exemple précédent. Les exemples ci-dessus représentent tous des facteurs à deux niveaux : deux tasses ou une tasse de sucre, mélangeur automatique ou manuel, 300 ou 400 mg de calcium/tasse. Le choix des niveaux pour une expérience est une décision importante et repose généralement sur une certaine expertise ou connaissance du système. Dans les expériences relativement complexes, les facteurs peuvent avoir trois, quatre ou même encore plus de niveaux. Ce module se concentre sur les plans à deux niveaux par facteur, car les plans à deux ou trois niveaux par facteur sont les plus courants.
Le choix des niveaux est important. Voici quelques bonnes pratiques pour choisir la fourchette de niveaux :
- La fourchette de niveaux doit être suffisante pour mettre en évidence une différence dans les résultats (mais si elle est trop large, elle risque de ne pas correspondre à un modèle linéaire).
- Il ne faut pas utiliser de valeurs extrêmes pour commencer.
- Il faut perturber le système, mais pas de manière trop granulaire.
- Sans connaissances préalables, une fourchette de 25 % de la norme de fonctionnement est un bon point de départ.
L’exécution d’une expérience se nomme un « essai ». Si l’on exécute huit expériences, on peut dire qu’il y a huit essais dans l’ensemble d’expériences.
9.1.3 Exemple de plans d’expériences
Supposons que nous gérons une boulangerie et que nous voulons augmenter les profits. Nous proposons de mener une expérience pour déterminer la solution optimale. Dans ce cas, l’analyse a été simplifiée à deux facteurs seulement. Les chapitres suivants aborderont les méthodes permettant de réduire le nombre de facteurs d’une expérience. Ce problème peut être résumé comme suit :
Exemple 9.1.3.1 : Exemple de plan d’expériences
Objectif : Augmenter le profit
Résultat : Profit réalisé en une journée lors de la vente de biscuits
Facteurs : Luminosité du commerce et prix du produit (voir tableau 9.1.3.1 pour les niveaux)
Facteur | Niveau bas | Niveau élevé |
Lumière | Luminosité faible (50 %) | Luminosité forte (75 %) |
Prix | 7,79 $ | 8,49 $ |
Pour mener une expérience, on doit envisager toutes les combinaisons possibles de facteurs. Ces données sont généralement présentées dans un tableau appelé tableau d’ordre standard. Les tableaux standards sont généralement donnés avec des valeurs discrètes/codées de 0, -1, 1, etc.
Expérience | Lumière | Prix |
1 | -1 (faible) | -1 (bas) |
2 | 1 (forte) | -1 (bas) |
3 | -1 (faible) | 1 (élevé) |
4 | 1 (forte) | 1 (élevé) |
Comme le montre le tableau 9.1.3.2, cet ordre nous aide à déterminer toutes les combinaisons possibles de facteurs qui pourraient être utilisés dans l’expérience. Certains logiciels statistiques sont également conçus pour recevoir des données préparées de cette manière. Si l’on menait ces expériences, le tableau deviendrait le tableau 9.1.3.3, où le profit est le résultat mesuré. Notez la colonne « Essai ». Il est impératif que les expériences soient menées dans un ordre aléatoire afin d’éviter les effets des perturbations (voir la section 9.2.2).
Expérience | Essai | Niveau de luminosité | Niveau de prix | Profit |
1 | 2 | Luminosité faible (50 %) | Bas (7,79 $) | 490 $ |
2 | 1 | Luminosité forte (75 %) | Bas (7,79 $) | 570 $ |
3 | 4 | Luminosité faible (50 %) | Élevé (8,49 $) | 370 $ |
4 | 3 | Luminosité forte (75 %) | Élevé (8,49 $) | 450 $ |
La figure 9.1.3.1 permet de visualiser ce tableau et d’en extraire quelques résultats.
Le passage d’une luminosité faible à une luminosité forte augmente les profits, en moyenne, de 80 $ :
- En passant d’un éclairage faible à un éclairage fort, la différence de profit au prix bas est de (570 $ – 490 )$) = 80 $.
- En passant d’un éclairage faible à un éclairage fort, la différence de profit à un prix élevé est de (450 $ – 370 $) = 80 $.
L’augmentation du prix de 7,79 $ à 8,49 $ diminue le profit, en moyenne, de 120 $ :
- Augmenter le prix de 7,79 $ à 8,49 $ sous une lumière faible donne (370 $ – 490 $) = -120 $.
- Augmenter le prix de 7,79 $ à 8,49 $ sous une lumière forte donne (450 $ – 570 $) = -120 $.
L’utilisation de plans d’expériences nous permet d’examiner les interactions entre ces facteurs. Plus précisément, on pourrait alors tracer des courbes de niveau entre les différents points de données, ce qui nous permettrait d’obtenir le « centre » (tous les points de données potentiels à l’intérieur du carré) et pas seulement le périmètre. De plus, ce processus peut être étendu à plusieurs facteurs.
9.1.4 Pourquoi utiliser les plans d’expériences?
Lorsqu’on envisage d’exécuter un plan d’expériences, on se demande souvent : est-ce vraiment nécessaire? Pour de nombreux systèmes, il existe un grand nombre de données historiques, alors pourquoi ne pas les utiliser? Données existantes = données historiques = données potentiellement fortuites. En l’absence de documentation détaillée, on ne peut pas supposer que les données ont été correctement manipulées. Par conséquent, seules les corrélations établies dans les données peuvent être vérifiées avec certitude. L’expérimentation planifiée est le seul moyen de s’assurer que les événements corrélés sont causaux! En outre, sans plan d’expériences, les expériences sont généralement menées en utilisant des méthodes d’essai et d’erreur, ce qui signifie qu’on ne modifie qu’un seul facteur à la fois. Les méthodes de plans d’expériences permettent d’atteindre la solution optimale plus rapidement, de manière plus efficace et plus structurée que les méthodes d’essai et d’erreur. Ce point sera expliqué plus en détail dans les chapitres suivants.