8.1.6 Quelques précautions additionnelles : extrapolation, valeurs aberrantes et parcimonie

L’ajustement de courbes et de surfaces par la méthode des moindres carrés est d’une importance considérable pour l’ingénierie, mais il faut l’utiliser traité avec soin et discernement. Avant de laisser le sujet jusqu’au module 8.2, où nous verrons les méthodes d’inférence formelle qui lui sont associées, il convient de procéder à quelques mises en garde supplémentaires.

Extrapolation

Tout d’abord, il est nécessaire de mettre en garde contre les dangers d’une extrapolation substantiellement en dehors de l’étendue des données \left(x_1, x_2, \ldots, x_{k}, y\right). On peut raisonnablement compter sur une équation ajustée pour décrire la relation entre y et un ensemble particulier de valeurs de x_1, x_2, \ldots, x_{k} uniquement si ces valeurs sont semblables à celles utilisés pour créer l’équation. L’ajustement de surface présente un défi :
lorsque plusieurs variables x différentes sont impliquées, il est difficile de dire si un vecteur [latex]\left(x_1, x_2, \ldots, x_{k}, y\right)[/latex] donné est une extrapolation « substantielle ». Tout ce qu’on peut faire, c’est vérifier qu’il est proche d’un point [latex]\left(x_1, x_2, \ldots, x_{k}, y\right)[/latex] de l’ensemble sur toutes les coordonnées. Il ne suffit pas qu’un point ait une valeur x1 proche de celle qui nous intéresse, puis qu’un autre point ait une valeur x2 proche de celle qui nous intéresse, etc. Par exemple, le fait d’avoir des données avec 1 ≤ x1 ≤ 5 et 10 ≤ x2 ≤ 20 ne signifie pas que la paire (x1, x2) (3, 15) est nécessairement proche de n’importe quelle paire de l’ensemble de données. Ce fait est illustré à la figure 8.1.6.1 pour un ensemble fictif de valeurs (x1, x2).
.

Figure 8.1.6.1 : Graphique hypothétique de paires (x1, x2)

.

L’influence des vecteurs de données aberrantes

L’ajustement des courbes et des surfaces par les moindres carrés peut être fortement affecté par quelques données aberrantes ou extrêmes, ce qui constitue un autre piège potentiel. On peut essayer de déceler ces points en examinant les graphiques et en comparant les ajustements réalisés avec et sans le ou les points suspects.

Exemple 8.1.6.1 Données sur la perte dans la cheminée (suite)

On a remarqué à la figure 8.1.3.2 que l’ensemble de données de l’usine d’azote contient un point avec une valeur x_1 extrême. La figure 8.1.6.2 est un nuage de points des paires \left(x_1, x_2\right) pour les données du tableau 8.1.3.1. Elle montre que, selon la plupart des normes qualitatives, l’observation 1 du tableau 8.1.3.1 est inhabituelle ou aberrante.
.

Figure 8.1.6.2
.
Si on refait l’ajustement de l’équation en utilisant uniquement les 16 derniers points de données du tableau 8.1.3.1, on obtient l’équation
.
8.1.6.1                    \hat{y} = -56,797 + 1,404 x_1 + 0,601 x_2 - 0,007 x_1^2
.
et R^ = 0,942. On pourrait envisager d’utiliser l’équation 8.1.6.1 pour prédire les pertes dans la cheminée et de limiter l’attention à x_1 dans l’étendue de 50 à 62. Il est toutefois possible de vérifier que, même si certains des coefficients (les b) des équations 8.1.3.4 et 8.1.6.1 diffèrent considérablement, les deux équations produisent des valeurs de \hat{y} comparables pour les 16 points de données pour lesquels x_1 se situe entre 50 et 62. En fait, la plus grande différence entre les valeurs ajustées est d’environ 0,4. Par conséquent, étant donné que le point 1 du tableau 8.1.3.1 ne modifie pas radicalement les prédictions faites à l’aide de l’équation ajustée, il est logique de le garder, d’adopter l’équation (8.1.3.4) et de l’utiliser pour décrire les pertes dans la cheminée pour les paires \left(x_1, x_2\right) à l’intérieur du modèle de dispersion de la figure 8.1.6.2.

Le risque de surajustement

Il faut également souligner que la notion de simplicité (parcimonie) de l’équation n’est pas seulement importante pour des raisons de simplicité d’interprétation et de réduction des coûts liés à l’utilisation de l’équation. Elle est également importante dans la mesure où elle permet d’obtenir une interpolation régulière tout en évitant de surajuster un ensemble de données. Prenons l’exemple de données artificielles, généralement linéaires (x, y). On pourrait trouver un polynôme de degré k = 10 à travers chacun de ces points. Mais dans la plupart des problèmes physiques, une telle courbe serait beaucoup moins efficace pour prédire les valeurs de y correspondant à d’autres valeurs de x qu’une simple ligne ajustée. Un polynôme du 10e degré serait surajusté.

Modèles empiriques et ingénierie

Pour conclure cette section, examinons comment les méthodes abordées ici s’inscrivent dans le cadre général de l’utilisation de modèles pour résoudre des problèmes d’ingénierie. Il faut reconnaître que les théories de la physique, de la chimie, des matériaux, etc. produisent rarement des équations des formes simples présentées ici. Parfois, des équations pertinentes de ces théories peuvent être réécrites sous ces formes, comme dans le cas de l’équation de Taylor pour la durée de vie des outils, présentée précédemment dans cette section. Mais la majorité des applications d’ingénierie des méthodes de cette section concernent la foule de problèmes pour lesquels il n’existe pas de théorie physique simple et bien connue, et pour lesquels une simple description empirique de la situation serait utile. Dans de tels cas, l’ajustement des courbes et des surfaces par les moindres carrés peut offrir un aperçu ou une estimation éclairée permettant d’établir des descriptions empiriques approximatives de la relation entre une réponse y et les variables d’entrée du système x_1, x_1, \ldots, x_{k}.

Licence

Introduction aux méthodes statistiques en ingénierie© par C. Bassim et Bryan Lee. Tous droits réservés.

Partagez ce livre