8.1.5 Interactions

Précédemment dans cette section, il a été question du fait qu’un « terme en x » dans les équations d’ajustement par les moindres carrés peut être une fonction connue (par exemple, un logarithme) d’une variable de base du processus. En fait, il est souvent utile de permettre à un « terme x » d’être fonction de plusieurs variables de base du processus, comme on le voit dans l’exemple suivant.

Exemple 8.1.5.1 : Rapport portance/traînée pour une configuration à trois surfaces

P. Burris a étudié les effets des positions relatives de l’aile d’un plan canard (une surface portante avant) et de l’empennage sur le rapport portance/traînée pour une configuration à trois surfaces. Une partie de ses données est présentée dans le tableau 8.1.5.1, où
.
x_= le placement du plan canard en pouces au-dessus du plan de l’aile principale
.
x_= l’emplacement de l’empennage en pouces au-dessus du plan de l’aile principale
.
(Les positions avant-arrière des trois surfaces sont restées constantes tout au long de l’étude.)
.
Un ajustement direct de l’équation par les moindres carrés
.
y \approx \beta_{0}+\beta_ x_+\beta_ x_
.
à ces données produit un R^ de seulement 0,394. Même l’ajout de termes au carré à x_ et x_, c’est-à-dire l’ajustement de l’équation
.
y \approx \beta_{0}+\beta_ x_+\beta_ x_+\beta_ x_^+\beta_ x_^
.
augmente R^ à seulement 0,513. Cependant, la capture d’écran 8.1.5.1 montre que l’ajustement de l’équation
.
y \approx \beta_{0}+\beta_ x_+\beta_ x_+\beta_ x_ x_
.
donne R^ = 0,641, pour la fonction suivante :
.
8.1.5.1                    \hat{y} = 3,4284 + 0,5361 x_ + 0,3201 x_ - 0,5042 x_ x_
.

Tableau 8.1.5.1

.

Capture d’écran 8.1.5.1 : Régression multiple des données de rapport portance/traînée

.

Capture d’écran 8.1.5.2 : Tableau d’analyse de la variance pour la régression multiple des données sur le rapport portance/traînée

.

L’équation de régression est
.
y = 3,43 + 0,536 x 1 + 0,320 x 2 - 0,504 x 1 * x 2
.
(Après avoir lu les valeurs x_, x_, et y du tableau 8.1.5.1 dans les colonnes, les produits x_ x_ ont été créés et y ajustés aux trois variables prédictives x_, x_, et x_ x_ afin de créer cette capture d’écran.)
.
La figure 8.1.5.1 montre la nature de la surface ajustée 8.1.5.1. L’élévation du plan canard (augmentation de x_) semble avoir des effets visiblement différents sur y en fonction de la valeur de x_ (la position de l’empennage). (Il semble que le canard et l’empennage ne doivent pas être alignés, c’est-à-dire que x_ ne doit pas être proche de x_. Pour maximiser la fonction, x_ doit être petit si x_ est grand, et vice-versa.) C’est le terme mixte x_ x_ dans l’équation 8.1.5.1 qui permet aux courbes de réponse d’avoir des caractères différents pour différentes valeurs de x_. Sans ce terme, les tranches de la surface ajustée \left(x_, x_, \hat{y}\right) seraient parallèles pour différentes valeurs de x_, comme dans la situation du module 8.1.4.
.

Figure 8.1.5.1 : Tracés de la portance/traînée ajustée de l’équation 8.1.5.1

.

Bien que le principal point d’intérêt de cet exemple ait été présenté, il convient probablement de mentionner qu’on peut faire mieux que l’équation 8.1.5.1 pour ajuster les données du tableau 8.1.5.1. La figure 8.1.5.2 montre un tracé résiduel de cette équation en fonction de la position du plan canard x_; on peut observer une forte tendance curvilinéaire. En fait, pour l’équation ajustée
.
8.1.5.2                     \hat{y} = 3,9833 + 0,5361 x_ + 0,3201 x_ - 0,4843 x_^ - 0,5042 x_ x_
.
on a R^ = 0,754 et des résidus qui semblent généralement aléatoires. En traçant les courbes \hat{y} en fonction de x_ pour plusieurs valeurs de x_, on peut voir que l’équation ajustée 8.1.5.2 produit des tranches paraboliques non parallèles de la surface ajustée \left(x_, x_, \hat{y}\right), au lieu des tranches linéaires non parallèles observées sur la figure 8.1.5.1.
.

Figure 8.1.5.2 : Tracé résiduel de l’équation 8.1.5.1 en fonction de x1.

.

Cet exemple est disponible dans le Python Jupyter Notebook sur le site GitHub du cours.

Vous pouvez également utiliser le lien Binder suivant pour réviser cet exemple dans un environnement interactif (site GitHub spécial pour l’exemple 8.1.5) : consulter l’exemple 8.1.5 sur Binder.

Licence

Introduction aux méthodes statistiques en ingénierie© par C. Bassim et Bryan Lee. Tous droits réservés.

Partagez ce livre