8.1.2 Transformations

C. Bassim et Bryan Lee

8.1.2 Transformations

Transformations pour la régression linéaire

La seconde observation formulée dans le chapitre 8.1.1, concernant les cas où un modèle de régression ne semble pas être satisfaisant, indique que les termes $x, x^2, x^3, \ldots, x^{k}$ de l’équation 8.1.12 peuvent être remplacés par n’importe quelle fonction (connue) de $x$ sans changer le reste de l’analyse. Les équations normales consisteront toujours en $k+1$ équations linéaires de paramètres $\beta_{0}, \beta_1, \ldots, \beta_{k}$ , et un programme de régressions linéaire multiple produira toujours les valeurs de moindres carrés $b_{0}, b_1, \ldots, b_{k}$ . Cela peut toujours être très utile quand il existe des raisons théoriques de supposer que $x$ et $y$ sont liées par une fonction simple mais non linéaire. Par exemple, l’équation de Taylor pour la durée de vie des outils est de la forme

.

$y \approx \alpha x^{\beta}$

.

où $y$ est la durée de vie de l’outil (par exemple, en minutes) et $x$ la vitesse de coupe appliquée (par exemple, en m/min). En prenant le logarithme des deux côtés de l’équation, on obtient :

.

$\ln (y) \approx \ln (\alpha)+\beta \ln (x)$

.

Il s’agit d’une équation linéaire qui relie $\ln (y)$ et la variable $\ln (x)$ , et dont les paramètres $\ln (\alpha)$ et $\beta$ sont linéaires. Ainsi, à partir d’un ensemble de données $(x, y)$ , on détermine les valeurs empiriques de $\alpha$ et $\beta$ en faisant ce qui suit :

.

1. Prendre les logarithmes des $x$ et des $y$ .

2. Traçer la droite de régression (équation 8.1.1.2).

3. Utiliser $\ln (\alpha)$ comme valeur $\beta_{0}$ (et ainsi $\alpha$ avec $\left.\exp \left(\beta_{0}\right)\right)$ et $\beta$ comme valeur $\beta_$ .

.

Transformations de variables en modélisation

Ce cours est une introduction à l’un des thèmes principaux de l’analyse statistique pour l’ingénierie : la découverte et l’utilisation d’une structure simple dans des situations complexes. Cela peut parfois être fait en réexprimant des variables au moyen d’une autre échelle (non linéaire) de mesure que celle qui viendrait à l’esprit en premier lieu. Cela signifie que, parfois, une structure peut ne pas sembler simple en utilisant les échelles de mesure initiales, mais qu’elle peut le devenir après qu’on a transformé une ou plusieurs variables. Cette section présente plusieurs exemples de situations où les transformations sont utiles. Ce faisant, quelques commentaires sur les types de transformations couramment utilisés et sur les raisons plus spécifiques de leur utilisation sont proposés.

.

Transformations et échantillons uniques

Comme discuté dans les parties 3 et 4, il existe plusieurs distributions théoriques standard. Lorsqu’une de ces distributions peut être utilisée pour décrire une réponse $y$ , tout ce qu’on sait à propos de ce modèle peut servir à faire des prédictions et inférences concernant $y$ . Toutefois, lorsqu’aucune forme de distribution standard ne semble décrire $y$ , il est néanmoins possible de définir une fonction $g(y)$ qui, elle, correspond à une distribution standard. $\text{[math]}$

Exemple 8.1.2.1 Temps de détection

Elliot, Kibby, et Meyer ont mené une étude sur les interventions dans un centre de réparation automobile. Ils ont collecté des données sur ce qu’ils appelaient le « temps de détection » nécessaire pour diagnostiquer les réparations que le personnel allait recommander aux propriétaires des véhicules. Trente temps de détection de ce type (exprimés en minutes) sont présentés sur la figure 8.1.2.1, sous forme d’un diagramme à tige et à feuilles.

.

Les données du diagramme à tige et à feuilles semblent être un peu asymétrique à droite. La plupart des méthodes d’inférence statistique courantes sont basées sur l’hypothèse qu’un mécanisme de génération de données produira à long terme des données symétriques et en forme de cloche; il serait donc critiquable d’utiliser de telles méthodes pour tirer des conclusions et réaliser des prédictions sur les temps de détection dans ce garage. Toutefois, supposons que les temps de détection peuvent être transformés de manière à suivre une distribution en forme de cloche. Les méthodes standard pourraient être utilisées pour tirer des conclusions sur les temps de détections transformés, qui pourraient ensuite être traduits (en inversant la transformation) en conclusions applicables aux temps de détections bruts.

.

Une transformation commune pour raccourcir la queue droite d’une distribution est la transformation logarithmique $g(y)=\ln (y)$ . Pour illustrer son utilisation dans le cas présent, des graphiques normaux des temps de détection et du logarithme des temps de détections sont présentés à la figure 8.1.2.2. Ces graphiques montrent qu’Elliot, Kibby et Meyer n’auraient pas pu raisonnablement appliquer les méthodes d’inférence standard aux temps de détection, mais qu’ils auraient pu les utiliser avec les logarithmes des temps de détection. Le second graphique normal est beaucoup plus linéaire que le premier.

.

Figure 8.1.2.1 Diagramme à tige et à feuilles des temps de détection.

.

Figure 8.1.2.2 Graphiques normaux des temps de détection et du logarithme des temps de détection.

.

Dans l’exemple précédent, la transformation logarithmique était utile pour réduire l’asymétrie de la distribution de la réponse. Dans les études d’ingénierie statistique, les transformations de puissance constituent un autre type de transformation couramment employé pour modifier la forme d’une distribution de réponse.

.

8.1.2.1 Transformations de puissance $g(y)=(y-\gamma)^{\alpha}$

.

Dans la transformation 8.1.2.1, $\gamma$ constitue généralement une valeur seuil, qui correspond à une valeur minimum de la réponse. $\alpha$ détermine la forme de base du graphique qui représente $g(y)$ en fonction de $y$ . Si

1″ title= »\alpha>1″ class= »latex mathjax »>, la transformation 8.1.2.1 a tendance à allonger la queue droite de la distribution de $y$ . Si <img src= »https://ecampusontario.pressbooks.pub/app/uploads/sites/4171/2024/03/bbfc5cb85d863c86329fad1cca04a7de.png » alt= »0<\alpha<1″ title= »0<\alpha, la transformation a tendance à réduire la queue droite de la distribution de $y$ ; la réduction devient plus prononcée à mesure que $\alpha$ s’approche de 0, mais elle n’est jamais aussi prononcée que lorsqu’on utilise une transformation logarithmique

.

8.1.2.2 Transformation logarithmique $g(y)=\ln (y-\gamma)$

.

Transformations et échantillons multiples

Comparer plusieurs ensembles de conditions d’un processus constitue l’un des problèmes fondamentaux de l’analyse statistique en ingénierie. Il est préférable d’effectuer la comparaison en utilisant une échelle où les échantillons présentent des variabilités comparables, pour au moins deux raisons. Premièrement, les comparaisons sont alors simplement réduites à la comparaison entre les moyennes des réponses. Deuxièmement, les propriétés des méthodes standard d’inférence statistique ne sont souvent bien comprises que lorsque la variabilité des réponses est comparable pour les différents ensembles de conditions.

.

Lorsque la variabilité d’une réponse n’est pas comparable pour des ensembles de conditions différents, une transformation peut parfois être appliquée à l’ensemble des observations pour remédier à ce problème. Cette possibilité d’effectuer une transformation pour stabiliser la variance existe lorsque la variance de la réponse est essentiellement une fonction de la moyenne de la réponse. Certains calculs théoriques suggèrent l’utilisation des consignes suivantes comme point de départ pour rechercher une transformation de stabilisation de la variance appropriée :

.

1. Si l’écart-type de la réponse est approximativement proportionnel à la moyenne de la réponse, essayer une transformation logarithmique.

.

2. Si l’écart-type de la réponse est approximativement proportionnel à la puissance $\delta$ de la moyenne de la réponse, essayer la transformation 8.1.2.1 avec $\alpha=1-\delta$ .

.

Quand il y a plusieurs échantillons (et plusieurs valeurs $\bar{y}$ et $s$ ), une manière empirique de déterminer si les consignes 1) ou 2) ci-dessus peuvent être utiles consiste à tracer $\ln (s)$ en fonction de $\ln (\bar{y})$ , puis à voir s’il existe une linéarité approximative. Si tel est le cas, la consigne 1) est appropriée quand la pente est approximativement égale à 1, tandis qu’une pente de $\delta \neq 1$ indique qu’il faut utiliser la consigne 2) et suggère la valeur à utiliser.

8.1.2 Transformations

Transformations pour la régression linéaire

Transformations de variables en modélisation

Transformations et échantillons uniques

Transformations et échantillons multiples

Licence

Partagez ce livre