7.2.2 Inférence du paramètre de pente

Dans les applications du modèle de régression linéaire simple (équation 7.2.1.1) où x représente une variable qui peut être physiquement manipulée, le paramètre de pente \beta_1 est d’un intérêt fondamental. Il représente le taux de variation de la réponse moyenne par rapport à x et détermine l’incidence d’une variation de x sur la sortie du système. L’inférence de \beta_1 est assez simple, parce que b_1 (la pente de la droite des moindres carrés) hérite des propriétés de distribution du modèle. Ainsi, selon le modèle 7.2.1.1, b_1 suit une distribution normale avec

E (b_1)=\beta_1

et

7.2.2.1                                                    \operatorname{Var (b_1)}=\frac{\sigma^2}{\sum(x-\bar{x})^2}

ce qui signifie que

Z=\frac{b_1-\beta_1}{\frac{\sigma}{\sqrt{\sum(x-\bar{x})^2}}}

suit une distribution normale réduite. D’une manière similaire à de nombreux arguments des parties 5 et 6, cela explique le fait que la quantité

7.2.2.2                                  T=\frac{b_1-\beta_1}{\frac{s_{\mathrm{LF}}}{\sqrt{\sum(x-\bar{x})^2}}}

suit une distribution t_{t-2}. Les arguments standard de la partie 5 appliqués à l’expression 7.2.2.2 montrent alors que

7.2.2.3                                \mathrm{H}_0: \beta_1=\#

peut être testée à l’aide de la statistique de test (aussi appelée variable de décision)

7.2.2.4 Statistique de test pour \mathrm{H}_0: \beta_1=\# 

 

T=\frac{b_1-\#}{\frac{s_{\mathrm{LF}}}{\sqrt{\sum(x-\bar{x})^2}}}

 

et une distribution de référence t_{n-2}.  Plus important encore, dans le cadre du modèle de régression
linéaire simple (équation 7.2.1.2), un intervalle de confiance bilatéral pour \beta_1 peut être établi avec
les bornes suivantes :

7.2.2.5 Limites de confiance pour la pente \beta_1

 

b_1 \pm t \frac{s_{\mathrm{LF}}}{\sqrt{\sum(x-\bar{x})^2}}

 

où le niveau de confiance associé correspond à la probabilité assignée à l’intervalle entre -t et t dans la distribution t_{n-2}. Un intervalle de confiance unilatéral est établi de la manière habituelle, en utilisant une seule borne dans l’équation 7.2.2.5.

Exemple 7.2.2.1 Étude sur le pressage de la poudre (suite)

Dans l’étude du pressage de poudre, nous avons vu au module 7.1 que la pente de la droite des moindres carrés passant par les données de pression et de densité est la suivante :

b_1=0,000048 \overline{ 6}(\mathrm{~g} / \mathrm{cc}) / \mathrm{psi}

Un intervalle de confiance bilatéral de 95 % pour \beta_1 peut être établi en utilisant le quantile 0,975 de la distribution t_{ 13} dans l’équation 7.2.2.5. On peut donc utiliser les bornes

0,000048 \overline{ 6} \pm 2,160 \frac{0,0199}{\sqrt{120 000 000}}

soit

0,000048 \overline{ 6} \pm 0,0000039

ou

0,0000448(\mathrm{~g} / \mathrm{cc}) / \mathrm{psi} \text { et } 0,0000526(\mathrm{~g} / \mathrm{cc}) / \mathrm{psi}

Un intervalle de confidence comme celui-ci de \beta_1 peut être converti en un intervalle de confiance pour une différence de réponses moyennes pour deux valeurs différentes de x. Selon le modèle 7.2.1.2, deux valeurs de x qui diffèrent de \Delta x ont des réponses moyennes qui diffèrent de \beta_1 \Delta x . Pour obtenir un intervalle de confidence pour la différence des réponses moyennes, il suffit alors de multiplier les bornes de l’intervalle de confidence pour \beta_1 par \Delta x. Par exemple, puisque 8 000 – 6 000 = 2 000, la différence entre les densités moyennes à 8 000 psi et à 6 000 psi a un intervalle de confidence de 95 % avec les bornes

2 000(0,0000448) \mathrm{g} / \mathrm{cc} \text { et } 2 000(0,0000526) \mathrm{g} / \mathrm{cc}

soit

0,0896 \mathrm{~g} / \mathrm{cc} \text { et } 0,1052 \mathrm{~g} / \mathrm{cc}

Points à prendre en considération pour la sélection des valeurs de x

L’équation 7.2.2.5 indique la précision de la pente de la droite des moindres carrés. Il est utile de se demander comment cette précision est liée aux caractéristiques de l’étude qu’on peut potentiellement contrôler. Les équations 7.2.2.1 et 7.2.2.5 indiquent toutes deux que plus \sum(x-\bar{x})^2 est élevée (c’est-à-dire plus les valeurs x_i sont dispersées), plus b_1 est une estimation précise de la pente sous-jacente \beta_1. Ainsi, pour estimer \beta_1, dans les études où x représente la valeur d’une variable de système contrôlable, il convient de choisir les paramètres de x ayant la plus grande variance d’échantillon possible. (En fait, si l’on dispose de n observations à utiliser et que l’on peut choisir des valeurs de x n’importe où dans un intervalle [a,b], en prendre \frac{n}{ 2} à x=a et \frac{n}{ 2} à x=b donne la meilleure précision possible pour estimer la pente \beta_1.)

Toutefois, ce conseil (éloigner les x_i) doit être pris avec un grain de sel. La relation approximativement linéaire (équation 7.2.1.2) peut ne s’appliquer qu’à une plage limitée de valeurs de x. Si on veut obtenir une bonne estimation de la pente, il est évidemment insensé de choisir des valeurs expérimentales de x au-delà des limites où l’on peut raisonnablement s’attendre à ce que l’équation 7.2.1.2 s’applique. Il est également important de comprendre que l’estimation précise de \beta_1 reposant sur les hypothèses du modèle 7.2.1.2 n’est pas le seul élément à prendre en considération lors de la planification de la collecte des données. Il est généralement aussi important d’être en mesure de dire quand la forme linéaire de l’équation 7.2.1.2 est inappropriée. Pour cela, il faut recueillir des données pour un plusieurs valeurs différentes de x, et non pas simplement pour les valeurs les plus faibles et les plus élevées
possibles.

Licence

Introduction aux méthodes statistiques en ingénierie© par C. Bassim et Bryan Lee. Tous droits réservés.

Partagez ce livre