5.2.3. Comparaisons de deux moyennes sur un petit échantillon (basée sur des échantillons indépendants suivant une distribution normale)

Les dernières méthodes d’inférence présentées dans cette section correspondent à la différence entre deux moyennes dans les cas où au moins l’une des deux tailles d’échantillon n_1 et n_2 est petite. Toute la discussion se limitera à des cas où les observations sont normales. En fait, les méthodes les plus directes sont réservées aux cas où, en plus, les deux écarts-types sous-jacents sont comparables. Nous commencerons celles-là.

Vérification graphique de la plausibilité du modèle

Un moyen de vérifie sommairement la plausibilité des suppositions du modèle « distributions normales, même variance » consiste à effectuer un tracé normal de deux échantillons sur le même ensemble d’axes, en vérifiant non seulement la linéarité approximative, mais aussi l’égalité approximative de la pente.

Exemple 5.2.3.1 (suite)

Les données de W. Armstrong sur la durée de vie des ressorts (figurant dans l’ouvrage de Cox et Oakes) concernent non seulement la longévité des ressorts sous une contrainte de 950 N/mm^2 mais aussi sous une contrainte de 900 N/mm^2. Le tableau 5.2.3.1 reprend les données de 950 N/mm^2 précédentes et y ajoute celles pour la contrainte de 900 N/mm^2.

 

Tableau 5.2.3.1

La figure 5.2.3.1 montre des tracés normaux pour les deux échantillons sur un seul ensemble d’axes. Compte tenu du type de variation de la linéarité et de la pente que présentent les tracés normaux pour des échantillons de cette taille (n = 10) issus d’une distribution normale unique, la figure 5.2.3.1 ne constitue nullement une preuve solide contre la pertinence d’un modèle de « variances égales, distributions normales » pour la durée de vie des ressorts.

 

Figure 5.2.3.1 Tracés normaux de la durée de vie des ressorts sous
deux contraintes différentes

Variance pondérée d’un échantillon

Si on suppose que \sigma_1 = \sigma_2, la valeur commune se nomme σ, et il apparaît logique que s_1 et s_2 se rapprochent tous deux de σ. Cela suggère qu’il faudrait les combiner pour obtenir une estimation unique de la variation réelle. Il s’avère que la convention mathématique impose une méthode particulière de combinaison ou de pondération des s individuels afin d’obtenir une estimation unique de σ.

DÉFINITION Variance pondérée d’un échantillon sp^2 

EXPRESSION 5.2.3.1

Si deux échantillons numériques de tailles respectives n_1 et n_2 produisent des variances d’échantillon respectives s_1^2 et s_2^2, la variance pondérée de l’échantillon, sp^2 est la moyenne pondérée de s_1^2 et s_2^2 où les coefficients de pondération correspondent aux tailles d’échantillon moins 1. Autrement dit,

s_{\mathrm{P}}^2=\frac{\left(n_1-1\right) s_1^2+\left(n_2-1\right) s_2^2}{\left(n_1-1\right)+\left(n_2-1\right)}=\frac{\left(n_1-1\right) s_1^2+\left(n_2-1\right) s_2^2}{n_1+n_2-2}

L’écart type pondéré de l’échantillon s_P est égal à la racine carrée de sp^2 .

s_P est une sorte de moyenne de s_1 et de s_2 qui se trouve forcément entre s_1 et s_2. Sa forme exacte est davantage dictée par souci de convention mathématique que par une intuition logique.

Exemple 5.2.3.2 (suite)

Dans le cas de la durée de vie des ressorts, en choisissant arbitrairement de désigner 900 N/mm^2 la condition 1 et 950 N/mm^2 la condition 2, on obtient [latex]s_1 = 42,9 \cdot 10^3[/latex] cycles et s_2 = 33,1 \cdot 10^3 cycles. En regroupant les deux variances de l’échantillon par l’équation 5.2.3.1, on obtient :

s_{\mathrm{P}}^2=\frac{(10-1)(42,9)^2+(10-1)(33,1)^2}{(10-1)+(10-1)}=1 468 \cdot 10^3 \text { cycles}^2

Puis, en prenant la racine carrée, on trouve :

s_{\mathrm{P}}=\sqrt{ 1468}= 38,3 \cdot10^3 \text { cycles }

Selon l’argument conduisant aux méthodes d’inférence à grand échantillon pour \mu_1 – \mu_2, la quantité

Z=\frac{\bar{x}_1-\bar{x}_2-\left(\mu_1-\mu_2\right)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}

a été brièvement examinée. Lorsque \sigma_1 = \sigma_2 = σ, cette variable peut être réécrite comme suit :

5.2.3.3                    Z=\frac{\bar{x}_1-\bar{x}_2-\left(\mu_1-\mu_2\right)}{\sigma \sqrt{\frac{ 1}{n_1}+\frac{1 }{n_2}}}

On peut exploiter le fait que la variable 5.2.3.3 est normale réduite pour produire des méthodes d’estimation des intervalles de confiance et de tests d’hypothèse. Or, leur utilisation nécessiterait le paramètre σ. Par conséquent, plutôt que de commencer par l’expression 5.2.3.3, il est courant de remplacer σ dans l’expression (5.2.3.3) par s_P et de commencer par la quantité

5.2.3.4                    T=\frac{\left(\bar{x}_1-\bar{x}_2\right)-\left(\mu_1-\mu_2\right)}{s_{\mathrm{P}} \sqrt{\frac{ 1}{n_1}+\frac{ 1}{n_2}}}

La variable 5.2.3.4 a été construite expressément pour que, selon les suppositions du modèle actuel, elle suive une distribution de probabilité connue et représentée dans un tableau : la distribution t avec v = (n_1 – 1) + (n_2 – 1) = n_1 + n_2-2 degrés de liberté. (On peut remarquer que les n_1-1 degrés de liberté associés au premier échantillon s’ajoutent aux n_2-1 degrés de liberté associés au second pour produire n_1+n_2-2 degrés de liberté au total.) Ainsi, toujours au moyen du type de raisonnement développé dans les modules 5.1 et 5.2, on peut obtenir des méthodes d’inférence pour alt\mu_1-alttitle\mu_1-title\mu_2. Autrement dit, un intervalle de confiance bilatéral pour la différence \mu_1-\mu_2, basé sur des échantillons indépendants provenant de distributions normales de même variance, aura pour bornes

EXPRESSION 5.2.3.5 Bornes confiance pour \mu_1-\mu_2 suivant des distributions normales avec \sigma_1 = \sigma_2

\bar{x}_1-\bar{x}_2 \pm t s_{\mathrm{P}} \sqrt{\frac{ 1}{n_1}+\frac{ 1}{n_2}}

dans laquelle on choisit t de sorte que la probabilité que la distributiont_{n_1+n_2-2} attribue à l’intervalle entre -t et t correspond à la confiance souhaitée. Dans les mêmes conditions, l’hypothèse

\mathrm{H}_0: \mu_1-\mu_2=\#

peut être testée à l’aide de la statistique

EXPRESSION 5.2.3.6 Statistique de test pour\mu_1-mu_2 suivant des distributions normales avec \sigma_1 = \sigma_2

T=\frac{\bar{x}_1-\bar{x}_2-\#}{s_{\mathrm{P}} \sqrt{\frac{ 1}{n_1}+\frac{1 }{n_2}}}

et d’une distribution t_{n_1+n_2-2} de référence.

Exemple 5.2.3.3 (suite)

Reprenons le cas de la durée de vie des ressorts pour illustrer l’inférence pour deux moyennes avec des petits échantillons. Tout d’abord, testons l’hypothèse d’une moyenne de durée de vie égale, avec l’hypothèse alternative que la contrainte plus faible conduit à une durée de vie plus longue. Ensuite, établissons un intervalle de confiance bilatéral à 95 % pour la différence entre les moyennes de durée de vie.

En continuant à désigner la contrainte de 900 N/mm^2 condition 1 et la contrainte de 950 N/mm^2 condition 2, à partir du tableau 5.3.3.1, on obtient \bar{x}_1 = 215,1 et \bar{x}_2 = 168,3 et s_P = 38,3 (comme nous l’avons vu précédemment). Ainsi, le modèle de test d’hypothèse en cinq étapes donne ceci :

1. \mathrm{H}_0: \mu_1-\mu_2=0

2. image0 . » title= »\mathrm{H}_{\mathrm{a}}: \mu_1-\mu_2>0 . » class= »latex mathjax »>

(Par raisonnement physique, on s’attend à ce que la condition 1 produise des durées de vie plus longues.)

3.La statistique de test est la suivante :            

T=\frac{\bar{x}_1-\bar{x}_2-0}{s_{\mathrm{P}} \sqrt{\frac{ 1}{n_1}+\frac{ 1}{n_2}}}

La distribution de référence est t, avec 10 + 10 – 2 = 18 degrés de liberté, et un grand t observé constituera une preuve contre H_0.

4.Les échantillons donnent

t=\frac{215,1-168,3-0}{38,3 \sqrt{\frac{ 1}{ 10}+\frac{ 1}{ 10}}}=2,7

5. Le seuil de signification observé [latex]P[\text{une variable aléatoire } t_{ 18} \geq 2,7][/latex] se situe entre 0,01 et 0,005, ce qui constitue une preuve solide que la contrainte faible est associée à une durée de vie plus élevée en moyenne.

Par la suite, si on utilise l’expression 5.2.3.5 pour produire un intervalle de confiance bilatéral à 95 %, t correspond au quantile 0,975 de la distribution t_{ 18}. Les bornes de l’intervalle de confiance pour \\mu_1 – \mu_2 sont les suivantes :

(215,1-168,3) \pm 2 101(38,3) \sqrt{\frac{ 1}{ 10}+\frac{ 1}{ 10}}

soit :

46,8,\pm,36,0

ou encore :

10,8 \times 10^3 \text { cycles et } 82,8 \times 10^3 \text { cycles }

Les données du tableau 5.2.3.1 fournissent suffisamment d’informations pour confirmer qu’une contrainte plus forte entraîne une réduction de la moyenne de durée de vie des ressorts. Mais bien que l’ampleur apparente de cette réduction lors du passage de 900 N/mm^2 (condition 1) à 950 N/mm^2 (condition 2) soit de 46,8   10³ cycles, la variabilité présente dans les données est suffisamment grande (et la taille des échantillons suffisamment petite) pour que seule une précision de ±36,0 · 10³ cycles puisse être rattachée à cette différence.

Inférence pour \mu_1 – \mu_2 sans la supposition \sigma_1 = \sigma_2 (n = petit)

Il n’existe pas de réponse pleinement satisfaisante quant à la manière de réaliser l’inférence pour µ1 – µ2 lorsque l’on ne peut pas supposer que \sigma_1 = \sigma_2. La méthode la plus répandue (mais approximative) pour résoudre ce problème est celle de Satterthwaite, qui se rapproche de la formule pour les grands échantillons (voir la section 5.2.1). Autrement dit, si les bornes de la section 5.2.1 ne conviennent pas lorsque altn_1alttitlen_1title ou n_2 est petit (elles ne produisent pas de niveaux de confiance réels à proximité du niveau nominal), il faut les modifier. Soit

EXPRESSION 5.3.3.7 « Degrés de liberté estimés » de Satterthwaite

\hat{v}=\frac{\left(\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}\right)^2}{\frac{s_1^4}{\left(n_1-1\right) n_1^2}+\frac{s_2^4}{\left(n_2-1\right) n_2^2}}

Pour un niveau de confiance souhaité, supposons que \hat{t} est telle que la distribution t avec alt\hat{v}alttitle\hat{v}title degrés de liberté attribue la probabilité correspondante à l’intervalle entre \hat{-t} et \hat{t}. Ainsi, les deux bornes

EXPRESSION 5.2.3.8 Bornes de confiance pour \mu_1-\mu_2 avec la distribution normale (approximative) de Satterthwaite

\bar{x}_1-\bar{x}_2 \pm \hat{t} \sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}

peuvent servir de bornes de confiance pour \mu_1 – \mu_2 avec un niveau de confiance approximativement égal à celui souhaité. (On peut utiliser une seul des bornes 5.2.3.8 pour obtenir un intervalle de confiance unilatéral en divisant le niveau de « non-confiance » par deux.)

Exemple 5.2.3.4 (suite)

Armstrong a collecté des données sur la durée de vie des ressorts soumis à d’autres contraintes que 900 et 950 N/mm^2 utilisés jusqu’à présent dans cet exemple. Dix ressorts testés à 850 N/mm^2 présentaient des durées de vie correspondant à \bar{x} = 348,1 \text{ et }s=57,9 (chacune en 10³ cycles) et un tracé normal relativement linéaire. Mais si on examine ensemble les données de 850, 900 et 950 N/mm^2, on voit clairement que les durées de vie deviennent plus courtes et plus uniformes à mesure qu’on augmente la contrainte. Si on compare les moyennes des durées de vie sous les contraintes de 850 et 950 N/mm^2, la supposition d’une variance constante semble douteuse.

On peut alors examiner ce que la méthode de Satterthwaite (expression 5.2.3.8) donne comme bornes de confiance bilatérales approximatives à 95 % pour la des moyennes à 850 et à 950 N/mm2. L’équation 5.2.2.7 donne :

\hat{v}=\frac{\left(\frac{(57,9)^2}{ 10}+\frac{(33,1)^2}{ 10}\right)^2}{\frac{(57,9)^4}{9(100)}+\frac{(33,1)^4}{9(100)}}=14,3

En arrondissant les « degrés de liberté » à l’entier inférieur, le quantile 0,975 de la distribution t_14 est donc 2,145. Les bornes à 95 % de l’expression 5.3.3.8 pour la différence (850N/mm^2-950 N/mm^2) des moyennes de durées de vie (\mu_{ 950}}) sont donc les suivantes :

348,1-168,3 \pm 2,145 \sqrt{\frac{(57,9)^2}{ 10}+\frac{(33,1)^2}{ 10}}

soit :

179,8 \pm 45,2

ou encore :

134,6 \times 10^3 \text { cycles et } 225,0 \times 10^3 \text { cycles }

Remarques au sujet des méthodes sur petits échantillons

Les méthodes exposées dans cette section sont les dernières méthodes d’inférence standard pour les moyennes de un ou deux échantillons. Nous étudierons maintenant une méthode parallèle pour les variances.   Toutefois, avant de passer à la prochaine section, il convient de faire un dernier commentaire sur les méthodes pour les les petits échantillons.

Nous avons vu qu’à proprement parler, les propriétés nominales (en ce qui concerne les probabilités de couverture pour les intervalles de confiance et les déclarations de valeur p des tests d’hypothèse) des méthodes pour les petits échantillons reposent sur l’hypothèse que les distributions sous-jacentes sont exactement normales et, dans le cas des méthodes 5.2.3.5 et 5.2.3.6, que les variances sont exactement égales. D’autre part, lorsqu’on a utilisé ces méthodes, des vérifications plutôt rudimentaires des tracés de probabilité ont été utilisées à des fins de vérification (seulement) du caractère à peu près plausible des modèles. Selon la théorie statistique conventionnelle, les méthodes pour petits échantillons exposées ici présentent un degré de fiabilité considérable, sauf en cas d’écarts flagrants par rapport aux suppositions du modèle. Autrement dit, tant que les suppositions du modèle représentent à peu près la réalité, les niveaux de confiance nominaux et les valeurs p resteront raisonnablement corrects. (Par exemple, une méthode d’intervalle de confiance nominale de 90 % peut en réalité correspondre à un intervalle de confiance de 80 %, mais pas à un intervalle de confiance de 20 %.) Par conséquent, l’utilisation des graphiques que nous avons faite ici représente généralement une mesure de précaution adéquate contre l’application injustifiée des méthodes d’inférence pour les moyennes de petits échantillons.

Licence

Introduction aux méthodes statistiques en ingénierie© par C. Bassim et Bryan Lee. Tous droits réservés.

Partagez ce livre