6.1.3 Estimation de la variance pondérée pour les études multi-échantillons

Le modèle de « distributions normales de même variance » 6.1.2.1 présente un paramètre fondamental : \sigma, l’écart-type associé aux réponses des conditions 1,2,3, \ldots, r. À l’image de ce qui a été fait dans le cas r=2 de la partie 5, il est tout à fait typique, dans les études multi-échantillons, de regrouper les variances d’échantillon r pour parvenir à une seule estimation de \sigma dérivée de tous les r échantillons.
DÉFINITION Écart-type pondéré
.
EXPRESSION 6.1.3.1
.
Si r échantillons numériques de tailles respectives n_1, n_2, \ldots, n_{r} produisent des variances d’échantillons s_1^2, s_2^2, \ldots, s_{r}^2, la variance pondérée, s_{\mathrm{P}}^2 est la moyenne pondérée des variances d’échantillons, où les coefficients de pondération équivalent aux tailles des échantillons moins 1 :
.
s_{\mathrm{P}}^2=\frac{\left(n_1-1\right)s_1^2+\left(n_2-1\right) s_2^2+\cdots+\left(n_{r}-1\right) s_{r}^2}{\left(n_1-1\right)+\left(n_2-1\right)+\cdots+\left(n_{r}-1\right)}
.
L’écart-type pondéré des échantillons, s_{\mathrm{P}}, correspond à la racine carrée de s_{\mathrm{p}}^2.

.

La définition 6.1.3.1 élargit simplement celle donnée dans la partie 5 pour l’adapter aux cas à plus de deux échantillons. Comme c’était le cas pour s_{\mathrm{p}} avec deux échantillons, s_{\mathrm{p}} doit se situer entre les valeurs maximum et minimum des s_{i}; c’est une sorte de compromis pratique pour cette valeur sur le plan mathématique.
.
L’équation 6.1.3.1 peut être réécrite sous de nombreuses formes, toutes équivalentes. Avant tout, soit
.
le nombre total d’observations dans le cadre d’une étude à r échantillons
n=\sum_{i=1}^{r} n_{i}=\text { le nombre total d’observations sur tous les } r \text { échantillons }
.
Il est courant de réécrire le dénominateur à la droite de l’équation 6.1.3.1 comme suit :
.
\sum_{i=1}^{r}\left(n_{i}-1\right)=\sum_{i=1}^{r} n_{i}-\sum_{i=1}^{r} 1=n-r
.
Comme la variance de l’échantillon i vaut :
.
s_{i}^2=\frac{1 }{n_{i}-1} \sum_{j=1}^{n_{i}}\left(y_{i j}-\bar{y}_{i}\right)^2
.
Le numérateur à la droite de l’équation 6.1.3.1 est :
.

6.1.3.2 et 6.1.3.3

\begin{aligned}\sum_{i=1}^{r}\left(n_{i}-1\right)\left(\frac{1 }{\left(n_{i}-1\right)} \sum_{j=1}^{n_{i}}\left(y_{i j}-\bar{y}_{i}\right)^2\right) & =\sum_{i=1}^{r} \sum_{j=1}^{n_{i}}\left(y_{i j}-\bar{y}_{i}\right)^2 \\& =\sum_{i=1}^{r} \sum_{j=1}^{n_{i}} e_{i j}^2\end{aligned}

.

Autres formules pour s_{P}^2
.
On peut donc définir s_{\mathrm{P}}^2 en fonction du côté droit de l’équation 6.1.3.2 ou 6.1.3.3 divisé par n-r.

Exemple 6.1.3.1 Résistance à la compression (suite)

Pour les données de résistance à la compression, chacune des valeurs n_1, n_2, \ldots, n_8 vaut 3, et les valeurs s_1 à s_8 sont données dans le tableau 6.1.2.1. Donc en utilisant l’équation 6.1.3.1,
.
\begin{aligned} s_{\mathrm{P}}^2 & =\frac{(3-1)(965,6)^2+(3-1)(432,3)^2+\cdots+(3-1)(302,5)^2}{(3-1)+(3-1)+\cdots+(3-1)} \\ & =\frac{2\left[(965,6)^2+(432,3)^2+\cdots+(302,5)^2\right]}{16 } \\ & =\frac{2 705 705}{8 } \\ & =338 213(\mathrm{psi})^2 \end{aligned}
.
et par conséquent
.
s_{\mathrm{P}}=\sqrt{338 213 }=581,6 \mathrm{psi}
.
On estime que si un grand nombre d’échantillons de n’importe laquelle des formules 1 à 8 était testé, on obtiendrait un écart-type des résistances à la compression de l’ordre de 582 psi.
Signification de s_{P}

s_{\mathrm{P}} est une estimation de la variation intrinsèque ou de référence d’une variable étudiée pour un ensemble de conditions fixe, calculée en supposant que cette variation de référence est constante dans les conditions dans lesquelles les échantillons ont été prélevés. Lorsque cette supposition est raisonnable, l’idée de la pondération est de combiner plusieurs estimations de petits échantillons (non fiables séparément) pour obtenir une seule estimation relativement plus fiable. C’est une mesure fondamentale très appliquée dans de nombreuses méthodes efficaces d’inférence formelle.

Limites de confiance pour la variance du modèle à un facteur
Parfois, en plus d’une estimation de \sigma^2 basée sur des données, on a également besoin d’un intervalle de confiance. Avec les restrictions du modèle 6.2.1.1, la variable
.
\frac{(n-r) s_{\mathrm{P}}^2}{\sigma^2}
.
suit une distribution \chi_{n-r}^2. Ainsi, de la même façon que pour la dérivation de la partie 5, l’intervalle de confiance bilatéral pour [latex]\sigma^2[/latex] a pour bornes</div>
<div>.</div>
<blockquote>
<div><strong>6.1.3.4          </strong>[latex]\frac{(n-r) s_{\mathrm{P}}^2}{U} \text { et } \frac{(n-r) s_{\mathrm{P}}^2}{L}
L et U sont telles que la probabilité \chi_{n-r}^2 assignée à l’intervalle (L, U) correspond au niveau de confiance souhaité. Et bien sûr, on peut obtenir un intervalle unilatéral en utilisant uniquement l’une des bornes 6.1.3.4 et en choisissant une valeur U ou L telle que la probabilité \chi_{n-r}^2 assignée à l’intervalle [latex](0, U)[/latex] ou (L, \infty) correspond au niveau de confiance souhaité.

Exemple 6.1.3.2 (suite)

Dans le cas de la résistance à la compression du béton, utilisons l’équation 6.1.3.4 pour obtenir un intervalle de confiance bilatéral de 90 \% pour \sigma. Étant donné que n-r=16 degrés de liberté sont associés à s_{\mathrm{P}}^2, on consulte le tableau A1.4 pour les quantiles 0,05 et 0,95 de la distribution \chi_{16 }^2. On lit alors respectivement 7,962 et 26,296. Ainsi, l’intervalle de confiance pour \sigma^2 a pour bornes
.
\frac{16(581,6)^2}{26,296} \text { et } \frac{16(581,6)^2}{7,962}
.
L’intervalle de confiance bilatéral de 90 \% pour \sigma a pour bornes
.
\sqrt{\frac{16(581,6)^2}{26,296}} \text { et } \sqrt{\frac{16(581,6)^2}{7,962}}
.
soit :
.
453,7 \mathrm{psi} \text { et } 824,5 \mathrm{psi}

 

Licence

Introduction aux méthodes statistiques en ingénierie© par C. Bassim et Bryan Lee. Tous droits réservés.

Partagez ce livre