2.2.3 Statistiques et paramètres

À ce stade, il est important de présenter un peu plus de terminologie de base. Le jargon et les notations des distributions d’échantillons sont quelque peu différents de ceux des distributions de population (et des distributions théoriques).

DÉFINITION 2.2.3.1. Statistiques et paramètres

Les synthèses numériques des données d’échantillons sont nommées statistiques d’échantillon. Les synthèses numériques de distribution de population ou théoriques sont nommées paramètres (de population ou de modèle). Généralement, on utilise les lettres latines pour les statistiques, et les lettres grecques pour les paramètres.

Prenons l’exemple de la moyenne. La définition 2.2.1.1 porte spécifiquement sur le calcul pour un échantillon. Si un ensemble de données représente une population entière, il est courant d’utiliser la lettre grecque minuscule mu (\mu) pour représenter la moyenne de la population et de noter :
Moyenne de la population  2.2.3.2.                    \mu=\frac{N} \sum_{i=1}^{N} x_{i}
Si on compare cette expression à celle de la définition 2.2.1.1, on remarque que le symbole utilisé pour la moyenne est différent, et qu’on utilise N plutôt que n. Il est courant de désigner la taille d’une population par N et la taille d’un échantillon par n.
Un autre exemple de l’utilisation suggérée par la définition 2.2.3.1 est celui de la variance et de l’écart-type. La définition 2.2.1.2 porte spécifiquement sur la variance et sur l’écart-type de l’échantillon. Si un ensemble de données représente une population entière, il est courant d’utiliser la lettre grecque sigma minuscule au carré (\left(\sigma^\right)) pour représenter la variance de la population et pour définir:
Variance de la population  2.2.3.3.                 
\sigma^2=\frac{N} \sum_{i=1}^N\left(x_i-\mu\right)^2
La racine carré positive de \sigma^ correspond donc à l’écart-type de la population, \sigma.
Ce manuel s’écarte de la convention de symbolisme romain/grec exposée dans la définition 2.2.3.1 sur un point : la notation des quantiles. Nous utilisons Q(p) pour représenter le quantile p d’une distribution, qu’elle soit extraite d’un échantillon, d’une population ou d’un modèle théorique.

Licence

Introduction aux méthodes statistiques en ingénierie© par C. Bassim et Bryan Lee. Tous droits réservés.

Partagez ce livre