8.2.2 Algèbre matricielle et régression multiple

L’algèbre matricielle est largement utilisée pour effectuer des régressions multiples, car elle permet de représenter l’analyse de régression de manière compacte et intuitive. Par exemple, un modèle de régression multiple estimé en notion scalaire s’exprime comme suit : Y = A + B_1 X_1 + B_2 X_2 + B+_3 X_3 + E. En utilisant la notation matricielle, la même équation peut être exprimée sous une forme plus compacte et (étonnamment!) plus intuitive : y = X b + e.
.
En plus, la notation matricielle est flexible puisqu’elle peut traiter n’importe quel nombre de variables indépendantes. Les opérations effectuées sur la matrice modélisant X sont réalisées simultanément sur toutes les variables indépendantes. Enfin, vous verrez que l’expression matricielle est largement utilisée dans les présentations statistiques des résultats de l’analyse des MCO. Pour toutes ces raisons, on commence donc par développer la régression multiple sous forme de matrice.
.

 Fondements de l’algèbre matricielle

Une matrice est un tableau rectangulaire de nombres disposés en lignes et en colonnes. Comme nous l’avons dit, les opérations effectuées sur les matrices le sont simultanément sur tous les éléments de la matrice. Cette section présentera les notions de base de l’algèbre matricielle nécessaires pour comprendre l’expression de la régression multiple sous forme matricielle.
Fondements des matrices
Les nombres composant une matrice sont appelés « éléments ». Les éléments d’une matrice peuvent être identifiés par leur position dans une ligne et une colonne, désignées par A_{l, c}. Dans l’exemple suivant, m fait référence à la ligne de la matrice et n fait référence à la colonne.
.
A_{m, n} = \left[\begin{array}{cccc}a_{1,1} & a_{1,2} & \cdots & a_{1, n} \\ a_{2,1} & a_{2,2} & \cdots & a_{2, n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m, 1} & a_{m, 2} & \cdots & a_{m, n}\end{array}\right]
.
Par conséquent, dans la matrice suivante,
A = \left[\begin{array}{ccc}10 & 5 & 8 \\ -12 & 1 & 0\end{array}\right]
.
a_{2,3} = 0 et a_{1,2} = 5.
.
 Vecteurs
Un vecteur est une matrice composée d’une seule colonne ou d’une seule ligne. Par exemple :
.
A = \left[\begin{array}{c}6 \\ -1 \\ 8 \\ 11\end{array}\right]
.
ou
.
A = \left[\begin{array}{llll}1 & 2 & 8 & 7\end{array}\right]
Opérations matricielles
Plusieurs « opérations » peuvent être effectuées avec et sur les matrices. La plupart d’entre elles peuvent être calculées à l’aide de Python; nous utiliserons donc cet exemple tout au long du parcours.
Consultez le référentiel spécial GitHub sur le site interactif Binder pour un tutoriel sur la régression linéaire multiple à l’aide d’un ensemble de données de fils qui vous guidera à travers les concepts et l’utilisation des opérations matricielles pour ajuster le modèle.
Comme toujours, ce référentiel peut être téléchargé sur le site GitHub du cours.
Sources

Le contenu des chapitres 8.2.1.1 et 8.2.2.2 est issu de l’ouvrage « Quantitative Research Methods for Political Science, Public Policy and Public Administration : 4th Edition With Applications in R », de Hank Jenkins-Smith, Joseph Ripberger, Gary Copeland, Matthew Nowlin, Tyler Hughes, Aaron Fister, Wesley Wehde, et Josie Davis, consultable à l’adresse https://bookdown.org/ripberjt/qrmbook/.  Cet ouvrage est partagé en vertu d’une licence Creative Commons Attribution 4.0 International (CC BY 4.0).

Licence

Introduction aux méthodes statistiques en ingénierie© par C. Bassim et Bryan Lee. Tous droits réservés.

Partagez ce livre