11.1 Cas d’une matrice de plein rang

Dans cette section, nous développons une formule afin d’obtenir la projection orthogonale dans \({\operatorname{Col}({\mathbf{A}})}\) si \(\mathbf{A}\) est une matrice de plein rang. Le cas où \(\mathbf{A}\) n’est pas nécessairement de plein rang sera discuté lorsque nous aurons discuté des pseudo-inverses.

Soient \(\mathbf{A} \in \mathbb{R}^{m\times n}\) et \(\mathbf{u} \in \mathbb{R}^m\). Rappelons qu’il existe \(\mathbf{y}, \mathbf{z} \in \mathbb{R}^m\) tels que \(\mathbf{u} = \mathbf{y} + \mathbf{z}\), où \(\mathbf{y}\) est la projection orthogonale de \(\mathbf{u}\) dans \({\operatorname{Col}({\mathbf{A}})}\) et \(\mathbf{A}^\mathsf{T}\mathbf{z} = \mathbf{0}.\)

On voit que \(\mathbf{A}^\mathsf{T}\mathbf{u} = \mathbf{A}^\mathsf{T}(\mathbf{y} + \mathbf{z}) = \mathbf{A}^\mathsf{T}\mathbf{y}\). Puisque \(\mathbf{y} \in {\operatorname{Col}({\mathbf{A}})}\), il existe \(\mathbf{w} \in \mathbb{R}^n\) de sorte que \(\mathbf{y} = \mathbf{A}\mathbf{w}\). Il s’ensuit que \[\mathbf{A}^\mathsf{T}\mathbf{u} = \mathbf{A}^\mathsf{T}\mathbf{A} \mathbf{w}.\]

Si \(\mathbf{A}\) est de plein rang, on utilise le fait que \(\mathbf{A}^\mathsf{T}\mathbf{A}\) est inversible (démonstration laissée en exercice) afin d’obtenir que \[\mathbf{w} = (\mathbf{A}^\mathsf{T}\mathbf{A})^{-1} \mathbf{A}^\mathsf{T}\mathbf{u}.\] Ainsi, \[\mathbf{y} = \mathbf{A}\mathbf{w} = \mathbf{A}(\mathbf{A}^\mathsf{T}\mathbf{A})^{-1} \mathbf{A}^\mathsf{T}\mathbf{u}.\]

Posons \[\mathbf{P}_{\mathbf{A}} = \mathbf{A}(\mathbf{A}^\mathsf{T}\mathbf{A})^{-1} \mathbf{A}^\mathsf{T}.\] La projection orthogonale de tout \(\mathbf{u} \in \mathbb{R}^n\) dans \({\operatorname{Col}({\mathbf{A}})}\) est donc \(\mathbf{P}_{\mathbf{A}} \mathbf{u}.\) On appelle \(\mathbf{P}_{\mathbf{A}}\) la matrice de projection associée à \(\mathbf{A}.\)

Exemple 11.1 Soit \(\mathbf{A} = \begin{bmatrix} 1 & 0 \\ 2 & 1 \\ -1 & 2\end{bmatrix}.\) Notons que \(\mathbf{A}\) est de plein rang, et que \({\operatorname{Col}({\mathbf{A}})} = \operatorname{Vect}\left ({ \begin{bmatrix} 1 \\2 \\ -1\end{bmatrix}, \begin{bmatrix} 0 \\ 1 \\ 2\end{bmatrix} } \right).\) Alors, \[\mathbf{P}_{\mathbf{A}} = \mathbf{A}(\mathbf{A}^\mathsf{T}\mathbf{A})^{-1} \mathbf{A}^\mathsf{T} = \begin{bmatrix} \frac{1}{6} & \frac{1}{3} & -\frac{1}{6} \\ \frac{1}{3} & \frac{13}{15} & \frac{1}{15} \\ -\frac{1}{6} & \frac{1}{15} & \frac{29}{30} \end{bmatrix}.\]

Exercices

  1. Soit \(\mathbf{A} \in \mathbb{R}^{n \times n}\) une matrice inversible. Déterminez \(\mathbf{P}_{\mathbf{A}}.\)

  2. Démontrez que si \(\mathbf{A} \in \mathbb{R}^{m\times n}\) est de plein rang, alors \(\mathbf{A}^\mathsf{T}\mathbf{A}\) est inversible.

Solutions

  1. Notons que \[\mathbf{P}_{\mathbf{A}} = \mathbf{A}(\mathbf{A}^\mathsf{T}\mathbf{A})^{-1} \mathbf{A}^\mathsf{T} = \mathbf{A}\mathbf{A}^{-1} (\mathbf{A}^\mathsf{T})^{-1} \mathbf{A}^\mathsf{T}= \mathbf{I}.\]

  2. D’après la décomposition \(\mathbf{A} =\mathbf{Q}\mathbf{R},\)\(\mathbf{Q}\) est orthogonale et \(\mathbf{R}\) est de la forme \(\begin{bmatrix} \mathbf{R'} \\ \mathbf{0}\end{bmatrix},\)\(\mathbf{R'} \in \mathbb{R}^{n\times n}\) est une matrice triangulaire supérieure, nous avons \[\mathbf{A}^\mathsf{T}\mathbf{A} = (\mathbf{Q}\mathbf{R})^\mathsf{T}(\mathbf{Q}\mathbf{R}) = \mathbf{R}^\mathsf{T}\mathbf{Q}^\mathsf{T}\mathbf{Q}\mathbf{R} = \mathbf{R}^\mathsf{T}\mathbf{R} = \mathbf{R'}^\mathsf{T}\mathbf{R'}.\] Puisque \(\mathbf{A}\) est de rang \(n\), \(\mathbf{R'}\) l’est également. Donc, \(\mathbf{R'}\) est inversible, ce qui implique que \(\mathbf{R'}^\mathsf{T}\mathbf{R'}\) est inversible. Ainsi, \(\mathbf{A}^\mathsf{T}\mathbf{A}\) est aussi inversible.