7.4 Diagonalisation

Soit \(\mathbf{A} \in \mathbb{C}^{n \times n}\). On dit que \(\mathbf{A}\) est diagonalisable si \(\mathbf{A} = \mathbf{P}\mathbf{D}\mathbf{P}^{-1}\), où \(\mathbf{P}\in \mathbb{C}^{n \times n}\) est une matrice inversible et \(\mathbf{D} \in \mathbb{C}^{n\times n}\) est une matrice diagonale.

Proposition 7.3 Soit \(\mathbf{A} \in \mathbb{C}^{n \times n}\). \(\mathbf{A}\) est diagonalisable si et seulement si pour chaque valeur propre \(\lambda\) de \(\mathbf{A},\) la multiplicité algébrique de \(\lambda\) est égale à sa multiplicité géométrique.

De façon équivalente, \(\mathbf{A}\) est diagonalisable si la somme des multiplicités géométriques de ses valeurs propres donne \(n.\)

Exemple 7.3 Soit \(\mathbf{A} = \begin{bmatrix} 1 & 2\\ 0 & 1\end{bmatrix}.\) Notons que \(\chi_{\mathbf{A}}(\lambda) = (1-\lambda)^2.\) La seule valeur propre de \(\mathbf{A}\) est donc \(1.\) De plus, \(\mathbf{A} - \mathbf{I} = \begin{bmatrix} 0 & 2\\ 0 & 0\end{bmatrix}.\) La nullité de cette matrice est \(1,\) ce qui implique que la multiplicité géométrique est \(1\) et non \(2.\) \(\mathbf{A}\) n’est alors pas diagonalisable.

Exemple 7.4 Soit \(\mathbf{A} = \begin{bmatrix} 4 & 0 & -2\\ 2 & 5 & 4\\ 0 & 0 & 5\end{bmatrix}.\) Notons que \(\chi_{\mathbf{A}}(\lambda) = (4-\lambda)(5-\lambda)^2.\) Les valeurs propres sont \(4\) et \(5.\)

La multiplicité géométrique de \(4\) est \(1\) puisque la multiplicité géométrique ne peut être nulle et ne peut excéder la multiplicité algébrique de \(4\), qui est de \(1.\)

Notons ensuite que \(\mathbf{A} - 5\mathbf{I} = \begin{bmatrix} -1 & 0 & -2 \\ 2 & 0 &4 \\ 0 & 0 & 0 \end{bmatrix}.\) Cette matrice est de rang \(1\) puisque la deuxième ligne est un multiple de la première ligne et que la troisième ligne est nulle. La nullité de \(\mathbf{A}-5\mathbf{I}\) est alors \(2,\) ce qui implique que la multiplicité géométrique de la valeur propre \(5\) est \(2.\)

La matrice \(\mathbf{A}\) est diagonalisable puisque la somme des multiplicités géométrique est \(3.\)

7.4.1 Trouver \(\mathbf{P}\) et \(\mathbf{D}\)

Maintenant que nous savons que la matrice \(\mathbf{A}\) de l’exemple 7.4 est diagonalisable, comment trouve-t-on \(\mathbf{P}\) et \(\mathbf{D}\)?

Premièrement, observons que \(\mathbf{A}= \mathbf{P}\mathbf{D}\mathbf{P}^{-1}\) peut se réécrire sous la forme \(\mathbf{A}\mathbf{P} = \mathbf{P}\mathbf{D}\). La \(i\)-ième colonne du côté gauche est donnée par \(\mathbf{A}\mathbf{P}_i\), où \(\mathbf{P}_i\) dénote la \(i\)-ième colonne de \(\mathbf{P}\), et la \(i\)-ième colonne du côté droit est donnée par \(\mathbf{P}\mathbf{D}_i\). Puisque \(\mathbf{D}\) est une matrice diagonale, \(\mathbf{P}\mathbf{D}_i = d_{i,i} \mathbf{P}_i.\) Ainsi, \(\mathbf{P}_i\) doit être un vecteur propre ayant \(d_{i,i}\) en tant que valeur propre. Puisque \(\mathbf{P}\) doit être inversible, il doit y avoir \(n\) vecteurs propres linéairement indépendants. C’est pourquoi la somme des multiplicités géométriques doit être égale à \(n.\)

Pour construire \(\mathbf{D},\) il suffit de créer une liste de toutes les valeurs propres, incluant les valeurs propres multiples. L’ordre est sans importance. Une valeur propre de multiplicité algébrique \(k\) apparaît \(k\) fois dans la liste. La matrice \(\mathbf{D}\) est obtenu en plaçant les valeurs propres de la liste sur la diagonale.

Dans notre exemple, la liste pourrait être \(4,5,5\). Nous aurions donc \(\mathbf{D} = \begin{bmatrix} 4 & 0 & 0\\ 0 & 5 & 0\\0 & 0 & 5\end{bmatrix}.\)

Pour construire \(\mathbf{P},\) il faut d’abord obtenir une base de chaque espace propre. Pour créer la première colonne de \(\mathbf{P}\), on prend un vecteur de la base de l’espace propre du premier élément sur la diagonale de \(\mathbf{D}\) et on élimine ce vecteur de toute future inclusion dans \(\mathbf{P}.\) Pour chaque colonne \(i\) suivante, on prend un vecteur de la base de l’espace propre du \(i\)-ième élément sur la diagonale de la matrice \(\mathbf{D}\) et on l’élimine de toute future inclusion dans \(\mathbf{P}.\)

Dans notre exemple, nous devons premièrement obtenir une base de l’espace propre de \(4\) et une base de l’espace propre de \(5.\)

Pour la valeur propre \(4,\) on cherche une base du noyau de \(\mathbf{A}-4\mathbf{I} = \begin{bmatrix} 0 & 0 &-2 \\ 2 & 1 & 4 \\ 0 & 0 & 1 \end{bmatrix}.\) La forme échelonnée réduite de cette dernière est \(\begin{bmatrix} 1 & \frac{1}{2} & 0 \\ 0 & 0 & 1 \\ 0 & 0 & 0 \end{bmatrix}.\) Toutes les solutions de \(\begin{bmatrix} 1 & \frac{1}{2} & 0 \\ 0 & 0 & 1 \\ 0 & 0 & 0 \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \\ x_3 \end{bmatrix} = \begin{bmatrix} 0 \\ 0 \\ 0\end{bmatrix}\) sont de la forme \(\begin{bmatrix} x_1 \\ x_2 \\ x_3 \end{bmatrix} = \begin{bmatrix} -\frac{1}{2}s \\ s \\ 0\end{bmatrix} = s \begin{bmatrix} -\frac{1}{2} \\ 1 \\ 0 \end{bmatrix}\) puisque \(x_2\) est une variable indépendante. Donc, \(\left\{\begin{bmatrix} -\frac{1}{2} \\ 1 \\ 0\end{bmatrix}\right\}\) est une base de l’espace propre associé à la valeur propre \(4.\)

Pour la valeur propre \(5,\) on cherche une base du noyau de \(\mathbf{A} - 5\mathbf{I} = \begin{bmatrix} -1 & 0 & -2 \\ 2 & 0 &4 \\ 0 & 0 & 0\end{bmatrix}.\) La forme échelonnée réduite de cette dernière est \(\begin{bmatrix} 1 & 0 & 2 \\ 0 & 0 & 0 \\ 0 & 0 & 0\end{bmatrix}.\) Toutes les solutions de \(\begin{bmatrix} 1 & 0 & 2 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \\ x_3 \end{bmatrix} = \begin{bmatrix} 0 \\ 0 \\ 0\end{bmatrix}\) sont de la forme \(\begin{bmatrix} x_1 \\ x_2 \\ x_3 \end{bmatrix} = \begin{bmatrix} -2t \\ s \\ t\end{bmatrix} = s \begin{bmatrix} 0 \\ 1 \\ 0 \end{bmatrix} + t \begin{bmatrix} -2 \\ 0 \\ 1 \end{bmatrix}\) puisque \(x_2\) et \(x_3\) sont des variables indépendantes. Donc, \(\left\{\begin{bmatrix} 0 \\ 1 \\0\end{bmatrix}, \begin{bmatrix} -2 \\ 0 \\ 1\end{bmatrix}\right\}\) est une base de l’espace propre associé à la valeur propre \(5.\)

Pour créer la première colonne de \(\mathbf{P}\), on choisit un vecteur de la base de l’espace propre associé à la valeur propre \(4\). Il existe qu’un seul tel vecteur dans notre choix de la base, d’où \(\mathbf{P}\) prend la forme \(\begin{bmatrix} -\frac{1}{2} & * & *\\ 1 & * & * \\ 0 & * & *\end{bmatrix}.\)

Pour la deuxième colonne, on choisit un vecteur de la base de l’espace propre associé à la valeur propre \(5.\) Il y a deux vecteurs parmi lesquels choisir; prenons \(\begin{bmatrix} 0 \\ 1 \\0\end{bmatrix}.\) Alors, \(\mathbf{P}\) devient \(\begin{bmatrix} -\frac{1}{2} & 0 & *\\ 1 & 1 & *\\ 0 & 0 & *\end{bmatrix}\).

Finalement, nous n’avons pas le choix que de choisir le vecteur restant dans la base de l’espace propre associé à la valeur \(5\) afin de remplir la dernière colonne de \(\mathbf{P}\). Ainsi, \(\mathbf{P} = \begin{bmatrix} -\frac{1}{2} & 0 & -2\\ 1 & 1 & 0\\ 0 & 0 & 1\end{bmatrix}.\)

Notons que \(\mathbf{P}^{-1} = \begin{bmatrix} -2 & 0 & -4 \\ 2 & 1 & 4 \\ 0 & 0 & 1 \end{bmatrix}.\) Nous pouvons maintenant vérifier que \(\mathbf{A} = \mathbf{P}\mathbf{D}\mathbf{P}^{-1}.\)

Exercices

  1. Est-ce que \(\begin{bmatrix} 2 & 2 & 2 \\ 0 & 2 & 0 \\ 0 & 1 & 3 \end{bmatrix}\) est diagonalisable?

  2. Soit \(\mathbf{A} = \left[ {\begin{array}{ccc} 1 & 1 & 0 \\ 0 & 2 & 0 \\ 0 & 2 & 1 \\ \end{array} } \right].\) Diagonalisez \(\mathbf{A}\) en trouvant une matrice \(\mathbf{P}\) et une matrice diagonale \(\mathbf{D}\) tel que \(\mathbf{A} = \mathbf{P}\mathbf{D}\mathbf{P}^{-1}.\)

  3. Démontrez la proposition 7.3.

Solutions

  1. Soit \(\mathbf{A}\) la matrice donnée. Les valeurs propres de \(\mathbf{A}\) sont \(2\) et \(3.\) \(\mathbf{A}-2\mathbf{I} = \begin{bmatrix} 0 & 2 & 2 \\ 0 & 0 & 0 \\ 0 & 1 & 1 \end{bmatrix},\) dont le rang est \(1\). La multiplicité géométrique de la valeur propre \(2\) est donc \(2.\) \(\mathbf{A}-3\mathbf{I} = \begin{bmatrix} -1 & 2 & 2 \\ 0 & -1 & 0 \\ 0 & 1 & 0 \end{bmatrix},\) dont le rang est \(2.\) La multiplicité géométrique de la valeur propre \(2\) est donc \(1.\) Puisque la somme des multiplicités géométriques est égale au nombre de colonne de \(\mathbf{A},\) la matrice \(\mathbf{A}\) est diagonalisable.

  2. Débutons par obtenir les valeurs propres de \(\mathbf{A}\) en résolvant \(\det(\mathbf{A} - \lambda \mathbf{I}) = 0,\) c’est-à-dire \[\begin{vmatrix} 1-\lambda & 1 & 0 \\ 0 & 2-\lambda & 0 \\ 0 & 2 & 1-\lambda \end{vmatrix} = 0,\] ou, de manière équivalente, \[(1-\lambda)^2(2-\lambda) = 0.\] Les valeurs propres sont alors \(1\) et \(2\).

    Notons que \(\mathbf{A} - \mathbf{I} = \begin{bmatrix} 0 & 1 & 0 \\ 0 & 1 & 0 \\ 0 & 2 & 0 \end{bmatrix}\). La forme échelonnée réduite est \(\begin{bmatrix} 0 & 1 & 0 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \end{bmatrix}\). Une base du noyau de \(\mathbf{A}-\mathbf{I}\) est donnée par \(\left \{ \begin{bmatrix} 1 \\ 0 \\ 0\end{bmatrix}, \begin{bmatrix} 0 \\ 0 \\ 1\end{bmatrix} \right\}\).

    Notons que \(\mathbf{A} - 2\mathbf{I} = \begin{bmatrix} -1 & 1 & 0 \\ 0 & 0 & 0 \\ 0 & 2 & -1 \end{bmatrix}\). Sa forme échelonnée réduite est \(\begin{bmatrix} 1 & 0 & -\frac{1}{2} \\ 0 & 1 & -\frac{1}{2} \\ 0 & 0 & 0 \end{bmatrix}\).

    Une base du noyau de cette matrice est donnée par \(\left \{ \begin{bmatrix} \frac{1}{2} \\ \frac{1}{2} \\ 1\end{bmatrix} \right\}.\)

    Alors, en prenant \(\mathbf{D} = \begin{bmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 2\end{bmatrix}\) et \(\mathbf{P} = \begin{bmatrix} 1 & 0 & \frac{1}{2} \\ 0 & 0 & \frac{1}{2}\\ 0 & 1 & 1\end{bmatrix}\), on obtient \(\mathbf{A} = \mathbf{P}\mathbf{D}\mathbf{P}^{-1}\).

  3. (Esquisse.) Soit \(\lambda_1,\ldots,\lambda_k\) les valeurs propres de \(\mathbf{A}.\) Pour \(i = 1,\ldots,k,\) soit \(B_i\) une base de l’espace propre associé à \(\lambda_i.\) Alors, \(|\bigcup_{i=1}^k B_i| = n.\) Il est possible de démontrer, en utilisant la proposition 7.1, que \(\bigcup_{i=1}^k B_i\) est un ensemble linéairement indépendant. Le résultat suit en choisissant les colonnes de \(\mathbf{P}\) parmi les éléments de \(\bigcup_{i=1}^k B_i.\)