6.14 Changement de base
6.14.1 Motivation
Nous avons vu que le même espace vectoriel peut être décrit à l’aide de bases distinctes. Lorsque l’on en choisi une, chaque vecteur de l’espace vectoriel peut s’exprimer en tant que combinaison linéaire des vecteurs de cette base. Y a-t-il vraiment un besoin d’utiliser des bases différentes?
Le choix d’une base est très important pour les algorithmes utilisés lors de la compression audio digitale et la compression d’images. Par exemple, la base d’ondelettes est largement utilisée en traitement des signaux digitales. La transformée de Fourier rapide est une méthode de changement de base efficace permettant d’exprimer une matrice en terme d’ondelettes.
Les changements de bases sont aussi fréquemment utilisés en analyse statistique, plus particulièrement en analyse des composantes principales.
Nous illustrons maintenant l’usage des changements de base par un exemple simple. Considérons la table suivante indiquant les nombres d’heures hebdomadaire que cinq élèves (Ada, Bev, Cam, Dan et Ève) passent à étudier, ainsi que leurs notes en algèbre, en calcul et en statistiques.
Ada | Bev | Cam | Dan | Ève | |
---|---|---|---|---|---|
Heures d’études | 3 | 8.5 | 6 | 5 | 7 |
Note en algèbre | 45 | 100 | 75 | 65 | 85 |
Note en calcul | 56 | 100 | 80 | 72 | 88 |
Note en statistique | 48 | 81 | 66 | 60 | 72 |
En réalité, nous pourrions avoir des centaines d’étudiants et plusieurs autres sujets. Mais pour les besoins de l’illustration, nous supposons que le tableau ci-haut est trop gros à télécharger dans un ordinateur pour ensuite être analysé. Existe-t-il une façon de compresser les données?
Exprimons d’abord les données en \(4\)-uplets dans \(\mathbb{R}^4\) comme suit:
Ada | Bev | Cam | Dan | Ève | |
---|---|---|---|---|---|
Données | \(\begin{bmatrix}3\\45\\56\\48\end{bmatrix}\) | \(\begin{bmatrix}8.5\\100\\100\\81\end{bmatrix}\) | \(\begin{bmatrix}6\\75\\80\\66\end{bmatrix}\) | \(\begin{bmatrix}5\\65\\72\\60\end{bmatrix}\) | \(\begin{bmatrix}5\\85\\88\\72\end{bmatrix}\) |
Nous n’avons pas encore réduit la quantité de données. Nous avons seulement réécrit le tableau d’une façon différente. Avec \(\mathbf{d} = \begin{bmatrix} 1\\10\\8\\6\end{bmatrix}\) et \(\mathbf{v} = \begin{bmatrix} 0 \\ 15 \\ 32 \\ 30\end{bmatrix}\), nous voyons que
- l’uplet d’Ada est donné par \(\mathbf{v} + 3\mathbf{d}\),
- l’uplet de Bev est donné par \(\mathbf{v}+8.5\mathbf{d}\),
- l’uplet de Cam est donné par \(\mathbf{v} + 6 \mathbf{d}\),
- l’uplet de Dan est donné par \(\mathbf{v} + 5\mathbf{d}\),
- l’uplet d’Ève est donné par \(\mathbf{v}+7\mathbf{d}\).
Ainsi, les multiples scalaires de \(\mathbf{d}\) capturent toutes la variation des données.
D’après le corollaire 6.3, on peut construire une base \(B = \{\mathbf{v}^{(1)}, \mathbf{v}^{(2)}, \mathbf{v}^{(3)}, \mathbf{d}\}\) de \(\mathbb{R}^4\). Nous savons que chaque vecteur de \(\mathbb{R}^4\) peut s’écrire en tant que combinaison linéaire de \(\mathbf{v}^{(1)},\mathbf{v}^{(2)},\mathbf{v}^{(3)}\) et \(\mathbf{d}\). Ce qui est spécial à propos des \(4\)-uplets du tableau précédent, c’est que pour n’importe quel \(4\)-uplet \(\mathbf{u}\), la combinaison linéaire de \(\mathbf{v}^{(1)},\mathbf{v}^{(2)},\mathbf{v}^{(3)}\), et \(\mathbf{d}\) qui exprime \(\mathbf{u} - \mathbf{v}\) sera de la forme \(0 \mathbf{v}^{(1)} + 0 \mathbf{v}^{(2)} + 0 \mathbf{v}^{(3)} + \alpha \mathbf{d}\), où \(\alpha \ne 0\). Essentiellement, une seule des quatres dimensions est intéressante par rapport à la base \(B\).
Remarque. En réalité, les données ne permettent que rarement un ajustement parfait avec un modèle aussi simple. Il est plus probable que les données auraient une forme comme celle-ci:
Ada | Bev | Cam | Dan | Ève | |
---|---|---|---|---|---|
Heures d’études | 3 | 8.5 | 6 | 5 | 7 |
Note d’algèbre | 47 | 100 | 74 | 64 | 87 |
Note en calcul | 55 | 99 | 80 | 73 | 89 |
Note en statistiques | 50 | 80 | 65 | 59 | 73 |
Même si nous ne pouvons pas trouver un \(\mathbf{v}\) et un \(\mathbf{d}\) qui correspondent parfaitement aux données, nous pouvons trouver des approximations. Pour des raisons pratiques, une approximation est souvent suffisante. Comme George E.P. Box l’a déjà écrit, « Tous les modèles sont essentiellement incorrects. Mais certains modèles sont utiles. » Une bonne analyse statistique requiert un bon modèle pour les données disponibles, ainsi que la capacité de déterminer que s’il suggère une bonne approximation à la réalité.
6.14.2 Matrice de changement de base
Comme nous l’avons vu à la section précédente, il peut s’avérer avantageux dans certaines situations d’exprimer un vecteurs à l’aide d’une base différente. Par exemple, dans un espace vectoriel à dimension élévée, s’il existe une base ordonnée dans laquelle les représentations en uplets de vecteurs à l’étude n’ont que peu de composantes non nulles, on peut possiblement sauver de la mémoire en utilisant une représentations qui ne contient que peu d’information sur ces uplets.
Dans cette section, nous présentons une manière systématique de convertir la représentation par rapport à une base ordonnée à la représentation par rapport à une autre base ordonnée. Nous illustrons d’abord les idées principales avec un exemple.
Soit \(P_1\) l’espace des polynômes en \(x\) à coefficients réels et de degré au plus \(1\). Soient \(\Gamma = (x-1,x+1)\) et \(\Omega = (1,2x+1)\) des bases ordonnées de \(P_1\).
Rappelons que si \(\begin{bmatrix} a\\ b\end{bmatrix}\) est une représentation en 2-uplets de \(\mathbf{u} \in P_1\) par rapport à \(\Gamma\), alors \[\mathbf{u} = a(x-1) + b(x+1) = (a+b)x + (-a +b).\] Existe-t-il une façon simple de déterminer \([\mathbf{u}]_{\Omega}\)?
Nous devons trouver \(\delta\) et \(\phi\) tels que \(\delta(1) + \phi(2x+1) = \mathbf{u} = (a+b)x + (-a+b)\). Nous aurons alors \([\mathbf{u}]_{\Omega} = \begin{bmatrix} \delta\\\phi \end{bmatrix}\).
Notons que \[\delta(1) + \phi(2x+1) = 2\phi x + (\delta + \phi).\] En comparant ces coefficients avec \((a+b)x + (-a+b)\), on obtient \[\begin{align*} 2\phi & = (a+b) \\ \delta + \phi & = -a + b \end{align*}\] De la première équation, on obtient \(\phi = \frac{a+b}{2}\). On substitue ce \(\phi\) dans la deuxième équation afin d’obtenir \(\delta = -\frac{3}{2} a + \frac{b}{2}\). Ainsi, \[[\mathbf{u}]_{\Omega} = \begin{bmatrix} -\frac{3}{2} a + \frac{b}{2} \\ \frac{a}{2} + \frac{b}{2} \end{bmatrix}.\] On peut aussi écrire ce résultat sous la forme \[[\mathbf{u}]_{\Omega} = \begin{bmatrix} -\frac{3}{2} & \frac{1}{2} \\ \frac{1}{2} & \frac{1}{2} \end{bmatrix} \begin{bmatrix} a \\ b\end{bmatrix}.\]
La matrice \(\mathbf{A} = \begin{bmatrix} -\frac{3}{2} & \frac{1}{2} \\ \frac{1}{2} & \frac{1}{2} \end{bmatrix}\) est telle que \[[\mathbf{u}]_{\Omega} = \mathbf{A} [\mathbf{u}]_{\Gamma};\] elle transforme la représentation en 2-uplets par rapport à \(\Gamma\) en représentation par 2-uplets par rapport à \(\Omega\).
Dans ce qui suit, nous allons voir que pour tout espace vectoriel \(V\) de dimension \(n\) duquel \(\Gamma\) et \(\Omega\) sont des bases ordonnées, il existe une unique matrice \(\mathbf{A}\) telle que \([\mathbf{u}]_\Omega = \mathbf{A} [\mathbf{u}]_\Gamma\) pour chaque \(\mathbf{u} \in V\). Le changement de base des représentations en uplets est donc équivalent à la multiplication par une matrice.
Soit \(V\) un espace vectoriel de dimension \(n\). Soient \(\Gamma = \left(\mathbf{v}^{(1)},\ldots,\mathbf{v}^{(n)}\right)\) et \(\Omega = \left(\mathbf{w}^{(1)},\ldots,\mathbf{w}^{(n)}\right)\) des bases ordonnées de \(V\).
Notons que pour chaque \(j \in \{1,\ldots,n\}\), on peut écrire \(\mathbf{v}^{(j)}\) en tant que combinaison linéaire de \(\mathbf{w}^{(1)},\ldots,\mathbf{w}^{(n)}\). Ainsi, il existe scalaires \(a_{1,j}, a_{2,j},\ldots, a_{n,j}\) tels que \[\mathbf{v}^{(j)} = a_{1,j}\mathbf{w}^{(1)} + a_{2,j}\mathbf{w}^{(2)} + \cdots + a_{n,j}\mathbf{w}^{(n)}.\]
Si \(\mathbf{u} \in V\) est arbitraire, il existe des scalaires \(\lambda_1,\ldots,\lambda_n\) tels que \(\mathbf{u} = \lambda_1 \mathbf{v}^{(1)} +\cdots + \lambda_n \mathbf{v}^{(n)},\) d’où \([\mathbf{u}]_\Gamma = \begin{bmatrix} \lambda_1 \\ \vdots \\ \lambda_n\end{bmatrix}\).
Ainsi, \[\begin{align*} \mathbf{u} & = \lambda_1 \mathbf{v}^{(1)} +\cdots + \lambda_n \mathbf{v}^{(n)} \\ & = \sum_{j=1}^n \lambda_j \left (\sum_{i=1}^n a_{i,j} \mathbf{w}^{(i)} \right)\\ & = \sum_{j=1}^n \sum_{i=1}^n (a_{i,j} \lambda_j)\mathbf{w}^{(i)} \\ & = \sum_{i=1}^n \left(\sum_{j=1}^n a_{i,j}\lambda_j\right ) \mathbf{w}^{(i)} \end{align*}\] et \[[\mathbf{u}]_{\Omega} = \begin{bmatrix} \displaystyle\sum_{j=1}^n a_{1,j}\lambda_j \\ \displaystyle\sum_{j=1}^n a_{2,j}\lambda_j \\ \vdots \\ \displaystyle\sum_{j=1}^n a_{m,j}\lambda_j \end{bmatrix} = \begin{bmatrix} a_{1,1} & a_{1,2} & \cdots & a_{1,n} \\ a_{2,1} & a_{2,2} & \cdots & a_{2,n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n,1} & a_{n,2} & \cdots & a_{n,n} \end{bmatrix} \begin{bmatrix} \lambda_1 \\ \lambda_2 \\ \vdots \\ \lambda_n\end{bmatrix}.\] Soit \(\mathbf{A}\) la matrice dont l’élément \((i,j)\) est \(a_{i,j}\) pour tout \(i, j \in \{1,\ldots,n\}\). La représentation \([\mathbf{u}]_{\Omega}\) est précisement \(\mathbf{A} [\mathbf{u}]_{\Gamma}\). One appelle \(\mathbf{A}\) la matrice de changement de base de \(\Gamma\) à \(\Omega\).
Exemple 6.22 Soient \(\Gamma = \left ( \begin{bmatrix} 1\\0\end{bmatrix}, \begin{bmatrix} 2\\1\end{bmatrix} \right)\) et \(\Omega = \left ( \begin{bmatrix} 0\\1\end{bmatrix}, \begin{bmatrix} -1\\1\end{bmatrix} \right )\) des bases ordonnées de \(\mathbb{R}^2\). Pour obtenir la matrice de changement de base de \(\Gamma\) à \(\Omega\), on écrit d’abord chaque vecteur de \(\Gamma\) en tant que combinaison linéaire des vecteurs de \(\Omega\).
Notons que \[\begin{bmatrix} 1\\0\end{bmatrix} = 1\begin{bmatrix} 0 \\ 1\end{bmatrix} + (-1) \begin{bmatrix} -1\\1\end{bmatrix}\] et \[\begin{bmatrix} 2\\1\end{bmatrix} = 3\begin{bmatrix} 1 \\ 1\end{bmatrix} + (-2) \begin{bmatrix} -1\\1\end{bmatrix}.\]
Ainsi, la matrice de changement de base de \(\Gamma\) à \(\Omega\) est \(\begin{bmatrix} 1 & 3 \\ -1 & -2\end{bmatrix}\).
Exercices
Soient \(\Gamma = \left ( \begin{bmatrix} 1 \\ 0 \\ 1\end{bmatrix}, \begin{bmatrix} 2 \\ 1 \\ 0\end{bmatrix}, \begin{bmatrix} 0 \\ 1 \\ -1\end{bmatrix} \right)\) et \(\Omega = \left ( \begin{bmatrix} 1\\1\\1\end{bmatrix}, \begin{bmatrix} -1\\1\\1\end{bmatrix} \begin{bmatrix} 1\\1\\-1\end{bmatrix} \right )\) des bases ordonnées de \(\mathbb{R}^3\). Obtenez la matrice de changement de base de \(\Gamma\) à \(\Omega\).
Soient \(\Gamma = (x, 1)\) et \(\Omega = (2x+1, -x)\) des bases ordonnée de \(P_1.\) Obtenez la matrice de changement de base de \(\Gamma\) à \(\Omega\).
Solutions
Notons que \[\begin{bmatrix} 1 \\ 0 \\ 1\end{bmatrix} = \begin{bmatrix} 1\\1\\1\end{bmatrix} + \left(-\frac{1}{2}\right)\begin{bmatrix} -1\\1\\1\end{bmatrix} + \left(-\frac{1}{2}\right)\begin{bmatrix} 1\\1\\-1\end{bmatrix},\] \[\begin{bmatrix} 2 \\ 1 \\ 0\end{bmatrix} = \begin{bmatrix} 1\\1\\1\end{bmatrix} + \left(-\frac{1}{2}\right)\begin{bmatrix} -1\\1\\1\end{bmatrix} + \left(\frac{1}{2}\right)\begin{bmatrix} 1\\1\\-1\end{bmatrix},\] et \[\begin{bmatrix} 0 \\ 1 \\ -1\end{bmatrix} = \left(-\frac{1}{2}\right)\begin{bmatrix} 1\\1\\1\end{bmatrix} + \left(\frac{1}{2}\right)\begin{bmatrix} -1\\1\\1\end{bmatrix} + \begin{bmatrix} 1\\1\\-1\end{bmatrix}.\] Ainsi, la matrice de changement de base est \[\begin{bmatrix} 1 & 1 & -\frac{1}{2} \\ -\frac{1}{2} & -\frac{1}{2} & \frac{1}{2} \\ -\frac{1}{2} & \frac{1}{2} & 1 \end{bmatrix}.\]
Notons que \[x = 0(x+1) + (-1)(-x)\] et \[1 = 1(2x+1) + 2(-x).\] Ainsi, la matrice de changement de base est \(\begin{bmatrix} 0 & 1 \\ -1 & 2\end{bmatrix}\).