Compression d'images à travers la factorisation SVD
Sujets de David Renault
Le but de ce projet consiste à programmer un algorithme permettant de faire de la compression d'images en utilisant des techniques matricielles basée sur la factorisation SVD. Ce type d'algorithme est à relier aux algorithmes de compression avec pertes, dont le plus connu est certainement l'algorithme de compression JPEG, lui-même basé usuellement sur la Discrete Cosine Transform (DCT), une transformation voisine de la transformée de Fourier discrète.
Tout au long du sujet, nous allons manipuler des images sous forme de matrices. Avec matplotlib, il est possible de charger de telles matrices en utilisant le code suivant :
Tout au long du sujet, nous allons manipuler des images sous forme de matrices. Avec matplotlib, il est possible de charger de telles matrices en utilisant le code suivant :
img_full = mp.imread("essai.png")
Un exemple d'image en couleur est accessible à l'adresse suivante (image du domaine public, due à la NASA). Les images sont en couleurs correspondent à des matrices de triplets RGB. Il est alors nécessaire d'en extraire les composantes rouge, verte et bleue avant de pouvoir chercher à les compresser.
Tout au long de ce projet, notre but va consister à mettre cette matrice (notée A, de dimensions n x m) sous la forme suivante :
Tout au long de ce projet, notre but va consister à mettre cette matrice (notée A, de dimensions n x m) sous la forme suivante :
... où U et V sont des matrices orthogonales carrées (respectivement de dimensions n x n et m x m, et S est une matrice de dimensions n x m, diagonale réelle, pour laquelle les éléments diagonaux sont positifs et forment une suite décroissante. Le sujet se décompose en quatre parties :
- la première partie met en place les fonctions utilitaires pour manipuler les matrices de Householder, nécessaires à la réalisation des deux parties suivantes;
- la seconde partie transforme la matrice A en une matrice bidiagonale BD par une méthode directe;
- la troisième partie transformer une matrice bidiagonale BD en une matrice diagonale S par une méthode itérative
- la dernière partie applique ces transformations à l'algorithme de compression d'image par transformation SVD
Transformation de Householder
Rappelons que toute symétrie hyperplane peut s'écrire sous la forme suivante :
où Id est la matrice identité en dimension n et U est un vecteur de taille n et de norme euclidienne 1. Une telle matrice est appelée matrice de Householder.
1. Étant donné deux vecteurs X et Y de même norme, trouver comment choisir le vecteur U pour que la matrice de symétrie H alors obtenue envoie X sur Y. Écrire l'algorithme correspondant. L'exemple suivant peut servir de test de fonctionnement :
1. Étant donné deux vecteurs X et Y de même norme, trouver comment choisir le vecteur U pour que la matrice de symétrie H alors obtenue envoie X sur Y. Écrire l'algorithme correspondant. L'exemple suivant peut servir de test de fonctionnement :
2. Écrire une fonction optimisée qui calcule le produit d'une matrice de Householder par un vecteur. Étendre votre fonction pour qu'elle calcule le produit d'une matrice de Householder par un ensemble de vecteurs (ou de manière équivalente une matrice).
Comparer la complexité obtenue avec la complexité d'un produit matrice-matrice usuel.
Comparer la complexité obtenue avec la complexité d'un produit matrice-matrice usuel.
Remarque : commencer par écrire la fonction non optimisée qui effectue le même calcul, puis écrire la fonction optimisée qui doit avoir une complexité d'ordre strictement inférieur.
Mise sous forme bidiagonale
Supposons maintenant disposer d'une matrice initiale carrée A censée représenter une image. Nous allons commencer par transformer cette matrice en la mettant sous forme bidiagonale :
Rappelons que la factorisation QR est une méthode permettant de mettre une matrice donnée sous la forme d'un produit d'une matrice orthogonale et d'une matrice triangulaire supérieure. Ici, nous allons nous autoriser à multiplier à gauche et à droite par des matrices orthogonales pour obtenir cette forme bidiagonale. Considérons l'algorithme suivant (dans lequel les indices des tableaux commencent à 0) :
Qleft = Id; Qright = Id; BD = A; For i from 0 to (n-1) Let Q1 be a HH matrix mapping BD[i:n,i] on a vector with a single non-zero element Qleft = Qleft * Q1; BD = Q1 * BD, If (not(i==(n-2))) Let Q2 be a HH matrix mapping BD[i,(i+1):n] on a vector with a single non-zero element Qright = Q2 * Qright BD = BD * Q2 End if End for Return(Qleft, BD, Qright)
Concrètement, on place les zéros nécessaires sur la première colonne, puis sur la première ligne, puis sur la seconde colonne ... À chaque tour de boucle de l'algorithme, on peut vérifier que :
Mettre en place l'algorithme de mise sous forme bidiagonale, de manière à renvoyer la matrice transformée, ainsi que les changements de base à gauche et à droite.
Remarque : vérifier que l'invariant est conservé à chaque étape de votre algorithme, et que vous faites bien apparaître les zéros dans les bonnes lignes et colonnes.
Transformation QR
La deuxième étape de la mise sous forme SVD consiste à appliquer un certain nombre de fois la transformation QR sur une matrice bidiagonale. Concrètement :
U = Id; V = Id; S = BD; For i from 0 to NMax (Q1, R1) = decomp_qr(matrix_transpose(S)) (Q2, R2) = decomp_qr(matrix_transpose(R1)) S = R2; U = U * Q2; V = matrix_transpose(Q1) * V End for Return (U,S,V)
Dans cet algorithme, la matrice R converge vers une matrice diagonale, et les matrices (U, S, V) correspondent aux matrices de la décomposition SVD.
1. Ecrire une version préliminaire de cet algorithme en utilisant la fonction numpy.linalg.qr.
2. Tester et dessiner la convergence de la matrice R vers une matrice diagonale, et s'assurer que l'invariant :
1. Ecrire une version préliminaire de cet algorithme en utilisant la fonction numpy.linalg.qr.
2. Tester et dessiner la convergence de la matrice R vers une matrice diagonale, et s'assurer que l'invariant :
est toujours vérifié
Les appels à la fonction de décomposition QR dans cet algorithme sont en fait disproportionnés : les matrices sur lesquelles on applique cet algorithme sont beaucoup plus simples que des matrices pleines.
3. Montrer l'invariant suivant du calcul : "les matrices S, R1 et R2 sont toujours bidiagonales".
4. Réécrire une version simplifiée de la transformation QR en utilisant l'invariant précédent, puis utiliser cette optimisation pour votre algorithme de décomposition SVD. Quelles sont les complexités des deux algorithmes obtenus ?
5. Usuellement, la décomposition SVD demande à ce que les éléments de la matrice S soient positifs, ordonnés de manière décroissante. Modifier les matrices U et S de manière à assurer cette propriété.
3. Montrer l'invariant suivant du calcul : "les matrices S, R1 et R2 sont toujours bidiagonales".
4. Réécrire une version simplifiée de la transformation QR en utilisant l'invariant précédent, puis utiliser cette optimisation pour votre algorithme de décomposition SVD. Quelles sont les complexités des deux algorithmes obtenus ?
5. Usuellement, la décomposition SVD demande à ce que les éléments de la matrice S soient positifs, ordonnés de manière décroissante. Modifier les matrices U et S de manière à assurer cette propriété.
Application à la compression d'images
Supposons vouloir compresser une image sous la forme d'une matrice carrée A.
La première étape consiste à mettre la matrice A sous forme :
La première étape consiste à mettre la matrice A sous forme :
La seconde étape consiste à considérer les valeurs de la diagonale de S :
La compression au rang k consiste à annuler les termes diagonaux de S d'indice strictement plus grand que k.
1. Ecrire un algorithme permettant d'obtenir la compression au rang k d'une matrice carrée donnée.
2. Quel est le gain de place pour une compression au rang k par rapport à la matrice initiale ? Quelle est le rang maximal au delà duquel la transformation est de taille supérieure à l'image initiale ?
3. Tracer l'efficacité de cette compression en fonction de k, (par exemple en mesurant la distance entre l'image réelle et l'image compressée).
2. Quel est le gain de place pour une compression au rang k par rapport à la matrice initiale ? Quelle est le rang maximal au delà duquel la transformation est de taille supérieure à l'image initiale ?
3. Tracer l'efficacité de cette compression en fonction de k, (par exemple en mesurant la distance entre l'image réelle et l'image compressée).