Décomposition Adaptative Non Linéaires pour le Codage d`Images
Transcription
Décomposition Adaptative Non Linéaires pour le Codage d`Images
SETIT 2007 4th International Conference: Sciences of Electronic, Technologies of Information and Telecommunications March 25-29, 2007 – TUNISIA Décomposition Adaptative Non Linéaires pour le Codage d’Images Multispectrales Jamel Hattay* & Amel Benazza-Benyahia** Unité Sciences et Technologie de l’Image et des Télécommunications Institut Supérieure de Biotechnologie de Sfax (ISBS), université de Sfax, TUNISIE [email protected] **Unité des Recherches en Imagerie Satellitaires et ses Applications (URISA) Ecole Supérieure des Communications de Tunis, Tunisie, Route de Raoued 3.5 Km, 2083 Ariana, Tunisie. Tel: (+216-71) 857 000, Fax: (216-71) 856 829 [email protected] Abstract: Dans le contexte de la compression des images satellitaires, nous proposons une technique de codage qui se base sur le paquet d'ondelettes non séparable utilisant le schéma de lifting vectoriel en quinconce (VQLS). la nouveauté de notre approche se concentre sur deux aspects. En premier lieu, nous allons exploité la redondance entre les différentes bandes spectrales et en deuxième lieu nous proposons un paquet d'ondelettes non séparable adaptatif selon le contenu fréquentiel des images d'entrées inspiré de la version séparable et scalaire (sans exploitation des redondances inter bandes). Les résultats expérimentaux effectués sur des images satellitaires multispectrales montrent les performances d'une telle technique du codage afin de donner une forme plus compacte de l'information. Key words: Compression, sans perte, Schéma de lifting , paquet d'ondelettes , non séparable, adaptatif. original lors de la reconstruction. Cette contrainte de réversibilité exacte implique que le flux des données compressé par les algorithmes avec pertes est beaucoup plus réduit que le flux des données délivré par un codeur sans pertes. Autrement dit, avec les codeurs avec pertes, le taux de compression qui est le rapport entre le flux compressé et non compressé varie autour de la valeur de 2 contrairement aux codeurs sans pertes où ce taux varie de 20 à 30. Le choix entre les deux types dépend de l'application, certaines applications exigent une compression sans pertes, comme le traitement des images médicales là où le diagnostic dépend fortement du moindre détail contenu dans l'image. De même pour la télédétection, qui est l'objet principal de notre travail, la compression sans pertes est exigée car la moindre déformation dans l'image acquise peut endommager les paramètres physiques correspondant à la couverture du sol. Dans ce contexte, plusieurs algorithmes de codage sans pertes ont été envisagés pour les images multispectrales. INTRODUCTION Dans la plupart des cas, l'acquisition des signaux numériques s'accompagne d'une taille énorme. De plus, le développement des applications moderne des images comme l'imagerie médicale, télédétection, télévision numérique haute définition.... produit des quantités considérables des données numériques à stoker ou à transmettre. Par exemple, dans les applications de télédétection, la taille d'une image Landsat est de plusieurs centaines de méga-octets et 5.000 des images sont acquises par semaine. Pour le satellite SPOT5, un nombre de 210 images sont stockées quotidiennement avec une moyenne de 300 octets par pixel est nécessaire pour la représentation d'une image multispectrale. Par conséquent, il est clair que le besoin de la compression des données est inévitable. A ce sujet, on distingue plusieurs méthodes de compression où le choix de la méthode dépend principalement de l'application visée. De plus, la reconstruction progressive est une autre fonctionnalité visée. Pour cela, ces techniques de codage progressif doivent représenter l'image à différentes résolutions. A ce titre, la transformation en ondelettes se comporte comme un excellent outil pour Fondamentalement, deux types de compression de données sont utilisés: la compression avec pertes et la compression sans pertes. Les techniques de codage sans pertes ne permettent aucune distorsion de signal -1- SETIT2007 (échantillonnée initialement en rectangulaire). Un schéma en quinconce se base fondamentalement sur les phases suivantes. un tel but, grâce à sa capacité de représenter l'image d'entrée en différentes sous images à différents niveaux de résolution. En effet, la transformation d'une image fournit une sous image passe-bas (ou approximation) et des autres sous images passe-haut (ou détails), la répétition de cette décomposition un certain nombre de fois sur les sous image passe-bas aboutit à une représentation multirésolution Extraction des composantes polyphasées : Comme l'indique la Figure 1, les composantes en Classiquement, le lifting est présenté par comme un outil efficace qui permet une transformation en ondelettes réversible dite de seconde génération. D'ailleurs, le nouveau standard JPEG2000 utilise ce Schéma de Lifting (SL). A cet égard, la transformation en ondelettes est très utilisée pour les applications du codage des images car elle fournit une représentation multirésolution des images d'entrée [1] Les paquets d'ondelettes ont été développés comme étant une généralisation de cette décomposition afin de l'adapter au contenu fréquentiel des images [2] et [3]. quinconce de x (m,n) sont : Récemment, nous avons défini le Schéma de Lifting Vectoriel en Quinconce (SLVQ) [4]. Nous proposons dans ce travail une extension des paquets d'ondelettes basé sur un SLVQ adaptatif selon le contenu fréquentiel d'image d'entrée. Le reste de cet article est organisé comme suit. Dans la première section, nous décrivons le schéma de lifting vectoriel en quinconce (SLVQ) et la version du paquet d'ondelettes non séparable inspiré du cas séparable. Ensuite, en deuxième partie nous présentons une nouvelle technique qui se base sur un algorithme adaptative. Finalement, on terminera par des résultats de simulations et quelques conclusions sont tirées dans la section. Figure 1 Division en composantes polyphasées la prédiction et la mise à jour Cette étape consiste à prédire les échantillons x1/2(m,n) par certains x1/2(m,n) et l'erreur de prédiction d1(m,n) va servir à la mise à jour des échantillons x1/2(m,n) pour obtenir les coefficients de la sous bande approximation notée a1(m,n). Cela peut s'exprimer par les équations suivantes : 1. Le Schéma de Lifting Vectoriel en Quinconce (SLVQ) 1.1. Le Schéma de Lifting (LS) Le schéma de lifting (LS) est une décomposition en ondelettes composé de trois étapes: la procédure de division spatiale des échantillons en deux sous ensembles S1 et S2. Puis, l'étape de prédiction consiste à prédire les échantillons du S1 a partir du S2. Avec Finalement, l'étape de mise a jour (Update) consiste a lisser les échantillons du S2 a l'aide des coefficients d'erreur de prédiction. Ce processus est répété successivement sur les coefficient a la sortie d'opération d'update afin de donner une analyse multirésolution du signal de départ. Le schéma de lifting est très utilisé pour la compression sans perte d'une manière séparable ou non séparable des images rectangulaire ou en quinconce. Pour ce dernier type d'échantillonnage, la procédure décrite précédemment sera noté schéma de lifting en quinconce (SLQ) [5] et [6]. note par x(m,n) la scène x1/2(m,n) est le vecteur contenant les échantillons voisins de x1/2(m,n), utilisés pour la prédiction de x1/2(m,n). • est le vecteur, contenant les d1(m,n) échantillons d1/2(m,n) mis en oeuvre pour la mise à jour de x1/2(m,n), • p1/2 et u1/2 sont respectivement les vecteurs des poids de la prédiction et de la mise à jour. Il est important de noter que les équations précédentes traduisent un passage du niveau de résolution demientier 1/2 au niveau de résolution entier 1. Par la suite, on va alterner les décompositions passant du niveau entier 1 au niveau demi-entier 3/2 en utilisant les composantes polyphasé en quinconce [7]. Par la suite, nous voulons généraliser le schéma décrit précédemment pour l'analyse en multirésolution où 1.2. Le Schéma de Lifting en Quinconce (SLQ) On • originale -2- SETIT2007 Ainsi, les deux sous bandes résultantes correspondantes à l'approximation et détails donnés respectivement par l'étape de prédiction et l'étape d'update sont donné par: aj/2(m,n) représente l'approximation d'image originale à la résolution j/2, où j appartient à l’ensemble des entiers naturels et qui sera considérée comme l'entrée du module correspondant [8]. Pour mieux illustrer cette décomposition, on propose de donner un exemple où les coefficients du vecteur référence pour l'étape de prédiction sont sélectionnés comme suit : Avec : xbjj2(m,n) est la référence de prédiction constitué par les échantillons de aj/2(m,n) pour la bande b, pbj/2 et ubj/2 sont respectivement les deux vecteurs de prédiction et d’update pour la Bande b, L'opération de mise à jour utilise les coefficients détails suivants : dbj/2(m,n) est la référence des détails pour la bande b. 2. Algorithme adaptatif proposé à travers le paquet d’ondelettes Dans la suite, en utilisant le schéma de lifting vectoriel en quinconce (SLVQ), la décomposition construit un arbre binaire où SLVQ optimal est appliqué à l'image originale qu'elle sera partitionné en deux fils qui correspond aux sous bande approximation et détails: La performance du SLQ reste toujours limitée aux images monocomposantes car le SLQ ne tient pas en compte des redondances spectrales contenues dans les images multispectrales. En effet, on doit se contenter d'appliquer le SLQ composante par composante pour de telles images. Pour cela, une extension vers le cas vectoriel a été introduite pour mieux prendre en compte la corrélation entre les différentes bandes d'une image multispectrales. INIT: Le noeud père f correspondant évidemment à l'image totale (mono composante ou multi composante), possède comme deux fils les deux sous bandes c1 et c2 à la première résolution j=1/2. OPTIM: Pour chaque composante spectrale bk les opérateurs de prédiction pbkj/2(f) et pbkj/2(ci) du J-stage SLVQ sont optimisé selon le critère de minimisation de l'entropie globale ou de la variance des détails pour i=1,…2. Notons que HbkJ(f) l'entropie et HbkJ(ci) désignent respectivement de chaque sous bande. 1.3. Le Schéma de Lifting Vectoriel en Quinconce (SLVQ): Une extension au cas vectoriel est possible pour exploiter la redondance entre les bandes [3]. Cette nouvelle structure sera exploité dans notre travail sous le nom du schéma de lifting vectoriel en quinconce (SLVQ) et adapté au paquet d'ondelettes d'une manière adaptative. Prenons par exemple une image rectangulaire xb(m,n) où b=1,…,B, l'image en quinconce est donnée par ab1/2(m,n)= xb(m-n,m+n). représente Plus généralement, abj/2(m,n) l'approximation de la bande b à la résolution j/2. Dans ce schéma les deux composantes polyphasé sont donné par : TESTE DE DIVISION: À cette étape, nous allons tester quand est ce que la division d'un noeud père f donne une représentation plus compacte de l'information. Autrement dit, nous allons tester quand le critère suivant est vérifié : Sachant que o (n) représente le coût de codage de l'information supplémentaire nécessaire pour le -3- SETIT2007 procédé du décodage au nœud n. Il est clair que lorsque l'entropie moyenne de deux fils est inférieur a celle du père, l'opération de division est effectuée. Finalement, la procédure précédente est appliquée séparément et successivement aux deux fils résultants. 3. Simulations & Résultats 3.1. Images test Dans nos expériences, nous avons utilisé des images satellitaires multispectrales codés sur 8 bpp, et de taille 512*512. Les images multispectrales sont des images SPOT B-composantes avec respectivement $B=3$ (Tunis3) et B=4 (tunis4) et également la scène de Thematic Mapper délivrée par le satellite Landsat (Trento7 avec B=7). Trento7 correspondent à un secteur rural avec des régions relativement douces, tandis que les autres correspondent à une zone urbaine qui contient beaucoup de détails. 3.2. Résultats expérimentaux Les résultats de simulation sont donnés par des images satellitaires SPOT3 (B=3), SPOT4 et Thermic Mapper (B=7), qui sont initialement codés sur 8 bpp. La figure 2 montre la division fréquentielle de l'image Tunis (SPOT4) par le paquet d'ondelettes en construisant un arbre binaire à 11 feuilles de résolutions différentes comme indique le figure 3. la première simulation illustré dans le tableau 1 montre l'évolution des performances du paquet d'ondelettes suivant la profondeur du l'arbre (niveau de résolution) en terme d'entropie sachant que la colonne 4 représente le coût de codage de l'information supplémentaire. Il est clair que l'entropie globale décroît en fonction de la profondeur. Le tableau 4 montre les performances du paquet d'ondelettes vectoriel (utilisant un QVLS) par rapport au paquet d'ondelettes scalaire (utilisant un QLS) en terme d'entropie moyenne (la moyenne des entropies de chaque bande spectrale) appliqué sur plusieurs images multispectrales. Par exemple, nous remarquons une différence de 0.1869 bpp entre ces deux structures pour l'image Tunis-SPOT4 (B=4) à une profondeur égale à 4 (J=4). Finalement, le Tableau 3 donne une comparaison entre deux structures d'adaptation qui sont le paquet d'ondelettes et la décomposition quaternaire (QT) [9] et [10]. La majeure différence entre ces deux structures est que la première se base sur une adaptation fréquentielle par contre la deuxième se base sur une adaptation spatiale. Nous pouvons remarquer la supériorité du paquet d'ondelettes pour toutes les images, pour l'image Trento on a une différence de 0.2975 bpp entre les deux structures. Figure 2. Paquet d’ondelettes adaptatif appliqué à l’image Tunis (SPOT4). Figure 3. Arbre relatif à la décomposition du Figure 2. -4- SETIT2007 Tableau 3. Comparaison entre la décomposition QT et le paquet d’ondelettes non séparable pour les images multispectrales en terme d’entropie (QVLS). Tableau 2. Performances du paquet d’ondelettes non séparable scalaire (QLS) et vectoriel (QVLS). 4. Conclusion Dans ce travail, nous avons étudié quelques méthodes adaptatives pour la compression sans perte des images dans les applications à la reconstruction progressive. Nous avons discuté l'adaptation à travers la décomposition en paquet d’ondelettes en exploitant la corrélation spatiale avec le schéma de lifting en quinconce et la corrélation spectrale avec la version vectorielle de ce schéma. Finalement nos résultats expérimentaux ont été donnés sur quelques images multispectrales de différentes natures montre que notre méthode basée sur le SLVQ adaptatif se comporte comme un outil valable pour les applications de codage sans perte comparé aux autres méthodes. Tableau 1. Evolution d’entropie globale (en bpp) par le paquet d’ondelettes non séparable en fonction de la résolution où J dénote le niveau de résolution. REMERCIEMENT Je tiens à remercier mon professeur Mme Amel Benazza pour son aide durant ce travail et ses conseils continus. Egalement, j'aimerais remercier tous les membres de l'URISA pour leur aide continu. Je voudrais également remercier tous mes collègues pour leur aide et leur collaboration. REFERENCES -5- [1] G. Strang and T.Q. Nguyen, “Wavelets and Filter Banks”, Wellesley-Cambridge Press, 1996. [2] R.R.Coifman, M.V. Wickerhauser, Entropy-based algorithms for best basis selection, IEEE Trans. On Information Theory, } vol 38, n°2, pp 713-718, March SETIT2007 1992. [3] K. Ramchandran, M. Vetterli, “Best wavelet packet buses in a rate-distortion sense”, IEEE Trans on Image Processing, vol 2, n°2, pp 160-175, April 1993. [4] A. Benazza, J.-C. Pesquet, H. Masmoudi, “Vector-lifting scheme for lossless compression of quincunx sampled multispectral images”, Proc. of the IEEE. International Geoscience and Remote Sensing Symposium, Toronto, Canada, 24-28 June 2002. [5] A. Grossman, R.K. Martinet, “Reading andunderstanding continuous wavele transforms”, In wavelets, J.M. Combes, A. Grossman and PH. Tchamitchian (eds.), Springer-Verlag, NY,1989. [6] Y. Mayer, “Ondelettes et opérateurs, I: Ondelettes, II: opérateurs de Calderon-Zygmund, III (avec Coifman): Opérateurs multilinéaires, ” Hermann Editeurs, Paris, 1990. [7] S. Mallat, “A wavelet tour of signal processing” , Academic Press Ed.,} San Diego, CA, USA, September 1998. [8] A. Gouze, M. Antonini, M. Barlaud, “Quincunx lifting scheme for lossy image compression,”IEEE International Conf. on Image Processing, Vancouver, Canada, pp. 665-668, July 2000. [9] Jamel Hattay, A. Benazza, J,-C. Pesquet “Adaptive Lifting Scheme Using Variable Size Block Segmentation”, Advanced Concepts for Intelligent Vision Systems (ACIVIS'04) à Bruxelles , Belgique. [10] A. Benazza, Jamel Hattay, J,-C. Pesquet “Adaptive lifting for multicomponent image coding through quadtree partitioning,” IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2005). -6-