Consulter le texte intégral de la thèse
Transcription
Consulter le texte intégral de la thèse
THESE Pour l'obtention du grade de DOCTEUR DE L'UNIVERSITÉ DE POITIERS UFR des sciences fondamentales et appliquées XLIM-SIC (Diplôme National - Arrêté du 7 août 2006) École doctorale : Sciences et ingénierie pour l'information, mathématiques - S2IM Secteur de recherche : Traitemement du signal et des images Présentée par : Julien Abot Stratégie de codage conjoint pour la transmission d'images dans un système MIMO Directeur(s) de Thèse : Christian Olivier, Yannis Pousset, Clency Perrine Soutenue le 03 décembre 2012 devant le jury Jury : Président Ramesh Pyndiah Professeur - ENST de Bretagne Rapporteur François-Xavier Coudoux Professeur des Universités - Université de Valenciennes et du Hainaut-Cambrésis Rapporteur Frédéric Dufaux Directeur de recherche - CNRS, Télecom Paris Tech Membre Christian Olivier Professeur des Universités - Université de Poitiers Membre Yannis Pousset Maître de conférences - Université de Poitiers Membre Mohamed-Chaker Larabi Maître de conférences - Université de Poitiers Membre Clency Perrine Maître de conférences - Université de Poitiers Membre Cyril Bergeron Docteur ingénieur - Société Thalès communications Pour citer cette thèse : Julien Abot. Stratégie de codage conjoint pour la transmission d'images dans un système MIMO [En ligne]. Thèse Traitemement du signal et des images . Poitiers : Université de Poitiers, 2012. Disponible sur Internet <http://theses.univ-poitiers.fr> THESE pour l’obtention du Grade de DOCTEUR DE L’UNIVERSITE DE POITIERS (Faculté des Sciences Fondamentales et Appliquées) (Diplôme National - Arrêté du 7 août 2006) Ecole Doctorale ED 521 : Sciences et ingénierie pour l’information Secteur de Recherche : Traitement du signal et des images Présentée par : Julien ABOT STRATEGIE DE CODAGE CONJOINT POUR LA TRANSMISSION D’IMAGES DANS UN SYSTEME MIMO Directeur de Thèse : Christian OLIVIER Co-directeur de Thèse : Clency PERRINE Co-directeur de Thèse : Yannis POUSSET Soutenue le 03 Décembre 2012 devant la Commission d’Examen composée de Ramesh Pyndiah, Professeur, Télecom Bretagne ......................................................... Président du Jury François-Xavier Coudoux, Professeur, Université de Valenciennes et du Hainaut-Cambrésis ......... Rapporteur Frédéric Dufaux, Directeur de Recherche CNRS, Télecom Paris Tech ...................................... Rapporteur Cyril Bergeron, Ingénieur, Thalès Communications ............................................................Examinateur Mohamed-Chaker Larabi, Maître de Conférences, Université de Poitiers .................................Examinateur Christian Olivier, Professeur, Université de Poitiers ............................................................Examinateur Yannis Pousset, Professeur, Université de Poitiers ..............................................................Examinateur Clency Perrine, Maître de Conférences, Université de Poitiers ...............................................Examinateur REMERCIEMENTS Le travail présenté dans ce mémoire est le fruit de 3 années passées au sein de l’équipe SYSCOM du département Signal Image Communication (SIC) de l’institut XLIM, à l’Université de Poitiers. A ce titre, je tiens à remercier Madame Christine FernandezMaloigne, directrice du département SIC, pour m’avoir permis d’intégrer le laboratoire ainsi que l’Agence Nationale de la Recherche qui a financé ces travaux à travers le projet CAIMAN. Je tiens à remercier chaleureusement Monsieur Christian Olivier, Professeur à l’Université de Poitiers, qui a dirigé ces travaux de thèse ainsi que Messieurs Clency Perrine et Yannis Pousset, respectivement Maître de Conférences et Professeur à l’Université de Poitiers, pour m’avoir co-encadré au cours de ces trois années. Je tiens à exprimer ma gratitude à Monsieur François-Xavier Coudoux, Professeur à l’Université de Valenciennes ainsi que Monsieur Frédéric Dufaux, Directeur de Recherche CNRS à Télecom Paris Tech, pour avoir accepté de rapporter ce manuscrit. Je tiens également à remercier Monsieur Ramesh Pyndiah, Professeur à Télecom Bretagne, Monsieur Cyril Bergeron, Ingénieur chez Thalès Communications et Monsieur Mohamed-Chaker Larabi, Maître de Conférences à l’Université de Poitiers, pour avoir accepté de faire partie du Jury. J’ai une pensée pour tous les membres du projet CAIMAN que j’ai pu côtoyer au cours des nombreuses réunions de travail. Je remercie à ce titre Monsieur Didier Nicholson, chef du projet CAIMAN, pour les discussions enrichissantes que l’on a pu avoir. Je tiens à remercier très sincèrement tous les membres du laboratoire, stagiaires, thésards, permanents, secrétaires pour leur accueil chaleureux et leur bonne humeur. Je leur souhaite à tous une bonne continuation dans leurs projets. Je tiens naturellement à remercier ma famille et mes amis qui m’ont soutenu au cours des bons, comme des mauvais moments. Enfin, je ne remercierai jamais assez Flora et Mayko qui m’ont apporté un soutien sans limite, et qui ont dû me supporter durant ces trois années de travail. TABLE DES MATIERES Liste des acronymes et abréviations v Annotations ix Table des figures xi Liste des tableaux xv Introduction 1 1 Stratégies de transmission d’images sur canal sans fil 5 1.1 Introduction ................................................................................................................ 6 1.2 La chaîne de communication numérique ................................................................... 6 1.2.1 Le codeur de source ............................................................................................ 7 1.2.2 Le codeur de canal ............................................................................................ 10 1.2.3 Les modulations numériques ............................................................................ 11 1.3 Le canal de transmission sans fil.............................................................................. 12 1.3.1 Phénomènes liés au canal de transmission ....................................................... 12 1.3.2 Modélisation du canal de transmission sans fil ................................................ 15 1.3.2.1 Modèles déterministes.................................................................................. 15 1.3.2.2 Modèles statistiques ..................................................................................... 16 1.3.2.3 Modèle de canal réaliste considéré dans la thèse ......................................... 17 1.4 Notion de diversité ................................................................................................... 19 1.5 Introduction aux systèmes MIMO ........................................................................... 20 1.5.1 Modélisation du canal MIMO .......................................................................... 21 1.5.2 Systèmes MIMO en boucle ouverte ................................................................. 22 1.5.3 Systèmes MIMO en boucle fermée .................................................................. 23 1.5.4 Les récepteurs MIMO....................................................................................... 24 1.5.5 Association MIMO-OFDM .............................................................................. 25 1.6 Etat de l’art sur les stratégies de transmission d’images .......................................... 26 1.6.1 Stratégies de protection inégale contre les erreurs ........................................... 27 1.6.2 Stratégies d’allocation de puissance inégale .................................................... 30 1.6.3 Stratégies de transmission basées sur la modulation ........................................ 33 1.7 Synthèse et conclusion ............................................................................................. 36 2 Performances des précodeurs linéaires pour la transmission d’images JPWL 39 2.1 Introduction .............................................................................................................. 40 2.2 Le précodage linéaire ............................................................................................... 40 2.2.1 Transformation en canal virtuel........................................................................ 40 i TABLE DES MATIERES 2.2.2 Les précodeurs diagonaux ................................................................................ 42 2.2.3 Les précodeurs non-diagonaux ......................................................................... 46 2.3 Stratégie de transmission d’images sur canal MIMO .............................................. 48 2.3.1 Motivations....................................................................................................... 48 2.3.2 Schéma de transmission.................................................................................... 49 2.3.3 Décodeur JPWL robuste ................................................................................... 50 2.4 Etude des performances des précodeurs linéaires .................................................... 52 2.4.1 Contexte de simulation ..................................................................................... 52 2.4.1.1 Paramétrage de la couche physique ............................................................. 52 2.4.1.2 Paramétrage de la couche application .......................................................... 52 2.4.1.3 Métriques d’évaluation................................................................................. 54 2.4.1.4 Modélisation du canal .................................................................................. 55 2.4.2 Résultats de simulation..................................................................................... 56 2.4.2.1 Résultats sur canal statistique....................................................................... 56 2.4.2.2 Résultats sur canal réaliste ........................................................................... 59 2.5 Synthèse et conclusion ............................................................................................. 64 3 Prise en compte du contenu dans un système MIMO précodé 67 3.1 Introduction .............................................................................................................. 68 3.2 Algorithme de précodage basé sur le contenu.......................................................... 68 3.2.1 Principe............................................................................................................. 68 3.2.2 Modèle d’allocation successive de la puissance............................................... 69 3.2.3 Prise en compte du codage canal dans l’allocation de la puissance ................. 71 3.2.4 Algorithme d’approximation du TEB cible...................................................... 73 3.2.5 Algorithme d’allocation successive de la puissance......................................... 75 3.3 Résultats de simulations ........................................................................................... 77 3.3.1 Résultats sur canal statistique ........................................................................... 77 3.3.2 Résultats sur canal réaliste................................................................................ 79 3.3.2.1 Performances en l’absence de CCE ............................................................. 80 3.3.2.2 Impact du codage canal ................................................................................ 83 3.3.2.3 Impact de la modulation ............................................................................... 83 3.3.2.4 Analyse visuelle ........................................................................................... 85 3.3.3 Impact des erreurs d’estimation sur la CSI....................................................... 88 3.3.3.1 Modèle d’erreur d’estimation ...................................................................... 88 3.3.3.2 Robustesse des précodeurs aux erreurs d’estimation sur la CSI .................. 89 3.4 Synthèse et conclusion ............................................................................................. 91 4 Stratégie d’adaptation de lien pour la transmission d’un contenu JPWL 93 4.1 Introduction .............................................................................................................. 94 4.2 Stratégie de transmission optimisée ......................................................................... 94 4.3 Définition des contraintes......................................................................................... 95 4.3.1 Contrainte de débit............................................................................................ 95 4.3.2 Contrainte sur la QoS ....................................................................................... 96 4.3.3 Contrainte sur la puissance ............................................................................... 96 4.4 Minimisation de la distorsion................................................................................... 96 ii TABLE DES MATIERES 4.5 Représentation arborescente pour la résolution du problème .................................. 98 4.5.1 Commentaires sur le choix adopté.................................................................... 99 4.5.2 Construction de l’arbre ..................................................................................... 99 4.5.3 Recherche du chemin minimisant la distorsion.............................................. 102 4.6 Résultats de simulations sur canal réaliste ............................................................. 102 4.6.1 Contexte de simulation ................................................................................... 102 4.6.1.1 Définition de la configuration de base ....................................................... 103 4.6.1.2 Définition des paramètres pour la stratégie d’adaptation de lien ............... 104 4.6.2 Apports de la stratégie d’adaptation de lien ................................................... 105 4.6.3 Gestion des ressources.................................................................................... 108 4.6.4 Complexité de la solution ............................................................................... 109 4.6.5 Analyse visuelle.............................................................................................. 111 4.7 Synthèse et conclusion ........................................................................................... 115 5 Analyse du contenu dans l’appréciation de la qualité de l’expérience 117 5.1 Introduction ............................................................................................................ 118 5.2 Problématique......................................................................................................... 119 5.3 Les métriques de qualité......................................................................................... 122 5.4 Solution proposée................................................................................................... 123 5.4.1 La métrique à référence réduite QIP.............................................................. 123 5.4.2 Intégration de QIP dans la stratégie de transmission..................................... 124 5.4.3 Remarques sur l’utilisation de QIP dans le cadre de la stratégie de transmission................................................................................................... 125 5.5 Résultats de simulation sur canal réaliste............................................................... 126 5.5.1 Analyse objective .......................................................................................... 126 5.5.2 Analyse visuelle............................................................................................. 130 5.6 Validation subjective.............................................................................................. 135 5.6.1 Motivations.................................................................................................... 135 5.6.2 Protocole de test............................................................................................. 135 5.6.2.1 Base d’images ............................................................................................ 135 5.6.2.2 Panel d’observateurs .................................................................................. 136 5.6.2.3 Présentation des images ............................................................................. 136 5.6.3 Analyse des résultats ..................................................................................... 137 5.7 Synthèse et conclusion ........................................................................................... 140 Conclusion et perspectives 141 Bibliographie 145 Liste de publications 157 iii LISTE DES ACRONYMES ET ABREVIATIONS AC ADSL AIC ANR BBAG BLAST bpp BPSK bVQM CAIMAN CBP CCE CL CRC CSI CST DAST dB DC DCT ddp DEMUX DPCM DSP DVB-T DWT EEP EPA EPB EPH FSK GOP HD IES IFFT iid Alternative Components Asymetric Digital Subscriber Line Advanced Image Coding Agence Nationale de la Recherche Bruit Blanc Additif Gaussien Bells Laboratory Layered Space-Time bit par pixel Binary Phase Shift Keying batch Video Quality Metric Codage Avancé d’IMAges et Nouveaux services Content-Based Precoder Code Correcteur d’Erreurs Closed Loop Cyclic Redundancy Code Channel State Information Codage Spatio-Temporel Diagonal Algebraic Space-Time Decibel Direct Components Discrete Cosinus Transform densité de probabilité Démultiplexage Differential Pulse Coding Modulation Densité Spectrale de Puissance Digital Video Broadcasting – Terrestrial Discrete Wavelet Transform Equal Error Protection Equal Power Allocation Error Protection Block End of Packet Header Frequency Shift Keying Group Of Pictures Haute Définition Interférence Entre Symboles Inverse Fast Fourier Transform indépendent et identiquement distribué v LISTE DES ACRONYMES ET ABREVIATIONS JPEG JPWL JSCC LAR LOS LSB LST LTE MAQ MBER MCS MDC MIMO MISO ML MMSE MSB MUX NLOS OFDM OG OL OSI OSM PAM PAPR PDA PSK PSNR QIP QoE QoS RCPC RI ROI RS RSB RSBI Rx-CSI SCFDE SIC SIMO SISO SNR vi Joint Photographic Expert Group JPEG Wireless Joint Source Channel Coding Ligne A Retard Line Of Sight Least Significant Bit Layered Space-Time Long Term Evolution Modulation d’Amplitude en Quadrature Minimum Bit Error Rate Modulation and Coding Scheme Multiple Description Coding Multiple Input Multiple Output Multiple Input Single Output Maximum Likelihood Minimum Mean Square Error Most Significant Bit Multiplexage Non Line Of Sight Orthogonal Frequency Division Multiplexing Optique Géométrique Open Loop Open System Interconnection Orthogonalized Spatial Multiplexing Pulse Amplitude Modulation Peak to Average Power Ratio Personal Digital Assistant Phase Shift Keying Peak Signal to Noise Ratio Quality by Interest Points Quality of Experience Quality of Service Rate-Compatible Punctured Convolutional Réponse Impulsionnelle Region of Interest Reed-Solomon Rapport Signal sur Bruit Rapport Signal sur Bruit plus Interférence CSI disponible en réception Single Carrier Frequency Domain Equalization Successive Interference Cancelation Single Input Multiple Output Single Input Single Output Signal to Noise Ratio LISTE DES ACRONYMES ET ABREVIATIONS SOP SPIHT SSIM STBC STTC SVC SVD SVH TAST TDL TEB TNT TUD Tx-CSI UEP UPA US VLC WF WSS XLIM-SIC ZF Start Of Packet Set Partitioning In Hierarchical Trees Structural Similarity Space-Time Block Code Space-Time Treillis Code Scalable Video Coding Singular Value Decomposition Système Visuel Humain Threaded Algebraic Space-Time Tap Delay Line Taux d’Erreur Binaire Télévision Numérique Terrestre Théorie Uniforme de la Diffraction CSI disponible à l’émission Unequal Error Protection Unequal Power Allocation Uncorrelated Scattering Variable Length Coding Water-Filling Wide Sense Stationarity Département Signal Image Communication de l’institut XLIM Zero Forcing vii ANNOTATIONS nT nR λ E[.] Nombre d’antennes à l’émission Nombre d’antennes à la réception Longueur d’onde Espérance mathématique . Norme euclidienne . Partie entière .* erfc(.) diag(.) W0(.) I0(.) δ H F G Hv Ib M N K t Ts P0 b dmin σ Transposé conjugué Fonction d’erreur complémentaire Matrice définie par sa diagonale Fonction de Lambert d’index 0 Fonction de Bessel modifiée de 1ère espèce d’ordre 0 Impulsion de Dirac Lagrangien Ensemble des symboles complexes d’une constellation Matrice de canal Matrice de précodage Matrice de décodage Matrice de canal virtuel Matrice identité de taille b Ordre de modulation correspondant au nombre d’états d’une constellation Nombre de blocs d’information en sortie d’un CCE Nombre de blocs d’information en entrée d’un CCE Capacité de correction d’un code RS(N,K) Temps symbole Puissance moyenne totale transmise sur les nT antennes Nombre de sous-canaux SISO disponibles Distance euclidienne minimale de la constellation de réception Gain total du canal MIMO σ i2 RSB sur le sous-canal i fi 2 Coefficient de précodage sur le sous-canal i Peb PRS,i TEBC,i Bi Pr Probabilité d’erreur binaire avant décodage canal Probabilité d’erreur binaire après décodage RS sur le sous-canal i TEB cible avant décodage canal sur le sous-canal i TEB cible après décodage canal sur le sous-canal i Puissance résiduelle ix ANNOTATIONS RS Smax βS βC L x Débit de la source en bpp Nombre de symboles OFDM utilisables par sous-canal Nombre de bits alloués au codage de la source Nombre de bits alloués au codage canal Nombre de sous-canaux SISO utilisés par la stratégie d’adaptation de lien TABLE DES FIGURES 1.1 1.2 1.3 1.4 Synoptique d'une chaîne de communication numérique .................................................. 6 Synoptique d’un codeur de source appliqué à l’image .................................................... 7 Principe de fonctionnement du codeur JPEG 2000 ......................................................... 9 Répartition des symboles dans le plan complexe pour les constellations MAQ-4, MAQ-16 et MAQ-64 ..................................................................................................... 12 1.5 Influence des évanouissements sur le signal transmis [18] ........................................... 13 1.6 Illustration du phénomène de trajets multiples [19] ...................................................... 14 1.7 Synoptique du simulateur de canal à tracé de rayons 3D [28] ....................................... 17 1.8 Schéma de transmission MIMO à nT × nR antennes ...................................................... 21 1.9 Exemple d’architecture LST .......................................................................................... 22 1.10 Exemple de code STBC : code d’Alamouti ................................................................... 23 1.11 Schéma d’un modulateur OFDM ................................................................................... 26 1.12 Constellation d’une modulation MAQ-16 hiérarchique ................................................ 33 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 2.10 2.11 2.12 2.13 2.14 2.15 Schéma-bloc d’un canal MIMO précodé en canal virtuel ............................................. 41 Schéma-bloc d’un précodeur diagonal .......................................................................... 43 Schéma-bloc d’un précodeur non-diagonal ................................................................... 46 Correspondance entre la source et le canal dans la stratégie de transmission ............... 49 Schéma de la stratégie de transmission d’image JPWL ................................................ 50 Implémentation du décodeur JPWL robuste .................................................................. 51 Images transmises dans le cadre des simulations : (a) « Caps » et (b) « Monarch » ..... 53 Répartition des couches de qualité JPWL et des données EPB sur les sous-canaux SISO................................................................................................................................ 53 (a) Topologie de l’environnement de transmission et (b) évolution du gain du canal MIMO ................................................................................................................... 55 Courbe de TEB global des différentes stratégies de précodage ..................................... 56 Evolution du PSNR et du score SSIM avec différentes configurations de codage canal sur un canal statistique pour l’image « Caps » ..................................................... 57 Evolution du PSNR et du score SSIM avec différentes configurations de codage canal sur un canal statistique pour l’image « Monarch » .............................................. 58 Evolution du TEB par sous-canal pour les différentes stratégies de précodage ............ 59 Evolution du PSNR et du score SSIM avec différentes configurations de codage canal sur un canal réaliste pour l’image « Caps » .......................................................... 60 Evolution du PSNR et du score SSIM avec différentes configurations de codage canal sur un canal réaliste pour l’image « Monarch » ................................................... 61 xi TABLE DES FIGURES 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 3.10 3.11 3.12 3.13 3.14 3.15 4.1 4.2 4.3 Synoptique de la stratégie UPA ..................................................................................... 69 Evolution des coefficients de précodage en fonction du RSB, de l’ordre de modulation et du TEB cible ........................................................................................... 70 Performances des codes RS implémentés dans la norme JPWL ................................... 71 Variation du paramètre TEBC,i pour différentes valeurs de Bi et pour différentes capacités de correction ti ................................................................................................ 73 Algorithme d’approximation du TEB cible ................................................................... 74 Algorithme d’allocation successive de la puissance ...................................................... 76 Courbe de TEB global des différentes stratégies de précodage ..................................... 78 Evolution du TEB par sous-canal pour les différentes stratégies de précodage ............ 79 Evolution du PSNR et du score SSIM avec différentes configurations de codage canal sur un canal réaliste pour l’image « Caps » .......................................................... 80 Evolution du PSNR et du score SSIM avec différentes configurations de codage canal sur un canal réaliste pour l’image « Monarch » ................................................... 81 Evolution du PSNR et du score SSIM de l’image « Caps » sur le canal réaliste avec une modulation MAQ-16 ...................................................................................... 84 Evolution du PSNR et du score SSIM de l’image « Monarch » sur le canal réaliste avec une modulation MAQ-16 ...................................................................................... 85 Comparaison visuelle entre les résultats fournis par les précodeurs pour l’image « Caps » dans de mauvaises conditions de transmission (zone 1, indice 251) et sans CCE sur les données utiles ..................................................................................... 86 Comparaison visuelle entre les résultats fournis par les précodeurs pour l’image « Monarch » dans des conditions de transmission moyennes (zone 4, indice 2259) avec un code RS(37,32) sur les données utiles .............................................................. 87 Impact des erreurs d’estimation sur la CSI en termes de PSNR et de score SSIM pour l’image « Caps » .................................................................................................... 90 Synoptique de la stratégie d’adaptation de lien ............................................................. 95 Exemple de représentation en arbre pour 2 sous-canaux SISO ................................... 100 Résultats de simulation (PSNR et score SSIM) pour l’image « Caps » avec la configuration de base .................................................................................................... 106 4.4 Apport de la stratégie d’adaptation de lien (PSNR et score SSIM) pour l’image « Caps » ........................................................................................................................ 106 4.5 Résultats de simulation (PSNR et score SSIM) pour l’image « Monarch » avec la configuration de base .................................................................................................... 107 4.6 Apport de la stratégie d’adaptation de lien (PSNR et score SSIM) pour l’image « Monarch » .................................................................................................................. 107 4.7 Variation du débit source des images JPWL fournie par l’optimisation conjointe de la stratégie d’adaptation de lien ............................................................................... 108 4.8 Utilisation des ordres de modulation et des sous-canaux en fonction de la position sur la trajectoire du récepteur........................................................................................ 109 4.9 Evolution du nombre de configurations évaluées dans l’arbre .................................... 110 4.10 Comparaison visuelle entre les résultats fournis par le précodeur CBP et par la stratégie d’adaptation de lien pour l’image « Caps » et pour différentes conditions de transmission ............................................................................................................. 112 xii TABLE DES FIGURES 4.11 Comparaison visuelle entre les résultats fournis par le précodeur CBP et par la stratégie d’adaptation de lien pour l’image « Monarch » et pour différentes conditions de transmission............................................................................................ 113 4.12 Présence de distorsions au décodage ........................................................................... 114 5.1 5.2 5.3 5.4 5.5 5.6 5.7 5.8 5.9 5.10 5.11 5.12 5.13 5.14 5.15 5.16 5.17 5.18 5.19 Décodage sous-optimal de l’image « Caps1615 » ......................................................... 119 Cas de décodage sous-optimal en termes de PSNR pour l’image « Caps » ................ 120 Cas de décodage sous-optimal en termes de score SSIM pour l’image « Caps » ....... 120 Organigramme de la métrique à référence réduite QIP ................................................ 123 Stratégie de transmission intégrant QIP pour un cas de figure « extrême » à trois couches de qualité ........................................................................................................ 124 Distorsions typiques de JPWL ..................................................................................... 125 Comparaison des performances de la stratégie d’adaptation de lien avec ou sans stratégie de décodage pour l’image « Caps » .............................................................. 127 Comparaison des performances de la stratégie d’adaptation de lien avec ou sans stratégie de décodage pour l’image « Monarch » ........................................................ 127 Impact de la stratégie de décodage basée QIP pour l’image « Caps » ........................ 128 Impact de la stratégie de décodage basée QIP pour l’image « Monarch » .................. 129 Analyse visuelle de l’impact de la stratégie de décodage pour « Caps1567 » ............... 131 Analyse visuelle de l’impact de la stratégie de décodage pour « Caps886 » ................. 132 Analyse visuelle de l’impact de la stratégie de décodage pour « Monarch780 » .......... 133 Analyse visuelle de l’impact de la stratégie de décodage pour « Monarch1012» .......... 134 Base d’images utilisée : (a) Caps, (b) House et (c) Monarch ...................................... 135 Interface développée pour le test subjectif .................................................................. 137 Proportion de préférence des observateurs pour l’ensemble de la base d’images........ 138 Détail des scores moyens pour toutes les images et tous les observateurs .................. 138 Détail des scores moyens par image pour tous les observateurs ................................. 139 xiii LISTE DES TABLEAUX 2.1 2.2 2.3 2.4 2.5 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 5.1 5.2 5.3 5.4 Distorsion des images tests pour un codage de 0,25bpp par couche de qualité avec ou sans codage canal, en termes de PSNR (dB) et de score SSIM ................................ 54 Performances moyennes pour l’image « Caps » sans codage canal ............................... 62 Performances moyennes pour l’image « Caps » avec code RS(37,32) .......................... 62 Performances moyennes pour l’image « Monarch » sans codage canal......................... 62 Performances moyennes pour l’image « Monarch » avec code RS(37,32) ................... 62 Approximation du TEB cible pour les codes de la norme JPWL avec Bi = 10-9 ............ 73 Performances moyennes pour l’image « Caps » sans codage canal .............................. 82 Performances moyennes pour l’image « Caps » avec code RS(37,32) ......................... 82 Performances moyennes pour l’image « Monarch » sans codage canal ........................ 82 Performances moyennes pour l’image « Monarch » avec code RS(37,32) ................... 82 Performances moyennes pour l’image « Caps » avec code RS(37,32) et modulation MAQ-16....................................................................................................... 84 Performances moyennes pour l’image « Monarch » avec code RS(37,32) et modulation MAQ-16....................................................................................................... 85 Impact de l’erreur d’estimation sur la CSI en termes de PSNR moyen (en dB) pour l’image « Caps » avec un code RS(37,32) ............................................................. 90 Programme d’initialisation pour la création de l’arbre ............................................... 100 Fonction récursive permettant la création de l’arbre répertoriant les configurations de codage/transmission ................................................................................................. 101 Définition des paramètres de la configuration de base ................................................. 103 Distorsion (PSNR en dB et SSIM) des images tests pour un codage de 0,125bpp par couche de qualité avec code RS(37,32) sur les données utiles............................... 103 Définition des paramètres de la stratégie d’adaptation de lien ..................................... 104 Performances moyennes pour l’image « Caps »........................................................... 106 Performances moyennes pour l’image « Monarch » .................................................... 107 Nombre moyen de configurations évaluées par l’arbre en fonction des conditions de transmission ............................................................................................................. 110 Analyse des cas de décodage sous-optimal pour les images « Caps » et « Monarch » ................................................................................................................. 121 Performances moyennes en fonction des conditions de transmission ......................... 128 Statistiques sur l’impact de la stratégie de décodage pour l’image « Caps » .............. 128 Statistiques sur l’impact de la stratégie de décodage pour l’image « Monarch » ........ 129 xv INTRODUCTION Avec le développement des appareils photographiques numériques, des smartphones permettant de prendre des photos puis de les diffuser, de l’Internet et des médias, nous vivons actuellement une ère où l’image tient une place fondamentale dans notre quotidien. Dans le monde contemporain, ces images jouent, entre autres, un rôle d’information par le biais des médias, de lien social (échanges personnels, réseaux sociaux, etc.) ou de support technique comme dans le cadre de l’imagerie médicale ou des technologies liées à la surveillance (par exemple aérienne, satellite, météorologique, vidéosurveillance), etc. Si l’on se focalise uniquement sur l’aspect technique et non sur leur finalité, les images numériques sont destinées à être stockées et/ou diffusées. Le stockage des images numériques est un problème connu et traité depuis longtemps. En effet, les images numériques constituent un média très lourd nécessitant beaucoup d’espace mémoire pour être stockées dans leur format original. De la même manière, la diffusion des images pose des problèmes vis-à-vis des ressources spectrales disponibles qui sont, par nature, limitées. Pour faire face à cette problématique, une norme de compression pour les images numériques a été mise au point via un comité d’experts en 1992, à savoir le standard JPEG1. Le principe général de la compression consiste à supprimer les informations non-perceptibles par les sens humain (la vision dans le cadre de l’image), afin de diminuer la taille des données. Le standard JPEG a connu un succès très important. Il est d’ailleurs encore utilisé. Toutefois, avec l’évolution des technologies, les algorithmes de compression ont dû constamment s’adapter afin d’intégrer les contraintes ou les services liés aux applications modernes. Le standard JPEG a ainsi évolué en 2002 vers le standard JPEG 2000, initialement développé pour les applications multimédias de l’époque qui recouvraient entre autres la photographie numérique, le cinéma numérique, l’imagerie médicale, l’Internet et la transmission d’images sur canal sans fil (par le biais du codeur JPEG 2000 Wireless ou JPWL). Dans l’optique de moderniser son codeur, le comité JPEG a lancé en 2008 un appel à projet en vue de créer le standard AIC2. Comme pour JPEG 2000 à son époque, l’idée est d’intégrer de nouvelles fonctionnalités en lien avec l’évolution des technologies et des pratiques. De cet appel à projet est né le projet ANR CAIMAN3 (Codage Avancée d’IMAges et Nouveaux services) dans lequel s’inscrit cette thèse. L’objectif global de ce projet est d’intégrer conjointement des services liés à la sécurité (tatouage) et à la robustesse pour la transmission, sans sacrifier l’efficacité de la compression (étude de nouvelles transformées fréquentielles) et la qualité perçue par l’utilisateur final (contraintes psychovisuelles). Les travaux développés au cours de cette thèse, effectuée au département Signal Image 1 Joint Photographic Experts Group Advanced Image Coding 3 Projet CAIMAN ANR-08-TO-002 2 1 INTRODUCTION Communication (SIC) de l’institut XLIM à l’Université de Poitiers, se focalisent sur la robustesse des images lors de la transmission sur canaux sans fil. Le développement important des télécommunications auquel nous avons pu assister au cours de ces dernières années a permis de s’affranchir de bien des difficultés liées à la transmission. En outre, il est devenu possible de multiplier de manière exponentielle le nombre d’utilisateurs de téléphone mobile, de permettre la transmission d’informations aussi diverses que la voix, le texte ou l’image, et cela, avec une qualité de service (QoS4) relativement fiable. Toutefois, de nouveaux défis technologiques se posent dans le domaine des télécommunications qui doit s’adapter à de nouvelles contraintes. En effet, les informations à transmettre deviennent toujours plus volumineuses avec, par exemple, l’émergence de la Haute Définition (HD). Par ailleurs, les applications requérant un traitement en temps réel sont également plus nombreuses. De plus, les supports de réception tendent vers plus d’hétérogénéité, ce qui pose le problème de la gestion de la mémoire, de la résolution ou de l’énergie qu’il faut considérer aussi bien pour un téléphone mobile que pour ordinateur portable ou un PDA5. Concernant ces aspects, la notion de scalabilité semble être une réponse appropriée et est devenue un enjeu majeur à intégrer dans les standards de compression (à l’image du standard vidéo H.264 SVC6). Ces contraintes propres à la source (efficacité de compression, scalabilité, etc.), s’additionnent à celles apportées par le canal de transmission. Il faut ainsi s’affranchir du problème de multitrajets que l’on retrouve typiquement dans les environnements urbains et suburbains, et qui est responsable du phénomène de sélectivité fréquentiel. Il faut également pouvoir assurer la transmission dans un contexte de mobilité (voiture, train) entraînant de l’effet Doppler. Pour résumer, il devient impératif d’assurer une qualité de service sur des canaux soumis à de fortes variations spatio-temporelles. Un des principes fondamentaux utilisé en télécommunication consiste à tirer profit de la diversité offerte par le canal de transmission afin de lutter contre les dégradations apportées par le canal sur le signal émis. En effet, au cours d’une transmission le canal est soumis à des variations. Ces dernières peuvent tout d’abord être temporelles car le canal de transmission n’est pas stationnaire dans le temps, en particulier dans un environnement urbain soumis à un mouvement permanent (voitures, piétons, etc). Si le canal n’est pas stationnaire en temps, il n’est également pas stationnaire en fréquence. Les environnements riches en multitrajets conduisent au phénomène de retard de propagation entraînant la superposition d’ondes en réception. Ces ondes vont être constructives ou destructives, conduisant ainsi à des plages de fréquences favorables ou inexploitables. Ainsi, dans un schéma de télécommunication classique constitué d’une antenne émettrice et d’une antenne réceptrice (SISO pour Single Input Single Output), la diversité temporelle sera exploitée par une répétition du signal à émettre espacée du temps de cohérence du canal (temps au-delà duquel les propriétés du canal sont considérées changeantes). Toutefois cette technique induit un retard dû à la retransmission et une baisse importante du débit utile. L’impact des variations temporelles du canal peut également être minimisé par un entrelacement des données. La diversité fréquentielle est généralement traitée par des modulations multi-porteuses. Ces modulations permettent de considérer la transmission du signal en bande large sur plusieurs canaux à bande étroite, permettant ainsi de minimiser l’effet des évanouissements fréquentiels. Bien que ces techniques aient fait leurs preuves, elles restent limitées et ne peuvent assurer une qualité de service garantie face aux contraintes susmentionnées. On peut alors faire appel aux Code Correcteur d’Erreurs (CCE) mais leur utilisation abusive se fait au détriment du débit utile. Dans le cadre du projet CAIMAN, la solution avancée pour pallier 4 Quality of Service Personal Digital Assistant 6 Scalable Video Coding 5 2 INTRODUCTION les difficultés liées à la transmission consiste à multiplier les techniques de diversité afin d’en tirer parti. On fait en particulier appel à la technologie MIMO7 qui consiste à multiplier le nombre d’antennes à l’émission et à la réception afin d’ajouter de la diversité spatiale. L’enjeu de cette thèse consiste donc à proposer des solutions efficaces permettant d’assurer la qualité de services pour la transmission d’images numériques dans des conditions de transmission difficiles et via des systèmes MIMO. Pour ce faire, nous mettons en relation les particularités liées au codage de l’image avec les spécificités du canal MIMO dans l’hypothèse de la connaissance de l’état du canal (CSI pour Channel State Information) du côté de l’émetteur (MIMO en boucle fermée). Cette connaissance permet, en particulier, de mettre en place des stratégies de précodage qui agissent comme une pré-égalisation via l’optimisation d’un critère. Ce document est structuré en cinq chapitres : Le premier chapitre a pour but d’introduire les notions de base pour la compréhension du manuscrit. Nous présentons tout d’abord la chaîne de communication numérique à travers les différents blocs qui la constitue. Puis nous étudions les spécificités du canal de transmission sans fil, ainsi que les différentes méthodes pour le modéliser. Il s’en suit une introduction aux systèmes MIMO avec la présentation du modèle en bande de base. Nous terminons ce chapitre par une étude bibliographique des stratégies de transmission d’images. Cette étude repose sur une classification des stratégies autour de trois points, à savoir, le codage canal, l’allocation de la puissance et enfin l’usage de la modulation. Le deuxième chapitre présente la stratégie de transmission mise en œuvre dans ces travaux pour la transmission d’images codées en couches de qualité via le codeur JPWL. Cette stratégie est basée sur l’usage des précodeurs MIMO et la correspondance entre les hiérarchies de la source et du canal. Nous présentons donc le principe du précodage linéaire qui repose sur une transformation du canal MIMO en canaux SISO virtuels. Ce chapitre décrit également les précodeurs diagonaux et non-diagonaux qui sont utilisés dans le cadre de nos travaux. Nous évaluons les performances de la stratégie de transmission avec les différents précodeurs MIMO, sur un canal statistique ainsi que sur un canal réaliste modélisé via un simulateur 3D à tracé de rayons. Nous proposons, dans le troisième chapitre, une solution de précodage prenant en compte la sensibilité du contenu aux erreurs de transmission. Les coefficients de précodage sont déterminés en fonction des conditions du canal de transmission, du codage canal, de la modulation et d’un TEB8 cible lié à la sensibilité du contenu. Après avoir détaillé le fonctionnement de l’algorithme, nous évaluons ses performances sur le canal statistique et sur le canal réaliste, en le comparant aux précodeurs de la littérature. Nous étudions en outre l’impact du codage canal, de la modulation et des erreurs d’estimation sur la CSI. Afin de rendre le schéma proposé adaptatif aux variations du canal de transmission, , nous détaillons, dans le quatrième chapitre, une stratégie d’adaptation de lien basée sur le précodage développé dans le chapitre trois. Le but consiste à faire varier les paramètres liés au codage canal, à la modulation et au codage source, afin de fournir un jeu de paramètres optimaux pour minimiser la distorsion (au sens de l’erreur quadratique) des images reçues. Après avoir formulé le problème d’optimisation et les contraintes associées, nous proposons une méthode permettant d’évaluer les différentes configurations de codage/transmission. La configuration minimisant l’erreur quadratique moyenne est alors sélectionnée pour la 7 8 Multiple Input Multiple Output Taux d’Erreur Binaire 3 INTRODUCTION transmission d’une image. Nous évaluons l’apport en termes de PSNR9 et de score SSIM10, lié à cette stratégie ainsi que la gestion des ressources. Le cinquième chapitre est une ouverture vers la notion de qualité d’expérience (QoE ). Le problème formulé par la stratégie d’adaptation de lien est effectivement optimal au sens de la QoS. Toutefois on démontre dans ce chapitre, qu’il ne l’est pas nécessairement au sens de la qualité perçue par l’utilisateur. Nous proposons alors d’intégrer une métrique à référence réduite basée sur des contraintes psychovisuelles afin d’évaluer les différentes configurations de décodage qui se présentent en réception. L’intérêt de cette approche est ensuite corroboré via une campagne de tests subjectifs sur un panel d’observateurs. 11 Enfin, nous terminons ce manuscrit par une conclusion et quelques perspectives. 9 Peak Signal to Noise Ratio Structural Similarity 11 Quality of Experience 10 4 CHAPITRE 1 STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL Sommaire 1.1 Introduction 6 1.2 La chaîne de communication numérique 1.2.1 Le codeur de source 1.2.2 Le codeur de canal 1.2.3 Les modulations numériques 6 7 10 11 1.3 Le canal de transmission sans fil 1.3.1 Phénomènes liés au canal de transmission sans fil 1.3.2 Modélisation du canal de transmission sans fil 12 12 15 1.3.2.1 1.3.2.2 1.3.2.3 1.4 Modèles déterministes Modèles statistiques Modèle de canal réaliste considéré dans la thèse Notion de diversité 15 16 17 19 1.5 Introduction aux systèmes MIMO 1.5.1 Modélisation du canal MIMO 1.5.2 Systèmes MIMO en boucle ouverte 1.5.3 Systèmes MIMO en boucle fermée 1.5.4 Les récepteurs MIMO 1.5.5 Association MIMO-OFDM 20 21 22 23 24 25 1.6 Etat de l’art sur les stratégies de transmission d’images 1.6.1 Stratégies de protection inégale contre les erreurs 1.6.2 Stratégies d’allocation de puissance inégale 1.6.3 Stratégies de transmission basées sur la modulation 26 27 30 33 1.7 Synthèse et conclusion 36 5 CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL 1.1 Introduction Notre étude traite de la mise en œuvre d’une stratégie permettant la transmission d’images sur un canal sans fil à travers un système MIMO. L’intérêt d’une stratégie de transmission réside dans sa capacité à gérer efficacement les ressources disponibles au regard des objectifs fixés compte tenu de l’application visée. Dans le cadre de notre étude, nous nous intéressons à la robustesse des transmissions d’images sur des canaux sans fil dans des environnements de transmission réalistes, propices aux erreurs. Dans ce contexte, nous disposons de deux possibilités afin d’améliorer la robustesse de la communication. Premièrement, nous tirons parti de la diversité offerte par le canal de transmission. Cette diversité est principalement d’ordre temporel, fréquentiel et spatial. Deuxièmement, nous tirons également parti des blocs constituant la chaîne de communication numérique en utilisant conjointement les différents paramètres qui la compose. Ce type de stratégie est communément appelé codage conjoint source/canal (JSCC12) dans la littérature. Dans la suite de ce manuscrit, nous mettrons en œuvre des stratégies reposant sur ces deux principes. Ce chapitre présente les notions de base permettant la bonne compréhension de la suite du document. Au regard de notre problématique, nous aborderons d’une part, les différentes composantes d’une chaîne de communication numérique, les propriétés des canaux de transmission sans fil ainsi qu’une introduction aux systèmes MIMO. D’autre part, nous présentons un état de l’art non exhaustif sur les stratégies de transmission d’images sur canal sans fil. 1.2 La chaîne de communication numérique L’objectif d’une chaîne de communication numérique est de transmettre un message (appelé source) jusqu’à un destinataire. Le synoptique ci-dessous résume les différents blocs composant une chaîne de transmission numérique : Source Codeur de source Codeur de canal Modulateur Canal de transmission Message Décodeur de source Décodeur de canal Démodulateur Figure 1.1. Synoptique d'une chaîne de communication numérique La source peut être de type analogique ou numérique. Dans le cas d’une source analogique, cette dernière doit subir les étapes d’échantillonnage, de quantification et de codage binaire afin d’être traduite en source numérique. Cette section résume brièvement les 12 6 Joint Source Channel Coding CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL différentes étapes de la chaîne de communication numérique. Des informations complémentaires sont disponibles dans [1] et [2]. 1.2.1 Le codeur de source Un codeur de source a pour but de compresser l’information issue d’une image, d’un son ou plus généralement d’un signal. Cette compression devient possible par une décorrélation maximale (suppression de la redondance) des données constituant la source. Une fois les données décorrélées, il devient aisé de supprimer certaines informations jugées non destructrices du point de vue des sens humain. On va par exemple pouvoir supprimer les hautes fréquences d’un son de manière à le compresser sans dommage pour l’écoute après reconstruction. L’intérêt de cette opération est d’économiser les ressources mémoire pour répondre à des problématiques de stockage, ou bien de limiter le besoin en ressources physiques lors de la transmission sur un support de transmission. Dans le cadre de notre étude, la source considérée est une image. Le codeur de source se présente généralement selon le schéma suivant : Domaine spatial : pixels Domaine fréquentiel : coefficients fréquentiels Image originale Transformation fréquentielle Quantification des coefficients Codage à longueur fixe ou variable Flux binaire compressé (stockage, transmission) Figure 1.2. Synoptique d’un codeur de source appliqué à l’image Transformée fréquentielle Au sein d’une chaîne de codage d’image ou de vidéo, on trouve toujours une phase de transformation fréquentielle. Cette phase a pour but de passer du domaine spatial, caractérisé par les pixels, au domaine fréquentiel caractérisé par des coefficients fréquentiels. L’intérêt d’utiliser une transformée fréquentielle tient dans sa capacité à décorréler l’information présente dans l’image tout en assurant sa reconstruction. Ainsi, on constate qu’une grande partie de l’information utile est concentrée dans un faible pourcentage du domaine spectral (ou fréquentiel). Dans le cadre de la compression d’image, on utilise usuellement la transformée en cosinus discrète (DCT13) [3] et la transformée en ondelettes (DWT14) [4]. On distingue les transformées irréversibles conduisant à un codage avec pertes, des transformées réversibles qui permettent un codage sans perte de l’information. Les transformées irréversibles sont utiles lorsque l’on est contraint à un codage sans erreur, notamment pour les applications médicales. 13 14 Discrete Cosinus Transform Discrete Wavelet Transform 7 CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL Quantification des coefficients Par la suite, on trouve une étape de quantification [1]. Le but de cette dernière est d’associer les coefficients fréquentiels à des classes (uniformes ou non-uniformes). Un coefficient fréquentiel voit alors sa valeur modifiée et prend ainsi la valeur du représentant de la classe. Cette étape est indispensable car il n’est pas possible de coder toutes les valeurs représentées par les coefficients fréquentiels. Codage à longueur fixe ou variable La dernière étape consiste à coder les coefficients quantifiés. Si le codage est à longueur fixe, les coefficients sont codés sur un nombre de bits défini et identique pour tous. Le taux de compression dépend donc uniquement du nombre de coefficients à coder. Le codage peut également être à longueur variable (VLC15) [5]. C’est le cas des codages entropiques dont le code de Huffman [6] est un exemple célèbre, ou bien des codes arithmétiques [7]. Ce type de codage exploite la statistique d’apparition des coefficients quantifiés en attribuant un nombre faible de bits aux éléments les plus redondants et au contraire, un nombre élevé de bits aux éléments les plus rares. Dans ce cas, le taux de compression est plus important que dans le cas d’un codage à longueur fixe mais le flux devient plus sensible aux erreurs. Quelques normes de compression d’images Nous présentons ci-dessous les principales normes de compression d’images développées par le comité JPEG. Ce comité a été crée initialement pour concevoir une norme internationale de compression d’image fixe : • Codeur JPEG : Afin de concevoir un outil commun de travail pour les industriels et la communauté scientifique, le groupe JPEG a standardisé en 1992 le codeur JPEG [8] qui est certainement à ce jour, le codeur d’image le plus utilisé. Son fonctionnement repose schématiquement sur un découpage de l’image en bloc de taille 8×8 pixels. On applique une DCT sur chacun des blocs, puis les coefficients sont quantifiés de manière uniforme. Enfin un balayage en zig-zag sur les coefficients quantifiés permet d’optimiser le codage entropique. Le principal avantage du codeur JPEG réside dans son extrême simplicité. Toutefois, des artefacts liés à la compression empêchent d’atteindre des taux de compression élevés. De plus, en l’absence de stratégie de transmission, un flux binaire compressé par le codeur JPEG se montre très sensible aux erreurs de transmission. • Codeur JPEG 2000 : Devant la nécessité de moderniser son codeur, le comité JPEG a lancé le projet JPEG 2000 [9] en 1997. L’objectif était alors de proposer une méthode de compression innovante intégrant diverses fonctionnalités et objectifs en relation avec le développement des applications multimédias de l’époque. Les thématiques visées par le standard JPEG 2000 recouvrent, entre autres, la photographie numérique, le cinéma numérique, l’internet, l’imagerie médicale, la transmission d’images sur canal sans fil. La principale évolution par rapport au codeur JPEG concerne l’implémentation de la transformée en ondelettes. Cette transformée offre la possibilité d’un codage avec pertes (ondelettes 9/7 de Daubechies) ou sans perte (ondelettes 5/3 de Le Gall). Ce codeur permet également de faire de la scalabilité en qualité ou en résolution et du codage par régions d’intérêt (ROI16). On retiendra en outre, la possibilité de coder une image en plusieurs couches de qualité 15 16 8 Variable Length Coding Region Of Interest CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL correspondant à des portions complémentaires de plans de bits. La figure 1.3 reprend le principe de fonctionnement du codeur JPEG 2000. Figure 1.3. Principe de fonctionnement du codeur JPEG 2000 Une première phase de prétraitement permet un sous-échantillonnage des composantes couleurs et un découpage de l’image en zones (appelées tuiles) codées indépendamment les unes des autres. Ce découpage permet un traitement moins complexe pour les images de grandes tailles. Par la suite, une DWT est appliquée sur chacune des tuiles puis les coefficients d’ondelette subissent une quantification scalaire uniforme avec zone morte. Enfin, un codage arithmétique adaptatif, réalisé au moyen d’un codage par plan de bits associé à un codeur arithmétique, est appliqué aux symboles issus de la quantification. Le codeur JPEG 2000 présente la particularité d’intégrer des outils de robustesse aux erreurs de transmission. L’idée est principalement de compartimenter les mots de code ou de réduire leur longueur afin d’éviter la propagation des erreurs ou de limiter leur impact. Ainsi, la norme prévoit des marqueurs de segment, une terminaison à chaque passe de codage, des marqueurs de resynchronisation. Bien que ces outils limitent l’impact des erreurs de transmission, ils s’avèrent insuffisants pour assurer la robustesse des transmissions d’images dans des environnements de transmission difficiles. • Codeur JPEG 2000 Wireless ou JPWL : Comme on vient de le signaler, les outils de robustesse définis par le schéma de compression de base du codeur JPEG 2000 ne permettent pas d’assurer la transmission d’un flux JPEG 2000 sur des canaux de transmission soumis à d’importantes perturbations. Ces outils permettent uniquement de localiser ou masquer les erreurs puis de resynchroniser le décodeur. De plus, ces outils ne s’appliquent pas aux données d’entête qui sont les données les plus fragiles du flux JPEG 2000. Pour répondre à ces problématiques et permettre une exploitation du codeur JPEG 2000 pour les applications multimédias sans fil, le comité JPEG a défini l’extension JPWL (JPEG 2000 – Part 11) [10] 9 CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL [11] [12] dédiée à l’intégration d’outils spécifiques pour la transmission d’images sur canaux bruités. Ainsi, il a été défini trois nouvelles fonctionnalités qui sont : - l’intégration de Codes Correcteurs d’Erreurs pour la protection des données avec une protection accrue des données d’entête (stratégie UEP17) ; - l’intégration d’un outil de description du degré de sensibilité aux erreurs des différentes parties du codestream ; - l’intégration d’un outil permettant la localisation des erreurs résiduelles dans le codestream. Ces nouvelles fonctionnalités peuvent être avantageusement employées afin de mettre en place des schémas de protection intelligents tels que des stratégies UEP. Dans ce type de schéma, les données les plus sensibles se voient attribuer une redondance plus importante offrant une meilleure robustesse aux erreurs. Au regard de l’état de l’art, le codeur JPWL est le seul standard de compression intégrant des outils spécifiques pour les transmissions d’images sur canal sans fil. A ce titre, nous utiliserons ce codeur dans le cadre de nos simulations. • Codeur JPEG XR : Le défaut principal de JPEG 2000 tient dans sa complexité qui a limité son développement auprès du grand public. Pour répondre à ce problème, le comité JPEG a adopté le standard JPEG XR (pour eXtended Range) [13] en 2007. JPEG XR présente de bonnes performances de compression pour une complexité et pour une utilisation mémoire faible, tant au niveau du codeur que du décodeur. Il utilise pour cela une transformée n’effectuant que des calculs sur des entiers, sans opération en virgule flottante, ce qui limite la complexité tout en restant réversible. Il permet la gestion de format d’image de grandes tailles et de différents types. Il permet également de réaliser une compression sans perte des données. Initialement développé par la société Microsoft sous le nom de Windows Media Photo puis de HD Photo, JPEG XR est prévu principalement pour des applications photographiques de type « grand public », là où JPEG 2000 n’a pas su se positionner. 1.2.2 Le codeur de canal Le codage de canal [14] a pour objectif de protéger l’information compressée issue du codeur de source, des perturbations du canal de transmission. En effet, le codage de source permet un gain en compression mais rend le flux compressé très sensible aux erreurs. Une erreur dans le flux binaire compressé peut être à l’origine d’une désynchronisation en réception. La protection de l’information est réalisée par le biais de CCE. Leur rôle est d’introduire, de manière parfaitement contrôlée, de la redondance dans la séquence compressée. Cette redondance permet par la suite de détecter, voire de corriger certaines erreurs de transmission. Un CCE est défini par son rendement R. Pour un bloc d’information en entrée de taille K, le CCE fournit un bloc codé en sortie de taille N avec K < N. Le rendement du CCE se définit alors par la relation : R= K N (1.1) Plus la valeur de R est petite et plus la redondance introduite est importante, augmentant de la même manière la capacité de correction du CCE. 17 Unequal Error Protection 10 CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL On distingue deux familles de CCE, à savoir les codes en blocs linéaires [14] et les codes convolutifs [15]. Les codes en blocs linéaires fournissent un bloc d'information codé dépendant uniquement du bloc courant en entrée. De la même manière, les codes convolutifs prennent en compte le bloc courant à coder, mais également les blocs codés précédemment. Par conséquent, les codes convolutifs introduisent un effet mémoire. En 1993, Berrou et al. ont présenté le principe des Turbo-codes [16], qui consiste à utiliser deux codeurs convolutifs récursifs fonctionnant en tandem. Ce type de codage canal permet d’approcher la limite théorique d’entropie formulée par Shannon [2]. 1.2.3 Les modulations numériques Le rôle de la modulation est d’adapter le signal au support physique de transmission. Ainsi, le modulateur sert d’interface avec le canal de transmission. Une modulation numérique a pour objet de faire varier un paramètre d’une onde porteuse en fonction du signal à transmettre (signal modulant). Le paramètre considéré caractérise le type de modulation mis en œuvre. On peut ainsi faire varier l’amplitude (PAM18), la phase (PSK19) ou bien la fréquence (FSK20) de l’onde porteuse. Dans le cadre de nos travaux, nous utiliserons la Modulation d’Amplitude en Quadrature (MAQ) qui consiste à moduler l’onde porteuse de manière combinée en amplitude et en phase. Ce type de modulation est très utilisée dans le domaine des communications numériques tel que la téléphonie mobile ou la Télévision Numérique Terrestre (TNT). Nous ne considérons comme contrainte que la puissance moyenne des symboles disponibles, qui doit être unitaire : [ ] = M1 ∑ s E si M 2 i =1 2 i =1 avec si ϵ (1.2) où E[.] est l’espérance mathématique ; M représente le nombre de symboles de la constellation ou l’ordre de modulation ; si est un symbole et est l’ensemble complexe des symboles disponibles. L’ensemble des symboles complexes forme la constellation MAQ dont les points sont répartis uniformément dans le plan complexe (fig. 1.4). La distance séparant deux points de la constellation correspond à 2 β M avec βM défini par [17] : βM = 3 2( M − 1) avec M = 2 n pour n = 2, 3, 4, … (1.3) Il est à noter que du fait de la contrainte sur la puissance moyenne (1.2), l’aire des différents carrés de la figure 1.4 est la même. 18 Pulse Amplitude Modulation Phase Shift Keying 20 Frequency Shift Keying 19 11 CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL Partie imaginaire M = 64 2 βM M = 16 M=4 Partie réelle Figure 1.4. Répartition des symboles dans le plan complexe pour les constellations MAQ-4, MAQ-16 et MAQ-64 1.3 Le canal de transmission sans fil La propagation sur un canal sans fil d’un signal entre un émetteur et un récepteur est largement tributaire des caractéristiques du milieu de propagation ainsi que du système d’émission/réception (les antennes). Dans le cas d’un canal de transmission sans fil, les ondes électromagnétiques acheminent l’information de l’émetteur vers le récepteur en subissant des perturbations. Ces perturbations doivent être prises en compte dans l’élaboration d’une stratégie de transmission. Cette section fait l’inventaire des phénomènes liés au canal de transmission sans fil ainsi que les modèles les plus fréquemment employés pour caractériser ce type de canal. 1.3.1 Phénomènes liés au canal de transmission Le bruit radioélectrique Le bruit radioélectrique est un phénomène indissociable des transmissions sans fil. Lors d’une transmission, des signaux peuvent se superposer au signal émis perturbant ainsi le décodage au niveau de la réception. On qualifie ces signaux de bruit de transmission car ils ne sont porteurs d’aucune information utile. L’origine du bruit radioélectrique peut être très diverse. Néanmoins, les principales sources de bruit radioélectrique ont pour origine le bruit thermique des composants de la chaîne (dû à l’activité des électrons dans les semiconducteurs), le rayonnement cosmique et les interférences liées aux diverses activités humaines. Dans une communication, le bruit se caractérise par sa puissance. On utilise alors le Rapport Signal sur Bruit (RSB ou SNR21) qui décrit le rapport entre la puissance du signal utile et la puissance du bruit. Le RSB est le paramètre de référence utilisé dans la littérature scientifique pour évaluer l’état d’un canal de transmission. Le modèle le plus couramment employé (et le plus simpliste) pour modéliser le bruit radioélectrique est le Bruit Blanc 21 Signal to Noise Ratio 12 CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL Additif Gaussien (BBAG). On représente ainsi le bruit par une variable aléatoire X de type gaussienne : PX ( x) = − 1 2πσ 2 e ( x −υ )2 2σ 2 (1.4) où PX(x) est la densité de probabilité (ddp) liée à la variable aléatoire X ; υ représente la moyenne et σ2 représente la variance. Les atténuations du canal de transmission Le canal de transmission sans fil a pour effet d’atténuer la puissance du signal émis. Il existe plusieurs types d’atténuations (ou évanouissements) qui dépendent de la topologie de l’environnement de transmission. Ainsi, plusieurs éléments sont à prendre en compte comme la distance de transmission ou les bâtiments et les obstacles qui génèrent de nombreux échos. La figure 1.5 résume les différentes atténuations pouvant perturber le signal émis. Figure 1.5. Influence des évanouissements sur le signal transmis [18] Les atténuations dépendent de la longueur d’onde λ du champ radioélectrique. Celle-ci correspond à la distance parcourue par l’onde électromagnétique pour retrouver une amplitude strictement identique. Elle s’exprime en mètre et se définit ainsi : c λ= (1.5) f où c est la célérité environ égale à 3.108 m.s-1 et f est la fréquence de l’onde exprimée en Hz. Nous distinguons trois types d’évanouissement : • L’évanouissement à grande échelle : ce type d’évanouissement dépend principalement de la distance entre l’émetteur et le récepteur. Il caractérise ainsi l’atténuation moyenne de la puissance du signal émis. Ce type d’évanouissement apparaît typiquement sur des distances de l’ordre de la centaine de longueur d’onde. 13 CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL • L’évanouissement à moyenne échelle : principalement dû à l’effet de masquage du signal lié aux bâtiments ou aux obstacles, l’évanouissement à moyenne échelle fait varier la puissance du signal émis sur des distances de l’ordre de la dizaine de longueur d’onde. • L’évanouissement à petite échelle : ce type d’évanouissement se présente sous forme de fluctuations du signal sur des distances de l’ordre de la longueur d’onde. Leur origine est liée au phénomène de trajets multiples. Le phénomène de multi-trajets Le phénomène de trajets multiples apparaît lorsque l’onde transmise entre en interaction avec des diffuseurs (bâtiments, obstacles, véhicules, etc.) qui sont situés sur sa trajectoire. En réception, le signal reçu est alors composé d’une superposition des signaux provenant de différentes directions. On distingue trois types d’interactions à savoir : la réflexion, la diffraction ou la dispersion (fig. 1.6). La réflexion apparaît à l’interface de deux milieux et lorsque l’obstacle est grand devant la longueur d’onde du signal. La diffraction intervient lorsque l’onde entre en interaction avec une arrête ou la pointe d’un obstacle. Enfin la dispersion apparaît lorsque l’onde interagit avec un grand nombre d’objet dont la taille est de l’ordre de la longueur d’onde ou inférieure. A: trajet direct B: réflexion C: diffraction D: dispersion Figure 1.6. Illustration du phénomène de trajets multiples [19] On matérialise le phénomène de multi-trajets par la Réponse Impulsionnelle (RI) du canal de transmission. Le phénomène de multi-trajets implique l’apparition de répliques de l’impulsion retardées par rapport au trajet direct ou au trajet principal. La combinaison de toutes les répliques constitue la RI du canal de transmission. La RI est définie par [17] : N h(t ,τ ) = ∑ ai (t )δ (τ − τ i (t )) (1.6) i =1 où δ est l’impulsion de Dirac ; N est le nombre de trajets ; ai (t ) et τi sont respectivement le gain complexe et le retard de propagation associés au trajet i. 14 CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL L’effet Doppler Un environnement de transmission est rarement totalement figé. La mobilité de l’émetteur et/ou du récepteur ainsi que la mobilité des éléments composant l’environnement de transmission (véhicules, piétons, etc.) sont à l’origine d’un décalage de fréquence appelé effet Doppler. Cet effet dépend de la vitesse de déplacement et de la fréquence porteuse. Il provoque un décalage fréquentiel de toutes les ondes composant le signal. D’un point de vue fréquentiel, ce décalage se traduit par une expansion du spectre du signal. D’un point de vue temporelle, cette expansion se traduit par une variation de la RI en fonction du temps [20]. 1.3.2 Modélisation du canal de transmission sans fil Il existe deux grandes familles de modèle permettant de prédire le comportement des canaux de transmission radiomobiles. Ainsi, les modèles dits stochastiques ou statistiques ont pour but de décrire les paramètres et les variations du canal par des variables aléatoires alors que les modèles déterministes sont basés sur la description fine d’un environnement particulier. Dans cette section, nous ne nous intéresserons qu’aux modèles utilisés dans le cadre de nos travaux bien qu’il en existe de nombreux dans la littérature (voir par exemple [17] et [20]). Ces modèles ont été choisis car ils sont très utilisés et régulièrement considérés comme des modèles de référence. 1.3.2.1 Modèles déterministes Les modèles déterministes ont pour objectif de déterminer la puissance reçue compte tenu des caractéristiques du canal de transmission. Les modèles les plus connus pour caractériser les variations à grande échelle sont le modèle en espace libre [21], le modèle à deux rayons [21] ou le modèle à exposant [22]. Ces modèles présentent l’avantage d’être simples mais ils sont souvent insuffisants pour modéliser fidèlement le comportement du canal radiomobile. Pour modéliser de manière fine les interactions électromagnétiques sur un environnement de transmission donné, on utilise les modèles à rayons. Ces modèles entrent dans la famille des méthodes asymptotiques développées pour répondre à des problèmes d’électromagnétiques de grandes envergures tels que la simulation de propagation d’ondes électromagnétiques en milieu réel [23]. Ces méthodes sont basées sur l’Optique Géométrique (OG) et la Théorie Uniforme de la Diffraction (TUD), où l’onde électromagnétique est assimilée à des rayons. Cette approche est largement adoptée pour la conception de logiciels de simulation du canal de transmission qui nécessitent, à leur tour, des méthodes pour identifier les trajets se propageant entre un émetteur et un récepteur. Deux modèles découlent directement de ces méthodes : • Modèle à lancer de rayons : le principe de la méthode à lancer de rayons consiste dans un premier temps à inonder l’environnement de rayons partant de l’émetteur. Suivant le parcours de chaque rayon, l’algorithme détermine les différentes interactions électromagnétiques entre les rayons et les obstacles constituant l’environnement étudié. L’algorithme considère la géométrie et les propriétés électriques des matériaux rencontrés, et seuls les trajets passant à proximité du récepteur sont retenus pour le calcul de la puissance reçue. La précision des résultats obtenus par la méthode à lancer de rayons dépend du nombre de rayons à lancer et du pas angulaire choisi pour couvrir l’environnement 3D. De plus, le nombre de rayons qui sont exploités dépend du pas angulaire considéré. 15 CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL • Modèle à tracé de rayons : Le modèle à tracé de rayons [24], détermine sans aucune approximation les rayons qui peuvent se propager d’un émetteur vers un récepteur. L’opération de recherche des rayons qui existent entre le couple émetteur-récepteur s’effectue par la méthode des images ou celle du pliage [25]. L’atténuation de chacun des trajets reçus est alors déterminée par la somme de l’atténuation causée par l’interaction de l’onde avec les obstacles en prenant en compte les propriétés électriques des matériaux et l’atténuation liée à la partie de propagation de l’onde en espace libre calculée par la loi de Friis (modèle en espace libre). Le tracé de rayons est plus précis que le lancer de rayons, puisqu’il calcule les trajets de manière déterministe entre un émetteur et un récepteur. Cependant, contrairement au modèle à lancer de rayons, il est nécessaire de recourir à une simulation pour chaque configuration d’émetteur-récepteur. 1.3.2.2 Modèles statistiques Bien que généralement moins précis que les modèles déterministes, les modèles de canaux issus de loi stochastique permettent de caractériser de manière simple le comportement du canal de transmission sur de larges zones. De plus, ils présentent l’avantage de n’utiliser que de faibles capacités mémoire, et permettent d’effectuer des simulations plus rapidement qu’avec les modèles déterministes à rayons. Nous présentons ici, les deux modèles statistiques que nous employons dans le cadre de nos travaux. Le modèle de Rayleigh La distribution de Rayleigh permet de modéliser les variations à petite échelle de l’amplitude du signal reçu. Si le signal reçu Y à valeur yi est composé d’un nombre important de trajets de faible amplitude y i et d’ordre de grandeur comparable, et que la phase de chacun des trajets est uniformément répartie sur l’intervalle [-π ; π], on peut assimiler la densité de probabilité des trajets reçus (somme des variables yi) à une variable aléatoire gaussienne (théorème central limite). Les valeurs d’amplitude et de phase représentent alors les réalisations de deux variables aléatoires gaussiennes indépendantes. Ces conditions se vérifient souvent dans le cadre de transmission en non-visibilité directe (cas NLOS22) dans un environnement de transmission riche en multi-trajets. Pour de telles configurations, l’amplitude Z du signal reçu Y est décrite par la ddp de Rayleigh [20] : PZ ( z ) = z σ2 e z2 − 2σ 2 (1.7) où 2σ2 représente la puissance moyenne efficace du signal reçu. Le modèle de Rice Le modèle de Rice permet de modéliser les évanouissements à petite échelle lorsqu’il existe un trajet prédominant (par exemple le trajet direct : cas LOS23) entre l’émetteur et le 22 23 Non Line Of Sight Line Of Sight 16 CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL récepteur. En effet, en cas de prépondérance d’un trajet, les statistiques de l’amplitude et de la phase ne correspondent plus au modèle de Rayleigh. On peut alors montrer que dans de telles circonstances, la ddp de l’amplitude Z du signal suit la distribution de Rice [20] : PZ ( z ) = 2 z ( K + 1) z2 e 2 − K − ( K +1) z 2 z K ( K + 1) I 0 2 z z2 (1.8) où I0(x) est la fonction de Bessel modifiée de 1ère espèce d’ordre 0 ; z 2 = 2σ 2 + A 2 est la A2 . valeur efficace de z considérant A l’amplitude du trajet direct et K = 2σ 2 Il existe d’autres modèles statistiques décrits dans la littérature tels que les modèles de Nakagami [20] ou log-normale Shadowing [17], … 1.3.2.3 Modèle de canal réaliste considéré dans la thèse Dans le cadre de cette thèse, nous mettons en œuvre un canal de transmission réaliste. Nous utilisons un modèle de propagation déterministe basé sur la méthode à tracé de rayons utilisé dans [19] et [26]. Ce modèle de propagation a été développé au département SIC de l’institut XLIM de l’Université de Poitiers [27] [28]. Cet outil prend en entrée l’environnement de simulation 3D, les positions de l’émetteur et du récepteur dans l’environnement, la fréquence de la porteuse et le nombre d’interactions électromagnétiques maximum à prendre en compte par le simulateur. En sortie, il fournit la RI complexe du couple émetteur-récepteur. Cet outil intègre toutes les spécificités (géométriques et électriques) liées à l’environnement, et modélise toutes les variations à petite, moyenne et grande échelle d’un canal radiomobile. Le synoptique du simulateur est illustré par la figure 1.7 : Entrées Tracé de rayons 3D Sorties - Données géographiques - Propriétés électriques des matériaux - Positions de l’émetteur et du récepteur - Type d’antenne : polarisation et directivité - Fréquence porteuse - Nombre d’interactions électromagnétiques - Trajet direct - Trajets réfléchis - Trajets diffractés - Trajets transmis - Trajets combinant plusieurs interactions - Visualisation des rayons (2D/3D) - Puissance reçue - Zone de couverture - Réponse impulsionnelle - Angle d’arrivée et de départ des trajets Interactions - Optique géométrique (OG) - Théorie de la diffraction (TUD) Figure 1.7. Synoptique du simulateur de canal à tracé de rayons 3D [28] La RI calculée par le simulateur fournit l’information sur la phase, l’amplitude et le retard de chaque trajet existant entre l’émetteur et le récepteur. Par la suite, pour la chaîne de communication numérique, nous générons les coefficients caractérisant le canal radiomobile 17 CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL en utilisant une méthode couramment utilisée en pratique appelée méthode du filtre TDL24 [20]. Ci-dessous, nous décrivons succinctement les étapes permettant de générer les coefficients suivant cette méthode. Pré-traitement Pour être utilisables dans nos simulations, les RI subissent une phase de pré-traitement qui consiste à supprimer les trajets non-significatifs, ordonner les trajets suivant leur temps d’arrivée puis échantillonner ces trajets par rapport au temps symbole (Ts) considéré. Pour tous les trajets arrivés dans un intervalle [iTs ; (i+1)Ts], nous ne considérons qu’un seul trajet correspondant à la somme de tous les trajets significatifs de l’intervalle. Dans nos travaux, nous avons implémenté la couche physique correspondant au standard IEEE802.11n [29], qui est une norme récente pour les transmissions sans fil intégrant la technologie MIMO. Ce standard définit les valeurs de toute une série de paramètres pris en compte dans la phase de pré-traitement des RI tels que la sensibilité du récepteur (détection des trajets significatifs) ou la bande passante (définition du temps symbole). Sélectivité fréquentielle On modélise la sélectivité fréquentielle du canal de transmission par une Ligne à Retard (LAR) [20]. Dans ce modèle, les coefficients qui multiplient chaque trajet varient en fonction du temps. Cette caractéristique dépend de certaines hypothèses sur le canal de transmission telles que la stationnarité au sens large (WSS25) et la non-corrélation des éléments dispersifs de l’environnement (US26) [30]. Le simulateur 3D permet d’obtenir des RI modélisant de manière réaliste les évanouissements à moyenne et grande échelle. Toutefois, pour modéliser de manière réaliste les évanouissements à petite échelle, il faudrait lancer un nombre de simulations bien trop élevé afin d’obtenir une grande quantité de coefficients pour chaque configuration du canal. Ainsi, pour des raisons de temps de calcul prohibitif, nous faisons appel aux modèles statistiques moins complexes de Rayleigh et de Rice. Pour chacun des groupes de trajets réduits par la phase d’échantillonnage, on génère indépendamment le nombre de coefficients souhaités suivant la distribution statistique de Rice pour les cas LOS et Rayleigh pour les cas NLOS. Sélectivité temporelle La mobilité entre l’émetteur et le récepteur est source de sélectivité temporelle liée à l’effet Doppler (voir §1.3.1). Une fois que tous les coefficients du canal ont été générés, on prend en compte la sélectivité temporelle par l’intermédiaire de la Densité Spectrale de Puissance (DSP) de Jakes [20]. Ce modèle de spectre Doppler n’est valide que sous certaines hypothèses que l’on considère vérifiées dans le cadre de nos simulations : - L’antenne d’émission est omnidirectionnelle ; - Les angles d’arrivée des trajets sont uniformément distribués sur l’intervalle [-π ; π] ; - La propagation de l’onde s’effectue dans le plan horizontal. 24 Tap Delay Line Wide Sense Stationarity 26 Uncorrelated Scattering 25 18 CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL La DSP S(f) de Jakes se définit ainsi : 2σ 2 f π f Dmax 1 − fD S( f ) = max 0 pour f ≤ f Dmax (1.9) pour f > f Dmax où f Dmax est le décalage Doppler maximum qui dépend de la vitesse de déplacement v de l’émetteur et/ou du récepteur, de la célérité c et de la fréquence fc de l’onde porteuse : f Dmax = v fc c (1.10) Une fois que les coefficients associés aux variations rapides du canal ont été générés (Rice et Rayleigh), puis filtrés selon le spectre de Jakes, ils sont multipliés par les coefficients complexes relatifs aux différents trajets déterminés par le simulateur de propagation. Ces différentes opérations nous permettent de générer les RI d’un canal MIMO ergodique directement utilisables dans nos simulations de transmission telle que la décrit l’équation (1.6). 1.4 Notion de diversité Pour combattre les évanouissements inhérents au canal de transmission radiomobile, les systèmes de communication numérique tirent parti de la diversité. L’exploitation intelligente de la diversité permet des gains importants en termes de robustesse (diminution du TEB) et permet notamment d’augmenter la capacité et la couverture des systèmes radios. On distingue principalement quatre types de diversité [31]. Diversité temporelle Le canal radiomobile évolue au cours du temps en subissant des évanouissements temporels. On définie alors un temps de cohérence Tc au cours duquel le canal est considéré comme étant stationnaire. La diversité temporelle peut être utilisée en répétant l’information à des intervalles plus grands que le temps de cohérence du canal. On peut également exploiter la diversité temporelle par des techniques telles que l’entrelacement ou l’introduction de redondance par l’intermédiaire de CCE. Diversité fréquentielle La sélectivité en fréquence provient du phénomène de multi-trajets qui fait interagir entre elles des ondes constructives ou destructives à cause du phénomène de retard et de combinaison des répliques. On introduit alors la notion de bande de cohérence Bc correspondant à la bande passante pour laquelle le canal est considéré comme stationnaire. On exploite la diversité fréquentielle en émettant le même signal ou des versions redondantes sur différentes fréquences porteuses écartées d’au moins la bande de cohérence du canal. Il existe plusieurs techniques exploitant la diversité fréquentielle telles que les modulations multi19 CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL porteuses (dont l’OFDM27 est un exemple) [32], les techniques utilisant le saut de fréquence [33] ou encore l’étalement de spectre [34]. Diversité de polarisation On parle de diversité de polarisation [35] lorsqu’un même signal est émis et reçu sur des ondes polarisées de manière orthogonale et dont les caractéristiques de propagation sont indépendantes. Diversité spatiale On parle de diversité spatiale lorsque l’on multiplie le nombre d’antennes à l’émission et/ou à la réception. Chaque antenne réceptrice va recevoir la somme des signaux émis sur les différentes antennes émettrices. L’exploitation efficace de la diversité spatiale passe par une disposition judicieuse des antennes permettant d’obtenir une décorrélation des différentes trajectoires conduisant à l’obtention de différents échos des signaux émis. On introduit ainsi la notion de distance de cohérence Dc en-dessous de laquelle les signaux émis et/ou reçus sont fortement corrélés. On comprend aisément que si les antennes sont disposées de manière à fournir le même écho sur chaque antenne réceptrice (forte corrélation entre les trajectoires), le système MIMO n’apporte aucun avantage. Cependant, on peut montrer que pour des antennes omnidirectionnelles, une distance entre les antennes de 0,4λ suffit à décorréler suffisamment les trajectoires afin d’exploiter la diversité spatiale [36]. On diminue ainsi la probabilité qu’un évanouissement apparaisse en même temps, ou sur la même bande de fréquence pour les différentes trajectoires. La diversité spatiale est un bon moyen d’augmenter la capacité des systèmes. On rappelle que la capacité est une mesure de la quantité maximale d’information qui peut être transmise sur un canal puis reçue avec une probabilité d’erreur négligeable. Les différentes techniques permettant d’exploiter la diversité peuvent avantageusement être combinées afin d’augmenter significativement la robustesse des transmissions, généralement au prix d’une complexité accrue. On peut par exemple citer les systèmes MIMO-OFDM qui allient efficacement l’exploitation de la diversité spatiale et de la diversité fréquentielle. 1.5 Introduction aux systèmes MIMO Au cours des dernières années, le développement massif des télécommunications a posé des problèmes techniques liés à l’évolution des pratiques des usagers (téléphones mobiles, smartphones, tablettes, etc.). En effet, le nombre d’usagers a augmenté de manière rapide autour du développement de nouveaux services exigeants en ressources. Face à la limite physique posée par l’exploitation de la bande passante des canaux radiomobile, la communauté scientifique et industrielle s’est largement tournée vers les systèmes multiantennaires (ou système MIMO) afin d’apporter des solutions efficaces aux problèmes précités. Les travaux de Telatar [37] et Foschini [38] des laboratoires Bell, ont montré que la capacité des systèmes multi-antennaires augmentait linéairement avec le nombre d’antennes émettrices, permettant ainsi de dépasser largement la limite théorique de Shannon [2]. Depuis ces travaux, plusieurs architectures ont été proposées pour les systèmes MIMO permettant 27 Orthogonal Frequency Division Multiplexing 20 CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL d’améliorer la robustesse et/ou le débit de la transmission. Les développements modernes des techniques MIMO ont permis à ces techniques d’être intégrées dans les standards de télécommunication tels que les normes Wifi (IEEE802.11n) [29], Wimax (IEEE802.16e) [39] ou Long Term Evolution (LTE) [40]. Dans cette section, nous présentons les éléments de base permettant de caractériser une transmission MIMO. Nous présentons également une classification des architectures MIMO basée sur la connaissance ou non de l’état du canal MIMO du côté de l’émetteur. 1.5.1 Modélisation du canal MIMO Dans le cadre de nos travaux, nous nous limitons à l’utilisation d’un modèle monoutilisateur dans un canal bande étroite. Nous considérons également la synchronisation et l’échantillonnage comme étant parfaits. Considérons un système MIMO avec nT antennes émettrices et nR antennes réceptrices tel qu’il est représenté sur la figure 1.8 : h 11 h 21 1 Données à émettre Codage et modulation 2 h 1nT 1 h nR 1 2 Démodulation et décodage Données reçues h nR nT nR nT Figure 1.8. Schéma de transmission MIMO à nT × nR antennes La transmission d’un signal entre l’antenne émettrice i et l’antenne réceptrice j est caractérisée par le gain complexe hji. En réception, chaque antenne reçoit la somme des symboles transmis simultanément par les antennes émettrices. Le symbole reçu yj sur l’antenne j s’écrit : nT y j = ∑ h ji si + n j (1.11) i =1 où si est le symbole transmis par l’antenne émettrice i et nj correspond à un échantillon de bruit perturbant le signal. Le problème peut être représenté sous forme matricielle : y = Hs + n (1.12) où s représente le vecteur de symbole transmis avec la contrainte E[s*s] = P0 (la puissance totale transmise) ; y représente le vecteur de symbole reçus ; n représente le vecteur de bruit en réception et H la matrice de canal contenant les gains complexes caractérisant la transmission entre les différents couples d’antennes : 21 CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL h11 H = hn 1 R h1nT hnR nT (1.13) Les éléments de la matrice de canal H peuvent être de nature stochastique et ainsi modélisés par les distributions présentées dans le paragraphe 1.3.2.2. Dans la suite de l’étude, nous considérerons le modèle de canal réaliste défini dans le paragraphe 1.3.2.3 ainsi qu’un modèle de canal statistique que nous modélisons grâce à la distribution de Rayleigh qui définit les éléments complexes de H comme étant des variables aléatoires indépendantes et identiquement distribuées (iid) de loi gaussienne de moyenne nulle et de variance unitaire. L’estimation de la matrice de canal, que l’on appelle également CSI, est particulièrement importante car sa connaissance va permettre d’optimiser de manière significative la reconstruction du signal. En effet, si l’on connaît de manière précise l’impact du canal sur les symboles transmis, on peut tirer parti de cette information afin de décoder plus précisément les symboles reçus. De la même manière, la connaissance de cette information avant l’émission des symboles peut s’avérer particulièrement intéressante. La connaissance de la matrice de canal est obtenue par l’utilisation de séquence pilote et/ou d’apprentissage [29]. L’obtention de la CSI permet donc de considérer deux familles de techniques MIMO suivant que l’on connaît la CSI à l’émission ou à la réception. 1.5.2 Systèmes MIMO en boucle ouverte On désigne par systèmes MIMO en boucle ouverte (OL-MIMO28), les systèmes considérant uniquement la CSI du côté du récepteur (Rx-CSI). Cette famille de systèmes MIMO peut être décomposée en trois sous-familles. Multiplexage spatial L’architecture originale proposée par Foschini dans [38] visait à augmenter de manière significative la capacité des systèmes par le multiplexage spatial des symboles à émettre. Ces systèmes sont désignés par l’appellation LST29 (fig. 1.9) dont l’architecture BLAST30 [38] est un exemple connu. {s 2 , s 1 } {s 4 , s 3 } Figure 1.9. Exemple d’architecture LST Dans ce type de système, la capacité croît linéairement avec le nombre d’antennes émettrices alors que le TEB décroît exponentiellement dans l’hypothèse d’un décodage 28 Open Loop MIMO Layered Space-Time 30 Bells Laboratory Layered Space-Time 29 22 CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL optimal. L’avantage majeur des architectures LST tient dans le fait que le nombre d’antennes, l’efficacité spectrale de la modulation ou l’entrelaceur employé peuvent être facilement ajustés car les différentes voies sont indépendantes. Diversité Plus tard, des études ont cherché à exploiter la diversité en introduisant le Codage Spatio-Temporel (CST) [41]. L’idée était d’exploiter conjointement toutes les voies du système MIMO afin d’augmenter la robustesse de la transmission. On a d’abord distingué les CST en treillis (STTC31) développés par Tarokh et al. [42], puis les CST en blocs (STBC32) [43] dont le code d’Alamouti est un exemple célèbre (fig. 1.10). Le principe des STBC consiste à découper le vecteur de symboles à émettre en blocs de symboles, lesquels vont subir un multiplexage à la fois spatial et temporel. { − s 2* , s1} { s1* , s2} Figure 1.10. Exemple de code STBC : code d’Alamouti Le schéma proposé par Alamouti se limitait initialement aux systèmes MIMO (2 × 2) avant d’être généralisé par la suite par Tarokh et al. dans [44]. Ce type de codes permet un gain important en termes de robustesse mais ne permet pas d’augmentation du débit par rapport à une transmission SISO classique. Compromis entre diversité et multiplexage De nouvelles formes de code ont été proposées dans la littérature permettant d’atteindre un compromis idéal entre gain de diversité et multiplexage. Nous pouvons citer entre autres, les codes spatio-temporel algébriques diagonaux (DAST33) [45] et par couches (TAST34) [46], ou les codes construits à partir d’algèbres de division tels que le Golden code [47]. Pour plus d’informations, le lecteur peut se référer à [48]. 1.5.3 Systèmes MIMO en boucle fermée Les systèmes MIMO en boucle fermée (CL-MIMO35) disposent d’une voie de retour entre le récepteur et l’émetteur. Il est ainsi possible d’utiliser la connaissance du canal à l’émission (Tx-CSI) afin d’optimiser la transmission par une prise en compte anticipée du canal. Cette opération est réalisée par des algorithmes appelés précodeurs dont le rôle est d’exploiter au mieux la connaissance de la CSI afin d’optimiser conjointement l’émetteur et le 31 Space-Time Treillis Code Space-Time Block Code 33 Diagonal Algebraic Space-Time 34 Threaded Algebraic Space-Time 35 Closed Loop MIMO 32 23 CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL récepteur d’un système de communication. Les précodeurs présentent plusieurs avantages par rapport aux systèmes OL-MIMO qui prennent en compte uniquement la CSI en réception : - Ils exploitent mieux la diversité spatiale en comparaison des CST [18] ; - Ils offrent la possibilité d’améliorer soit la robustesse (diversité), soit le débit (multiplexage) ou bien un compromis entre le débit et la robustesse ; - Ils permettent de décomposer le canal MIMO en plusieurs sous-canaux SISO indépendants et parallèles. Dans la littérature, nous distinguons différents types de précodage : • Précodage linéaire : la majorité des précodeurs de la littérature sont linéaires. Du côté de l’émetteur, la CSI est utilisée pour répartir la puissance afin d’optimiser un critère donné (capacité, RSB, erreur quadratique, etc.). En réception, un décodeur linéaire réalise le décodage des échantillons reçus. L’optimisation mise en œuvre conduit à la diagonalisation du canal (matrice H). On distingue les précodeurs diagonaux [49] [50] qui présentent une matrice de précodage diagonale, des précodeurs non-diagonaux [18] [50] qui ne présentent pas cette caractéristique. • Précodage OSM36 : La technique OSM [51] a récemment été introduite pour les systèmes MIMO à boucle fermée. Le principe de la technique OSM est d’associer un codage des symboles à une orthogonalisation par rotation. Une technique de précodage basée sur un système OSM a été proposée dans [52] introduisant ainsi le précodeur P-OSM qui optimise la distance euclidienne minimale de la constellation. Diverses études ont montré que la connaissance de la CSI du côté de l’émetteur permet d’augmenter efficacement la fiabilité de la transmission [18] [49] [50]. De plus, l’intégration d’un précodeur dans la chaîne de transmission permet la mise en œuvre de stratégie d’allocation de puissance inégale (UPA37). Par comparaison, en l’absence de CSI du côté de l’émetteur, la répartition optimale de la puissance pour un système OL-MIMO est la répartition uniforme [53]. Ainsi, nous baserons notre étude sur une architecture MIMO en boucle fermée intégrant des précodeurs linéaires. 1.5.4 Les récepteurs MIMO Suite à la transmission des signaux à travers le canal radioélectrique, les antennes réceptrices récupèrent les différentes contributions formées par l’ensemble des signaux émis. Il est alors nécessaire de mettre en œuvre une technique permettant de séparer ces contributions afin de reconstituer les symboles transmis. Il existe beaucoup de récepteurs MIMO dont les plus courants sont [18] [49] [50] : - Forçage à Zéro (ZF38) : ce récepteur cherche à annuler les contributions des émetteurs interférant. Il est relativement peu performant car il repose sur une inversion de la matrice H pour supprimer l’Interférence Entre Symboles (IES) ce qui peut dégrader les performances par une augmentation du bruit ; - Erreur Quadratique Moyenne Minimale (MMSE39) : il diminue l’influence du bruit mais il ne sépare pas parfaitement les différentes contributions ; 36 Orthogonalized Spatial Multiplexing Unequal Power Allocation 38 Zero Forcing 39 Minimum Mean Square Error 37 24 CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL - Annulation Successive d’Interférence (SIC40) : développé originalement pour le système V-BLAST, ce récepteur décode d’abord l’information du signal le plus fort, puis il retranche sa contribution aux autres signaux reçus, jusqu’au décodage complet des symboles transmis. Cette technique est performante mais elle est sensible aux propagations d’erreur de décision. - Maximum de Vraisemblance (ML41) : ce récepteur présente les meilleures performances en termes de TEB au prix d’une complexité accrue. Dans le cadre de nos travaux, nous n’utiliserons que le récepteur ML compte tenu de ses performances. En supposant un bruit gaussien et un canal H parfaitement connu à la réception, le récepteur ML fournit la séquence de symboles estimés ŝ telle que : ŝ = argmin || y – Hs ||2 s (1.14) Cette solution est optimale dans l’hypothèse de l’équiprobabilité des vecteurs ŝ. Malgré tout, la complexité de décodage d’un récepteur ML croît exponentiellement avec le nombre d’antennes émettrices. En considérant une constellation de modulation de taille M, le récepteur doit calculer M nT vecteurs possibles ce qui peut devenir prohibitif dans le cadre de constellation de grande dimension. Toutefois, dans le contexte d’un système MIMO précodé, l’indépendance des sous-canaux SISO permet de limiter significativement la complexité du récepteur ML. En notant b le nombre de sous-canaux SISO utilisés dans le cadre de la transmission, la complexité du récepteur ML se limite à b×M. 1.5.5 Association MIMO-OFDM La contrainte majeure des systèmes multi-antennaires réside dans la nécessité d’utiliser les systèmes dans une bande de fréquence relativement étroite. Effectivement, les systèmes MIMO ne fonctionnent que dans des environnements riches en diversité tels que les environnements propices au multi-trajet. Afin d’éviter les IES, le temps symbole doit nécessairement être largement supérieure au plus long des retards, réduisant ainsi la bande passante utilisable. Il existe néanmoins une solution simple et efficace qui permet d’élargir la bande passante du canal MIMO tout en conservant l’hypothèse de bande étroite [54]. Cette solution consiste à associer un système MIMO à une modulation multi-porteuse. L’OFDM [55] est une modulation multi-porteuse permettant de combattre efficacement la sélectivité fréquentielle. Le principe consiste à diviser la bande passante du canal de transmission en N sous-bandes indépendantes. Les symboles du signal à émettre sont alors multiplexés sur les N sous-porteuses relatives aux N sous-bandes fréquentielles. L’espacement entre les sous-porteuses est défini par rapport au temps symbole TS assurant ainsi l’orthogonalité entre les sous-porteuses. Les N symboles sont transmis simultanément en formant ainsi un symbole OFDM. Les symboles OFDM subissent d’abord une transformée de Fourier discrète inverse (IFFT42) autour d’une fréquence porteuse f0 puis sont transmis sur le canal. En réception, le signal subit les transformations inverses aboutissant à la reconstruction des vecteurs de symboles émis. 40 Successive Interference Cancelation Maximum Likelihood 42 Inverse Fast Fourier Transform 41 25 CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL IFFT e 2 jπ f 0 t s0 e 2 jπ ( f0 +1 TS )t Eléments binaires Modulation MAQ-M s0,s1,…,sN-1 Multiplexage s1 ∑ e Signal modulé N −1 t 2 jπ f 0 + TS sN-1 Figure 1.11. Schéma d’un modulateur OFDM L’association MIMO-OFDM permet donc d’augmenter la bande passante du système MIMO (bande large) en gardant l’hypothèse bande étroite caractérisant ainsi le canal par des coefficients complexes. Finalement, le canal MIMO-OFDM large bande est modélisé par un vecteur de N matrices H de taille (nT × nR), chaque matrice correspondant à la réponse du canal pour la fréquence de la nième sous-porteuse avec n = 1,…,N. L’efficacité des systèmes MIMO-OFDM a largement été démontrée et a fait l’objet de plusieurs standardisations [29] [39] [40]. 1.6 Etat de l’art sur les stratégies de transmission d’images Avec le développement récent des communications sans fil, les transmissions de type multimédia (image, vidéo, voix, données) se sont multipliées. Ainsi, de plus en plus d’utilisateurs doivent se partager les ressources radio, qui sont par nature limitées. L’objectif est alors de concevoir des stratégies de transmission permettant de gérer efficacement les ressources compte tenu des contraintes des systèmes telles que la limitation de la bande passante due au contexte multi-utilisateurs/multi-services, l’autonomie limitée des terminaux mobiles, les contraintes de temps réels, etc. L’objectif des stratégies de transmission est de régler au mieux les paramètres constitutifs des différents blocs composant la chaîne de communication numérique. Dans ses travaux sur la capacité [2], Shannon a montré que le codage de source nécessite uniquement la connaissance de l’information sur le canal pour atteindre les performances de transmission optimales. Ainsi, dès lors que l’information est transmise à un débit inférieur à la capacité du canal, il y a très peu, voire aucune erreur introduite par ce dernier. Par conséquent, le théorème de séparation énoncé par Shannon implique que l’on peut atteindre les performances optimales en minimisant la distorsion de la source indépendamment du codage de canal. Cependant, le théorème de séparation est valide uniquement sous certaines hypothèses qui se vérifient rarement en pratique. Parmi ces hypothèses, nous pouvons citer les séquences d’information qui doivent être ergodiques et de longueur infinie (conditions asymptotiques) ce qui est contradictoire avec les stratégies de codage et de transmission adoptées par les 26 CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL standards récents [9] [10] [29] [39] [40] qui traitent l’information par blocs de taille relativement faible. On suppose également une connaissance parfaite de la capacité du canal au niveau du codeur de source ce qui est difficile à envisager compte tenu de la nature variable et imprévisible du canal radiomobile. De plus, le théorème de séparation n’est plus valable si une contrainte de délai existe. Toutes ces contraintes ont orienté les travaux de recherche vers de nouvelles stratégies de transmission basées sur l’optimisation conjointe du compromis débit/distorsion par le codage de la source et le codage de canal, appelé stratégie de codage conjoint source-canal. L’optimalité dans les stratégies de transmission est une notion très dépendante des systèmes mis en place ainsi que du contexte d’utilisation. On relève néanmoins trois facteurs récurrents dans les problèmes d’optimisation. On trouve tout d’abord l’objectif du problème d’optimisation. Dans le cadre de la transmission d’image, l’objectif consiste la plupart du temps à maximiser la qualité de l’image reçue, ce qui revient à minimiser la distorsion. L’objectif du problème d’optimisation est souvent « subjectif ». On rencontre alors régulièrement le terme de qualité de service (QoS) pour caractériser le fait que l’objectif est atteint de manière satisfaisante ou non. Afin de s’assurer que l’objectif est atteint, on intègre un ou plusieurs critères « objectifs » servant de mesure justificative à la notion de QoS. Pour la transmission d’image, le critère le plus courant est l’erreur quadratique moyenne, souvent traduit en PSNR. On peut également trouver le TEB. Une fois que l’objectif et le critère sont identifiés, il reste à définir la ou les contraintes que le système doit respecter. Les contraintes sont généralement des ressources quantifiables et limitées (temps, puissance, débit, etc.). De ce fait, les contraintes dépendent fortement du système considéré et des paramètres qu’il met en jeu. Dans cette section, nous présentons un état de l’art non-exhaustif des stratégies de transmission d’images permettant de garantir une qualité de service. 1.6.1 Stratégies de protection inégale contre les erreurs Les stratégies de protection inégale contre les erreurs, plus communément appelées stratégies UEP, ont pour objectif principal d’exploiter la hiérarchisation des données issues du codeur de source. Les données principales peuvent se voir attribuer un code correcteur de rendement faible alors que les données relativement moins importantes se voient attribuer un CCE de rendement important. Dans [56] et [57], cette stratégie a été appliquée pour la transmission d’une image JPEG. Les auteurs exploitent le codage basé DCT du standard JPEG afin de créer deux partitions contenant respectivement les coefficients AC43 (hautes fréquences) et DC44 (basses fréquences). Des turbo-codes de rendements différents sont appliqués sur les partitions conduisant à améliorer le TEB et le PSNR des images reçues en comparaison d’un schéma de protection égale (stratégie EEP45) présentant une redondance globale identique. Il existe une plus forte hiérarchisation des données issues du codeur JPEG 2000. On distingue en particulier une sensibilité importante de l’entête principale et de l’entête de tuile (qui contiennent des informations spécifiques sur l’image et les paramètres de codage) en comparaison des données dites utiles (correspondant aux coefficients fréquentiels) [58]. Cette hiérarchisation des données a été exploitée dans divers travaux. Par exemple, les auteurs de [59] ont proposé la mise en œuvre d’une protection particulière des entêtes JPEG 2000 par le 43 Alternative Components Direct Components 45 Equal Error Protection 44 27 CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL biais de métadonnées embarquées dans le flux. Les résultats montrent que la protection des entêtes par des codes Reed-Solomon (RS) de rendement approprié permet une augmentation significative du pourcentage de décodage des images sur des canaux fortement bruités. Les auteurs proposent également une stratégie UEP sur les couches de qualité JPEG 2000. Ainsi, on constate un gain significatif en termes de PSNR en faveur de l’UEP en comparaison de l’EEP pour des TEB inférieurs à 4.10-2. On retrouve exactement la même philosophie dans [60-63] qui font partie des travaux ayant aboutit à l’élaboration du standard JPWL. Ce standard présente la particularité d’intégrer des outils permettant une mise en œuvre simple et immédiate de stratégie UEP par le biais de codes CRC46 ou Reed-Solomon. Une analyse de la robustesse à la transmission sur canal sans fil des standards JPEG, JPEG 2000 et JPWL est fournie dans [64]. Les conclusions de cette analyse mettent en avant la supériorité de JPWL, qui inclut une protection UEP prédéfinie sur les données d’entête, pour les transmissions sur canal sans fil. Les auteurs relèvent toutefois que la protection des données utiles par des codes CRC n’est pas intéressante en l’absence d’une stratégie de retransmission efficace. Ils confirment également que les codes Reed-Solomon (notés RS(N,K), voir §1.2.2) fournissent une forte protection mais que la robustesse issue des codes RS avec une capacité de correction supérieure au code RS(64,32) ne justifie pas le coût vis-à-vis de l’augmentation de la bande passante. Les stratégies UEP ont prouvé depuis longtemps leur intérêt pour la transmission d’images [65] [66] ou de vidéos [67] [68]. Toutefois, les stratégies UEP posent le problème de l’allocation optimale du débit. Ainsi, l’objectif d’une stratégie UEP conjointe entre la source et le canal est de trouver les débits à allouer au codeur de source et au codeur de canal permettant d’atteindre les meilleures performances de transmission, sous la contrainte de la bande passante. Dans leurs travaux [69] [70] [71], Thomos et al. ont développé une stratégie UEP optimale au sens du compromis débit/distorsion pour la transmission d’images sur canaux sans fil sujets aux erreurs de transmission. Dans [69], les auteurs proposent un schéma UEP pour un codeur basé ondelettes dont les sous-bandes sont codées en blocs par plans de bit. Les données sont protégées grâce à des codes RCPC47-CRC. Dans [70], les auteurs proposent un schéma UEP pour un codeur SPIHT48 [72] utilisant des turbo-codes et des codes RS. Une détection CRC permet de vérifier l’intégrité de l’information et permet d’extraire directement les données pour le décodage source si aucune erreur n’est détectée. On économise ainsi la complexité liée au turbo-décodage en comparaison du schéma RCPC-CRC qui opère un décodage canal des données reçues sans erreur. Dans [69] et [70], l’optimisation est réalisée sous une contrainte de débit cible. Comme les paquets sont indépendants les uns des autres, les auteurs exploitent l’hypothèse que la réduction de la distorsion associée au décodage d’un paquet est cumulative. Ainsi l’allocation optimale entre la source et le canal est vue comme un problème de maximisation de la réduction de la distorsion attaché au décodage d’un paquet de données. La distorsion est alors exprimée en fonction de la probabilité de décodage d’un paquet en fonction des paquets précédents, qui dépend du code canal utilisé. Finalement dans [71], les auteurs appliquent la stratégie d’allocation optimale du codage canal développée dans [70] en l’appliquant au codeur JPEG 2000 qui fonctionne sur le schéma du codeur utilisé dans [69]. Les résultats montrent une amélioration du PSNR par rapport à d’autres schémas UEP de la littérature. Toutefois cette solution conduit à une recherche exhaustive entre les différents rendements de codes ce qui augmente exponentiellement la complexité de l’algorithme. 46 Cyclic Redundancy Code Rate-Compatible Punctured Convoltional 48 Set Partitioning In Hierarchical Trees 47 28 CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL Dans [73] et [74], Agueh et al. ont proposé un schéma d’allocation de débit à appliquer aux codes Reed-Solomon pour la protection des paquets ou des couches de qualité d’un flux JPWL. Leur modèle est basé sur la maximisation d’un critère prenant en compte la réduction de la distorsion associé au décodage correct d’une unité (paquet ou couche de qualité) ainsi que le coût en octets associé à l’unité protégée par un code RS de rendement donné. Cette optimisation repose sur une contrainte de bande passante disponible. Les résultats montrent un gain en termes de PSNR et une amélioration du pourcentage de décodage réussi pour des canaux présentant un faible RSB, en comparaison d’un schéma EEP. Plus récemment, Agueh et al. ont complété leur stratégie de transmission [75] en incluant un outil d’estimation de la bande passante afin d’adapter dynamiquement leur stratégie UEP aux variations sur le canal. Les auteurs de [76] proposent une approche similaire pour l’allocation d’un schéma UEP pour la transmission d’image JPEG 2000. Deux classes de bits sont considérées, à savoir les données d’entête et les données utiles. Le modèle propose un schéma UEP basé sur la minimisation de l’erreur quadratique exprimée en fonction de la probabilité d’erreur sur les paquets. Les auteurs font ainsi un lien entre l’erreur quadratique et le rendement des codes RS afin de formuler un problème d’optimisation qu’ils résolvent par une recherche dichotomique. Bien que l’approche soit sensiblement la même que pour [69] [70] [71] [73] [74] [75], ce modèle permet de maximiser le PSNR en réception sous une contrainte de TEB cible donné, ce qui apporte une souplesse supplémentaire au schéma proposé. Les systèmes MIMO-OFDM présentent une architecture favorable pour la mise en place de stratégie UEP. Dans [77], les auteurs présentent un schéma UEP pour un système MIMO. La protection est réalisée dans le domaine spatial (via des codes spatio-temporels) et dans le domaine temporel (via des codes convolutionnels poinçonnés). L’idée est d’assigner un niveau de protection différent aux données utiles en fonction de leur importance, en exploitant la redondance présente dans les deux domaines. Un haut niveau de protection peut être assigné dans un domaine et un plus faible niveau dans l’autre domaine. La stratégie consiste à obtenir un bon compromis entre efficacité de transmission et fiabilité. Pour jouer sur la diversité spatiale, les auteurs utilisent trois codes en blocs différents à savoir du multiplexage spatial de type BLAST, le code d’Alamouti et une combinaison de ces deux techniques. Un simple récepteur ZF est utilisé afin de simplifier le décodage pour les trois schémas de diversité spatiale. La stratégie proposée assigne un meilleur gain de codage et de la diversité temporelle aux bits les plus importants alors que les bits les moins importants utilisent plutôt la diversité spatiale avec un gain de codage inférieure. Les résultats montrent que l’utilisation d’une diversité spatiale partielle (ou inégale) présente des résultats proches d’un schéma utilisant complètement la diversité spatiale (perte d’environ 1dB49 sur le TEB). Cependant, les auteurs montrent un gain de l’ordre de 25% sur le temps de calcul et une amélioration significative du PSNR en comparaison d’un schéma sans diversité spatial. Dans [78], les auteurs proposent un schéma UEP pour la transmission d’une image JPEG 2000 sur un système MIMO-OFDM intégrant des codes STTC variables. Une image JPEG 2000 est décomposée en couches de qualité protégées par des codes RS. Un entrelacement est effectué au sein de chaque couche de qualité pour limiter l’impact des erreurs par paquets. Puis, les couches sont à nouveau protégées par un code STTC. Un bloc conjoint de contrôle de débit permet de déterminer le nombre de couche de qualité ainsi que le rendement des différents codes à appliquer. L’optimisation est réalisée de telle sorte que la réduction de la distorsion soit maximisée sous la contrainte que le débit nécessaire soit inférieur au débit disponible. 49 Décibel 29 CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL Enfin, les travaux présentés dans [79], proposent d’évaluer différentes stratégies UEP sur un système MIMO pour la transmission d’images JPWL. La diversité spatiale est utilisée par le biais de codes STBC (Alamouti, DAST et Golden code) alors que les données source sont protégées par les codes RS du standard JPWL. Les meilleurs résultats sont fournis par la combinaison de code STBC à faible gain de codage (Alamouti) avec des codes RS à forte capacité de correction ou inversement, par l’utilisation de code STBC présentant un fort gain de codage (Golden codes) avec des codes RS de rendement important. Toutefois, les auteurs remarquent qu’aucun schéma n’est en mesure de surpasser les autres pour un état quelconque du canal, ce qui implique de mettre en place des stratégies adaptatives afin de garantir la meilleure qualité de service face aux fluctuations du support de transmission. Finalement, les stratégies UEP étudiées montrent qu’il est indispensable de prendre en compte la hiérarchisation des données issues du codeur de source. On constate en effet, qu’une protection accrue des données les plus importantes pour la reconstruction de l’image est essentielle, afin de pouvoir exploiter les images pour des canaux présentant de faibles RSB. On retiendra également que la notion d’importance des données est souvent mise en correspondance avec l’erreur quadratique moyenne. Ainsi les problèmes de minimisation de la distorsion sous contrainte de débit se fait souvent au sens de l’erreur quadratique moyenne. Les systèmes MIMO présentent par ailleurs, des architectures intéressantes pour la mise en place de stratégies UEP. Toutefois aucune architecture MIMO ne surpasse les autres pour tous les états du canal, ce qui suggère d’intégrer de l’adaptabilité dans les stratégies de transmission d’image. 1.6.2 Stratégies d’allocation de puissance inégale L’idée de base dans les stratégies de transmission d’image ayant pour objectif d’améliorer la robustesse aux erreurs est d’exploiter la hiérarchie entre les données en sortie du codeur source. Dans le cadre des stratégies UEP, les données les plus importantes sont protégées par des CCE avec une capacité de correction importante au détriment des données les moins importantes. On constate ainsi une robustesse globale accrue en comparaison d’un schéma EEP pour un débit équivalent. Ce principe peut également être décliné du point de vue de la puissance. Effectivement, les systèmes de communication sans fil sont généralement des systèmes contraints au niveau de la puissance d’émission. Ainsi, une gestion intelligente de la puissance au regard du contenu transmis peut s’avérer bénéfique pour améliorer la qualité de service. Divers travaux ont donc été menés ces dernières années afin d’optimiser conjointement l’allocation de la puissance en fonction de la source. Tout comme pour les stratégies UEP, l’idée de base est d’allouer une plus grande puissance aux données les plus importantes pour minimiser la distorsion (généralement au sens de l’erreur quadratique moyenne) au détriment des données les moins importantes tout en respectant la contrainte sur la puissance totale d’émission [80]. Dans [81] et [82], Atzori et al. présentent une méthode pour la transmission d’images JPEG 2000 comprenant une allocation inégale de la puissance entre les différents paquets en fonction de leur contribution sur la qualité de l’image reconstruite. Dans ce schéma, le flux JPEG 2000 est divisé en groupes de paquets transmis à travers différents sous-canaux avec un débit et une puissance adaptés. Les résultats montrent un gain en termes de PSNR d’environ 30 CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL 4dB pour de faibles RSB sur un canal BBAG et un canal à évanouissement de Rayleigh, en comparaison d’un schéma d’allocation égale de puissance (EPA50). Dans [83], les auteurs proposent un algorithme qui alloue la puissance sur les bits en fonction de leur importance sur la qualité de l’image reconstruite en termes d’erreur quadratique moyenne. Ils montrent que l’algorithme proposé est en mesure de fournir un gain de 3 à 4dB sur le RSB pour la transmission d’image à travers un canal à évanouissement de Rayleigh sans aucune incidence sur la bande passante. Toutefois, ce schéma est à l’origine d’une augmentation du PAPR51. Afin de limiter ce problème, ils proposent dans [84] un algorithme qui adapte conjointement l’allocation de la puissance et le codage canal afin d’améliorer la qualité des images transmises sans augmentation significative du PAPR. Ce schéma exploite la hiérarchie entre les données représentant l’image. Un algorithme itératif est développé pour trouver la combinaison optimale entre le codage canal et la puissance à utiliser pour la transmission de chaque bit. L’optimalité du schéma est assurée au sens de l’erreur quadratique moyenne sous contraintes de puissance et de débit. Les résultats de simulations confirment que les bits les plus importants devraient toujours être protégés et transmis avec plus de puissance que les bits de moindre importance qui peuvent être transmis sans protection et avec moins de puissance. Les résultats montrent également que l’approche conjointe permet un gain de 3dB en comparaison d’une configuration comprenant uniquement du codage canal ou uniquement de l’allocation de puissance. Dans [85], les auteurs proposent deux schémas pour la transmission d’images sur des réseaux de capteurs sans fil. Les schémas proposés optimisent la gestion de la puissance pour des réseaux de capteurs en boucle ouverte ou fermée. Les auteurs avancent que les deux schémas permettent d’économiser de l’énergie car ils exploitent la transformée en ondelettes de telle sorte que les images sont décomposées en de multiples niveaux de résolution avec différentes priorités. Cette notion de priorité permet de rejeter certains paquets au niveau des nœuds intermédiaires en fonction du niveau de charge de leur batterie. Cela permet d’obtenir un compromis entre qualité de la transmission et gestion de l’autonomie des nœuds du réseau. Une stratégie pour minimiser l’énergie d’un système sans fil pour la transmission d’image en environnement indoor est également proposée dans [86]. Dans cette étude, le système exploite la variabilité de l’information présente dans l’image et les multi-trajets du canal sans fil. Les auteurs caractérisent la variabilité de l’information dans l’image par une courbe de débit/distorsion alors que la variabilité du canal sans fil est caractérisée par sa réponse impulsionnelle. Dans l’approche proposée, les auteurs utilisent un algorithme dynamique qui permet de fournir la configuration de puissance optimale en fonction de contraintes sur le TEB en réception. Une méthode d’allocation conjointe de la puissance et du codage source est également proposée dans [87] pour la transmission d’images à travers des canaux à évanouissement de Rayleigh. Dans ce papier, le codage de la source est basé sur l’état du canal ce qui confère de la robustesse au schéma global. Dans [88] Sabir et al. proposent un modèle statistique pour estimer la distorsion liée à la transmission d’une image JPEG. Le modèle proposé inclus les différentes composantes d’un codeur entropique avec perte. En outre, il prend en compte les techniques de compression telles que le codage d’Huffman, une modulation par impulsions et codage différentiel (DPCM52 en anglais), et un codage à longueur variable. Les auteurs avancent que le modèle proposé peut être utilisé dans la conception de stratégie de transmission JSCC 50 Equal Power Allocation Peak to Average Power Ratio 52 Differential Pulse Coding Modulation 51 31 CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL indépendamment de l’image transmise et sans avoir besoin de répéter la procédure d’optimisation pour des conditions variables sur le canal de transmission. Cela est possible du fait que le modèle est calibré en déterminant la distorsion moyenne pour un ensemble d’images. Les auteurs présentent ainsi un schéma UPA pour la transmission d’images à travers un canal à évanouissements de Rayleigh comme une application de leur modèle. Dans ce schéma, l’image est divisée en plusieurs couches de qualité transmises avec une puissance inégale respectant la contrainte sur la puissance totale pour chaque symbole émis. Les résultats montrent un gain en termes de PSNR de l’ordre de 5 à 6dB pour de faibles RSB en comparaison d’un schéma EPA. Cet écart important traduit en réalité, la possibilité d’exploiter des images pour de faible RSB, là où ce n’est pas possible avec un schéma EPA. Dans [89], les auteurs proposent un schéma UPA pour la transmission d’images JPEG 2000. Ce schéma est basé sur la minimisation de la distorsion au sens de l’erreur quadratique moyenne. Ainsi, la puissance est allouée aux bits en fonction de leur contribution sur la qualité de l’image reconstruite. Les auteurs présentent une étude intéressante en comparant leur schéma avec des techniques UEP connues de la littérature dont celle développée par Thomos et al. [71]. Les auteurs montrent ainsi une amélioration significative du PSNR (jusqu’à 4dB de gain) ainsi qu’une moindre complexité de leur algorithme. Plus récemment, les auteurs de [89] ont combiné leur modèle UPA pour la transmission d’images JPEG 2000 avec une modulation OFDM [90] ainsi que dans un schéma de transmission au sein d’un réseau cellulaire [91]. Dans ce réseau la station de base utilise une modulation OFDM pour les liaisons descendantes et les terminaux utilisent la technique SCFDE53 [92] pour les liaisons montantes. Les auteurs justifient l’emploi de cette technique par une complexité comparable à l’OFDM mais sans les inconvénients de l’OFDM (augmentation du PAPR et grande sensibilité aux décalages en fréquence des sous-porteuses). Ce schéma est appliqué pour différentes configurations de transmission (SISO, MISO54, SIMO55 et MIMO) avec utilisation de codes STBC (Alamouti). Les résultats de simulations montrent une meilleure qualité d’image pour la combinaison UPA et OFDM. Ces résultats prouvent également l’intérêt d’utiliser un système multi-antennaire pour améliorer la qualité des images reçues. Effectivement, les systèmes MIMO sont parfaitement adaptés à la conception de stratégie UPA. Ainsi dans [93], Sabir et al. reprennent le modèle de distorsion présenté dans [88] afin de proposer un schéma UPA pour la transmission d’images JPEG à travers un système MIMO. Dans ce schéma, l’image est divisée en plusieurs couches de qualité qui sont transmises simultanément par un multiplexage spatial sur les antennes. La répartition de la puissance sur les antennes respecte une contrainte sur la puissance totale pour chaque symbole transmis. Dans le cadre de ce schéma, les auteurs ont modifié le modèle de distorsion présenté dans [88] afin de réaliser une optimisation adaptée à chaque image transmise plutôt qu’une optimisation calibrée sur un ensemble d’images. Les auteurs notent une amélioration significative de la qualité des images reçues en comparaison d’un schéma EPA qu’ils attribuent au fait de considérer les statistiques liées à la source dans la conception du processus d’optimisation et cela, sans incidence sur les ressources nécessaires. Dans [94] et [95], Deepa et al. considèrent un problème similaire à celui traité dans [93]. Ainsi, ils proposent un schéma ayant pour objectif la transmission efficace d’images JPEG à travers un système MIMO utilisant du multiplexage spatial afin d’améliorer la fiabilité et le débit de la transmission. Dans ce schéma, l’image est également divisée en couches de qualité. L’antenne d’émission présentant le plus haut RSBI56 est sélectionnée pour 53 Single Carrier Frequency Domain Equalization Multiple Input Single Output 55 Single Input Multiple Output 56 Rapport Signal sur Bruit plus Interférence 54 32 CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL transmettre les couches les plus importantes. Puis l’antenne émettrice présentant le second plus grand RSBI est sélectionnée et ainsi de suite jusqu’à l’allocation de toutes les données composant l’image. La transmission est alors effectuée en utilisant un schéma UPA sur les différentes antennes. Ces études viennent confirmer une fois de plus l’intérêt de l’UPA par rapport à l’EPA afin d’améliorer la qualité de service pour la transmission d’images sur canal sans fil. Finalement, nous constatons que l’exploitation de la hiérarchisation des données par une allocation inégale de la puissance permet d’augmenter significativement la qualité des images reçues, en comparaison des schémas d’allocation égale. A l’image des stratégies UEP, le critère de qualité est souvent lié à l’erreur quadratique moyenne. Le gain en qualité s’avère généralement plus important que pour les stratégies UEP, et pour une complexité moindre. Par ailleurs, les systèmes MIMO présentent un intérêt majeur pour ce type de stratégie. De par leur architecture, il est aisé de faire varier la puissance d’émission des antennes pour transmettre les différentes composantes hiérarchiques d’une image, augmentant ainsi la qualité globale des images reçues dans des conditions défavorables. Néanmoins, on constate que les stratégies UPA sont relativement peu utilisées conjointement avec des stratégies UEP. Elles peuvent malgré tout parfaitement s’accorder entre elles, généralement au prix d’une augmentation de la complexité du processus d’allocation des ressources. 1.6.3 Stratégies de transmission basées sur la modulation Les stratégies de codage conjoint consistent à faire varier intelligemment certains paramètres de la chaîne de communication. Divers travaux de la littérature ont donc cherché à tirer parti de l’étape de modulation afin d’améliorer les performances des stratégies de transmission. Parmi ces techniques nous pouvons citer en particulier les stratégies basées sur l’utilisation de modulations adaptatives et de modulations hiérarchiques. Priorité haute Priorité basse d2 d1 Figure 1.12. Constellation d’une modulation MAQ-16 hiérarchique La différence entre une modulation classique et une modulation hiérarchique [96] réside en l’interprétation des différents états de la modulation. Si l’on prend par exemple le cas d’une modulation hiérarchique basée sur une MAQ-16 (fig. 1.12), l’emplacement du symbole dans le quadrant est considéré comme une information spécifique. L’autre information spécifique utilisée en modulation hiérarchique est le numéro du quadrant dans 33 CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL lequel se trouve le symbole (1, 2, 3 ou 4). Ainsi, il est possible de considérer deux flux de données indépendants transmis par le biais d’une seule constellation. Théoriquement, il s’agit toujours d’une MAQ-16 (dans l’exemple considéré en fig. 1.12), mais sur le plan de l’interprétation hiérarchique, cette modulation est considérée comme la combinaison de deux MAQ-4. En contrôlant la distance entre d1 et d2 (fig. 1.12), on peut changer le niveau de protection relatif des deux flux de bits offrant une flexibilité supplémentaire pour la mise au point de stratégie de transmission. Les modulations hiérarchiques sont utilisées en particulier pour la diffusion de la télévision numérique terrestre (norme DVB-T57). Cette stratégie a également été utilisée dans divers travaux afin de fournir une protection inégale pour la transmission de données multimédia sur canal sans fil. Par exemple, dans [97] et [98], Noh et al. mettent en œuvre un schéma UEP basé sur l’utilisation de modulations hiérarchiques pour un système MIMO-OFDM. Le flux de données issu d’un codeur source est divisé en deux niveaux de priorité transmis par le biais d’une modulation hiérarchique. Ce type de stratégie est également appliqué dans [99] pour des transmissions robustes de vidéo en temps réel. Dans [100], les auteurs appliquent cette stratégie pour la transmission d’images. Dans ce schéma, la stratégie de protection inégale est fournie à deux niveaux. Le premier correspond à l’allocation des bits suivant leur priorité sur un des deux canaux de modulation hiérarchique présentant une sensibilité différente aux erreurs de transmission. Le deuxième niveau de protection est assuré par un schéma UEP classique utilisant des codes RCPC-CRC à rendement variable. Dans le système proposé, les paramètres liés à la modulation hiérarchique et les rendements de codage canal sont fournis via un algorithme minimisant la distorsion au sens de l’erreur quadratique moyenne. Les auteurs montrent ainsi que la combinaison de méthodes UEP basées sur des CCE et des modulations hiérarchiques permet d’améliorer la fiabilité et la flexibilité des stratégies de transmission d’images. Une autre manière d’inclure la modulation dans une stratégie de transmission consiste à faire varier l’ordre de la modulation afin que celui-ci s’adapte au mieux aux conditions sur le canal de transmission. Cette stratégie, appelée modulation adaptative, est une des optimisations de base dans les stratégies d’adaptation de lien [101] [102] qui consistent à adapter dynamiquement les paramètres de la chaîne de communication pour faire face aux variations sur le canal de transmission. Par exemple dans [103], les auteurs étendent le travail présenté dans [83] pour optimiser conjointement l’ordre de modulation avec l’allocation de la puissance, pour la transmission d’images non-compressées. L’optimisation est réalisée dans le but de maximiser le PSNR des images reçues. L’image sous format numérique est traduite en signal binaire où chaque échantillon est codé sur N bits. Dans un premier temps, les données sont démultiplexées en N sous-flux parallèles où chaque sous-flux contient les bits d’importance équivalente. Ainsi les MSB58 sont regroupés ensemble puis les suivants, jusqu’aux LSB59. Ensuite chaque sous-flux est transmis avec un ordre de modulation et un niveau de puissance respectifs, calculés à partir d’un algorithme exhaustif minimisant la distorsion. Les résultats de simulation sur canal BBAG et sur canal à évanouissements montrent des gains de l’ordre de 10 à 20dB en termes de PSNR en comparaison d’une stratégie EPA avec modulation fixe. Néanmoins ce résultat impressionnant peut être relativisé car il s’applique à des images brutes (sans compression) sur lesquels les erreurs de transmission ont un impact très important en termes d’erreur quadratique, et donc de PSNR. De plus, la configuration utilisée pour se comparer met en œuvre une MAQ-16 qui est relativement sensible pour des configurations de transmission défavorables. 57 Digital Video Broadcasting-Terrestrial Most Significant Bit 59 Least Significant Bit 58 34 CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL Les auteurs de [104] et [105] proposent d’intégrer une modulation adaptative pour la transmission d’une image ayant subie un codage par description multiple (MDC60) [106]. Le codage MDC consiste à coder une source en N flux corrélés transmis sur N canaux indépendants. Chaque flux peut être décodé indépendamment des autres offrant ainsi un niveau de qualité donné qui peut être amélioré par le décodage complémentaire d’autres descripteurs. Ce type de codage est exploité dans [104] et [105] afin de transmettre une image sur un canal OFDM décomposé N sous-canaux. Les auteurs proposent alors deux schémas adaptatifs comprenant modulation adaptative avec EPA et modulation adaptative avec UPA. Un algorithme est proposé pour allouer conjointement la puissance et la taille des constellations dans le but de maximiser le débit utile après décodage RS. Les simulations permettent de comparer ces deux stratégies avec un schéma EPA et une modulation fixe. Les résultats montrent que l’allocation conjointe de la puissance et de la modulation permet des gains significatifs en termes de PSNR et de taux de perte de paquets pour des canaux présentant des RSB relativement faibles. Toutefois, lorsque le canal présente un RSB important, le gain atteint par l’UPA et la modulation adaptative est relativement faible par rapport à la stratégie EPA avec modulation adaptative. Ces résultats suggèrent que la modulation adaptative est l’élément principal permettant de gagner en qualité lorsque le canal présente un RSB élevé. Une stratégie de codage conjoint pour la transmission d’images à travers un système MIMO-OFDM incluant des codes STBC et des modulations adaptatives est proposée dans [107]. L’expression du TEB en réception de ce schéma est présentée. Elle permet par la suite d’introduire un algorithme de recherche de la configuration optimale de l’UEP et de la taille des constellations sous une contrainte de puissance totale. Ce schéma a pour objectif de maximiser la qualité de l’image en réception au sens du PSNR. Les résultats de simulation confirment l’intérêt de l’approche proposée. Dans [108], les auteurs proposent un schéma d’adaptation de lien dans un système MIMO-OFDM en boucle fermée. Dans cet article, les auteurs proposent une solution pour résoudre le problème de la connaissance parfaite de la CSI à l’émission qui peut consommer trop de bande passante. Ils proposent ainsi un algorithme qui permet aux récepteurs de sélectionner une matrice de précodage au sein d’un dictionnaire ainsi qu’un schéma de modulation et de codage (MCS61). Le récepteur renvoie ensuite la configuration optimale à l’émetteur, limitant ainsi l’impact en termes de bande passante. Le choix d’une configuration s’appuie sur la mesure de l’information mutuelle entre les entrées du canal discret et la sortie d’un récepteur MIMO linéaire, qui est calculée à partir du RSBI. Cette information permet d’évaluer les performances des différentes configurations disponibles afin de sélectionner conjointement le nombre de couches multiplexées, les matrices de précodage et les schémas MCS. Bien que cette stratégie ne soit pas appliquée à la transmission d’images, cette adaptation de lien sur canal MIMO-OFDM en boucle fermée pourrait parfaitement convenir pour la transmission d’images codées en couches de qualité. Enfin, nous terminons cet état de l’art par la stratégie d’adaptation de lien proposée dans [109] [110] [111] et [112]. Dans ces travaux, Houas et al. proposent une stratégie d’allocation de ressources pour la transmission de données multimédias scalables sur un canal OFDM. Dans ce schéma, le canal OFDM est divisé en N classes permettant de transmettre les flux composant la source scalable hiérarchisée en N classes d’importance décroissante ayant une influence inégale sur la qualité perçue en réception. Une première contrainte sur la QoS se traduit par des TEB cibles par classe. D’un point de vue système, une contrainte sur le 60 61 Multiple Description Coding Modulation and Coding Scheme 35 CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL débit symbole maximal est également prise en compte. Un problème d’optimisation est alors posé pour déterminer le nombre de classes à transmettre, les rendements de CCE appliqués à chaque classe, et les modulations allouées à chaque porteuse OFDM. Le choix de ces paramètres doit maximiser la quantité de données source transmise et prend en compte le RSB des sous-porteuses OFDM. Concernant l’allocation des ordres de modulation, l’algorithme proposé permet de convertir un canal OFDM sélectif en fréquence en canal OFDM équivalent le moins sélectif en fréquence possible. Diverses applications telles que la transmission de parole [109] [110] [111] ou la transmission d’images JPEG 2000 [112] montrent les bonnes performances de ce schéma et l’intérêt de prendre en compte conjointement la pluralité des paramètres composant la chaîne de communication. L’intégration d’une stratégie de modulation adaptative est le meilleur moyen de s’adapter aux conditions fluctuantes sur le canal de transmission. En effet, l’augmentation de l’efficacité spectrale en relation avec l’état du canal, permet d’atteindre les gains les plus importants parmi les stratégies étudiées. Là où les stratégies UPA et UEP permettent essentiellement d’améliorer la QoS pour des canaux présentant de faibles RSB, la modulation adaptative est en mesure d’améliorer la QoS pour de hautes valeurs de RSB. Ainsi, la combinaison de stratégie UEP et/ou UPA avec des modulations adaptatives apparaît comme un moyen efficace de garantir la QoS pour n’importe quel état du canal de transmission. 1.7 Synthèse et conclusion Dans ce premier chapitre, nous avons introduit le contexte de ce travail à savoir la transmission d’images sur canal sans fil. Pour cela, nous avons présenté succinctement les différents blocs constitutifs de la chaîne de communication numérique tels que le codage source, le codage canal et la modulation. Par la suite, nous avons évoqué les propriétés spécifiques du canal de transmission radiomobile caractérisé par le phénomène de multitrajets, la mobilité et le bruit de transmission. Les difficultés présentes sur le canal de transmission peuvent être surmontées grâce à différentes techniques qui tirent parti de la diversité du canal de transmission telles que l’usage de codes correcteur d’erreur, de modulations multi-porteuses ou de systèmes multi-antennaires. A ce titre, les systèmes MIMO apparaissent comme une technique incontournable permettant d’augmenter significativement la capacité des transmissions sur canal sans fil. Nous avons ensuite présenté un état de l’art sur les stratégies de transmission d’images pour des canaux sans fil qui illustre l’utilisation de ces techniques pour garantir une meilleure qualité d’image en réception (que nous définissons comme la QoS). De manière générale, ces stratégies sont basées sur la hiérarchisation des données en sortie du codeur source. Cette hiérarchie est exploitée en attribuant une meilleure protection aux données les plus importantes (meilleur CCE, plus de puissance, modulation plus robuste) au détriment des données les moins importantes. Cette notion d’importance est, dans la majeure partie des travaux, exprimée en termes de distorsion qui correspond à l’erreur quadratique moyenne entre l’image originale et l’image reçue. L’allocation des ressources est alors réalisée par le biais d’un problème d’optimisation ayant pour objectif de minimiser la distorsion sous contraintes de puissance, de bande passante, de temps de transmission, etc. Cet état de l’art permet de dégager quelques remarques à propos de ces stratégies. Les auteurs ont démontré l’intérêt d’allouer les ressources de manière inégale (UEP, UPA et modulation adaptative) par rapport aux stratégies plus classiques (EEP, EPA, modulation fixe). On retiendra en particulier que les stratégies UEP sont efficaces pour améliorer la qualité des images en réception mais que les stratégies UPA peuvent permettre un gain encore plus 36 CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL important pour une complexité inférieure. On notera également que la modulation adaptative est la stratégie la plus efficace lorsque le canal de transmission est caractérisé par un RSB élevé. Les systèmes MIMO ou MIMO-OFDM permettent d’améliorer significativement les performances et présentent une architecture particulièrement intéressante pour les stratégies de protection inégale grâce au multiplexage spatiale des données d’importance différente et de l’allocation des ressources propres à chaque couche. Toutefois, bien que différents travaux proposent l’optimisation de plusieurs paramètres, la complexité croissante des problèmes d’optimisation ainsi que leur résolution limite le nombre de contribution proposant un schéma global et optimal pour l’allocation des ressources sur tous les blocs de la chaîne de transmission. Partant de ces constatations, nous proposons dans le second chapitre, une stratégie pour la transmission d’image à travers un canal MIMO en boucle fermée incluant des précodeurs. L’architecture proposée dans le cadre de cette stratégie est une première étape en vue de régler conjointement l’ensemble des paramètres des différents blocs (codage source, codage canal, modulation, précodage) de la chaîne de communication permettant de maximiser la qualité des images en réception. 37 CHAPITRE 2 PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES JPWL Sommaire 2.1 Introduction 40 2.2 Le précodage linéaire 2.2.1 Transformation en canal virtuel 2.2.2 Les précodeurs diagonaux 2.2.3 Les précodeurs non-diagonaux 40 40 42 46 2.3 Stratégie de transmission d’images sur canal MIMO 2.3.1 Motivations 2.3.2 Schéma de transmission 2.3.3 Décodeur JPWL robuste 48 48 49 50 2.4 Etude des performances des précodeurs linéaires 2.4.1 Contexte de simulation 52 52 2.4.1.1 2.4.1.2 2.4.1.3 2.4.1.4 2.4.2 Paramétrage de la couche physique Paramétrage de la couche application Métriques d’évaluation Modélisation du canal Résultats de simulation 2.4.2.1 Résultats sur canal statistique 2.4.2.2 Résultats sur canal réaliste 2.5 Synthèse et conclusion 52 52 54 55 56 56 59 64 39 CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES JPWL 2.1 Introduction Les stratégies de transmission conjointes reposent sur la mise en correspondance d’un jeu de paramètres réglés conjointement afin d’atteindre un objectif donné. Dans ce deuxième chapitre, nous allons introduire le schéma de transmission qui va nous servir de base pour la mise en œuvre d’une stratégie globale d’adaptation de lien. Nous rappelons que le contexte de transmission dans lequel s’inscrit ce travail concerne les environnements de propagation sujets aux erreurs de transmission. Ces environnements sont caractérisés par les phénomènes de multi-trajets, de mobilité et de bruit radioélectrique. Afin de combattre ces phénomènes, nous exploitons la diversité du canal de transmission en mettant en œuvre un schéma MIMOOFDM en boucle fermée. Nous formulons l’hypothèse de disposer d’un retour d’information sur l’état du canal de transmission, nous fournissant ainsi la CSI au niveau de l’émetteur. Cette connaissance nous permet d’effectuer diverses opérations qui sont détaillées dans ce chapitre. Dans les sections qui vont suivre, nous introduirons le concept de précodage MIMO à travers la transformation du canal MIMO en canaux virtuels équivalents. A partir de cette représentation, nous présenterons différents précodeurs de la littérature qui permettent de fournir des stratégies UPA suivant différents critères. Nous détaillerons ensuite la stratégie de transmission mise en œuvre pour la transmission d’une image JPWL. Enfin, nous évaluerons les performances des précodeurs dans le cadre de cette stratégie de transmission sur des canaux statistique et réaliste. 2.2 Le précodage linéaire Les systèmes MIMO offrent de nombreux avantages grâce à leur architecture spécifique. La connaissance de l’état du canal du côté de l’émetteur (Tx-CSI) permet d’accroître encore les performances en termes de débit, de robustesse et plus globalement de qualité de service. Il existe plusieurs schémas dans la littérature permettant d’estimer la CSI avec une bonne précision [113-115]. En pratique, la CSI est estimée par le biais de symboles pilotes ou de séquences d’apprentissage. Cette connaissance permet la mise en œuvre des techniques de précodage agissant comme une pré-égalisation avant l’émission. Le précodage repose sur deux opérations, à savoir la décomposition du canal MIMO en sous-canaux SISO indépendants et hiérarchisés, ainsi que l’optimisation d’un critère pour l’allocation de la puissance sur les différents sous-canaux. 2.2.1 Transformation en canal virtuel On considère un canal MIMO à bande étroite avec précodage comprenant nT antennes à l’émission et nR antennes à la réception noté (nT × nR). Un système MIMO (nT × nR) peut être représenté comme un ensemble de b sous-canaux SISO indépendants tel que b ≤ min(nT , n R ) . Le vecteur y de symboles reçus en réception s’écrit : y = GHFs + Gn (2.1) avec s, le vecteur de symboles transmis de taille b × 1 ; y, le vecteur de symboles reçus de taille b × 1 ; H, la matrice de canal de taille nT × nR contenant les coefficients complexes caractérisant les différents couples d’antennes du système MIMO ; F, la matrice de précodage 40 CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES JPWL de taille nT × b ; G, la matrice de décodage de taille b × nR et n le vecteur de bruit additif centré de dimension nR × 1. On suppose que les symboles sont iid, et que les symboles et le bruit additif sont totalement décorrélés. Nous considérons donc : E[ss*] = Ib E[nn*] = R E[sn*] = 0 (2.2) avec Ib la matrice identité de taille b × b et R la matrice de corrélation du bruit. Soit P0, la puissance totale disponible à l’émission. Nous devons respecter la contrainte sur la puissance telle que : trace(FF*) = P0 (2.3) On utilise la décomposition proposée dans [49] [50] [116] [117] qui s’appuie sur trois étapes successives : 1. Blanchiment du bruit : le bruit subit un traitement afin de le rendre iid avec une variance unitaire ; 2. Diagonalisation du canal : la matrice de canal H subit une décomposition en valeur singulière (SVD62) ; 3. Réduction de dimension : la matrice de canal virtuel est réduite à une taille b × b , correspondant au nombre de sous-canaux virtuels et décorrélés. Ces différentes étapes sont basées sur des opérations matricielles. Afin d’aboutir à la diagonalisation du canal, on décompose les matrices de précodage et de décodage sous la forme d’un produit de deux matrices : F = FvFd et G = GdGv (2.4) Les matrices d’indice v servent à blanchir le bruit et diagonaliser le canal. Elles sont directement issues de l’opération de SVD sur la matrice H qui permet d’obtenir le canal virtuel diagonal Hv. Les matrices avec l’indice d servent à optimiser le système suivant un critère donné. Nous pouvons voir le schéma-bloc de la décomposition d’un canal MIMO avec précodage sur la figure 2.1 : Tx-CSI Rx-CSI F s b flux de données Fd Optimisation n Fv H + G Gv Gd y Canal virtuel Hv = GvHFv Figure 2.1. Schéma-bloc canal MIMO précodé en canal virtuel 62 Singular Value Decomposition 41 CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES JPWL Après transformation en canal virtuel, le système MIMO simplifié s’écrit : y = GdHvFds + Gdnv (2.5) avec Hv le canal virtuel défini tel que Hv = GvHFv ; nv le bruit virtuel défini tel que nv = Gvn de matrice de corrélation Rv = Ib. La matrice de précodage Fd est soumise à la contrainte trace(FdFd*) = P0 sur la puissance d’émission (éq. 2.3). La matrice de canal Hv est issue de la décomposition en valeur singulière de la matrice de canal H. Hv est donc une matrice diagonale de taille b × b dont les éléments sont positifs et rangés par ordre décroissant : Hv = diag (σ i )i =1 b (2.6) Les valeurs σ i2 avec i = 1,…,b correspondent au RSB des sous-canaux SISO. Le gain total σ du canal MIMO est défini par la relation suivante : σ = b ∑σ i =1 2 i (2.7) Le précodage linéaire est donc réalisé par le biais de la matrice de précodage Fd et de la matrice de décodage Gd. On peut distinguer deux types de précodeurs en fonction de la diagonalité ou de la non-diagonalité de ces matrices. On parlera alors de précodeurs diagonaux ou non-diagonaux. La représentation en b sous-canaux indépendants présente l’avantage de simplifier efficacement une détection par ML même pour un grand nombre de valeurs de b ainsi que pour des constellations importantes. Il a d’ailleurs été démontré dans [117] que dans le cadre d’un décodage ML, la matrice de décodage Gd n’a aucune d’influence. Ses coefficients peuvent donc être pris égaux à 1 (Gd = Ib). 2.2.2 Les précodeurs diagonaux Les précodeurs diagonaux présentent des matrices Fd et Gd diagonales telles que b b Fd = diag ( f i )i =1 et Gd = diag ( g i )i =1 . Les symboles reçus sur chaque sous-canal sont définis tels que : yi = g iσ i f i si + g i nvi pour i = 1, …, b (2.8) avec gi = 1 dans le cadre d’un décodage ML. La figure 2.2 illustre le fonctionnement d’un précodeur diagonal où les symboles sont multiplexés (MUX sur la figure 2.2) sur les souscanaux virtuels. 42 CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES JPWL Fd Hv nv f1 σ1 n v1 ML s1 s × M U X + × D E M U X n vb σb fb ŝ1 y1 ML sb + × × Allocation de la puissance Gain du canal s^ ŝb yb Bruit virtuel Figure 2.2. Schéma-bloc d’un précodeur diagonal Les précodeurs diagonaux présentent l’avantage de réduire significativement la complexité du décodage ML de Mb à b × M avec M le nombre de points composant la constellation de la modulation. Les différents précodeurs diagonaux se distinguent par le critère optimisé via la matrice Fd. Nous présentons ci-dessous quelques uns des principaux précodeurs de la littérature qui seront utilisés dans le cadre de ces travaux. Maximisation de la capacité : Water-Filling Le précodeur Water-Filling (WF) [54] permet de maximiser la capacité. Dans le cadre d’un canal diagonalisé, la capacité C s’exprime par la relation suivante : ( b C = ∑ log 2 1 + f i 2σ i2 i =1 ) (2.9) Les coefficients f i 2 de la matrice de précodage diagonale Fd représentent la solution d’un problème d’optimisation par la méthode de Lagrange [118] sous contrainte que la puissance d’émission soit égale à P0. La solution de ce problème fournit les coefficients f i 2 tels que : f i2 = 1 Ψ − 2 σi 0 si Ψ > 1 σ i2 pour i = 1, …, b (2.10) sinon où Ψ est un seuil dépendant du canal virtuel, et défini par : Ψ= P0 + γ Ψ bΨ avec bΨ 1 i =1 σ i2 γΨ =∑ (2.11) où le nombre de voies bΨ conservées est égal à : 43 CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES JPWL bΨ = P0 + γ Ψ Ψ (2.12) On constate qu’une propriété du précodeur WF est la possibilité de sacrifier des voies (b ≥ bΨ ) , que le précodeur considère trop défavorable, pour permettre ainsi de concentrer la puissance sur un nombre réduit de voies. On remarque également qu’à fort RSB ( σ i2 >> 1), le précodeur WF répartit équitablement la puissance entre les différents sous-canaux fournissant ainsi une stratégie EPA. Minimisation de l’erreur quadratique moyenne : MMSE Une autre solution classique dans les télécommunications consiste à minimiser l’erreur quadratique moyenne. Le précodeur MMSE [54] réalise cette opération grâce à une méthode robuste et de faible complexité. Le critère à minimiser correspond à E[||y - s||2] et peut s’écrire : b ∑ E (g σ i i =1 i 2 f i − 1)s i + g i nvi (2.13) L’optimisation du précodeur définit les coefficients de la matrice Fd tels que : 1 1 Ψ − σi σi fi = 2 0 si Ψ > 1 σi pour i = 1, …, b (2.14) sinon En notant bΨ l’entier tel que σi > 1/Ψ pour i = 1,…, bΨ et σi ≤ 1/Ψ pour i = bΨ + 1,…,b , nous obtenons : Ψ= P0 + γ Ψ βΨ bΨ avec βΨ = ∑ i =1 1 σi (2.15) et γ Ψ définit dans l’équation (2.11). Comme pour le précodeur WF, le précodeur MMSE peut sacrifier des voies qu’il juge trop défavorable. Toutefois, à l’inverse du WF, la puissance est inversement proportionnelle à σi. Ainsi, pour des valeurs de RSB élevés, le précodeur MMSE alloue toujours plus de puissance aux voies défavorisées. Minimisation du taux d’erreur binaire : MBER Dans [119], Rostaing et al. ont proposé un précodeur diagonal minimisant le TEB noté MBER63. Ce précodeur suppose l’hypothèse que le bruit n est blanc additif gaussien et que par conséquent le bruit virtuel nv est lui aussi gaussien. On peut alors exprimer la probabilité d’erreur binaire théorique Peb sur le sous-canal i par la relation [17] : 63 Minimum Bit Error Rate 44 CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES JPWL ( Peb,i = α M erfc β M f i 2σ i2 ) (2.16) avec αM et βM des constantes dépendant de la modulation et erfc est la fonction d’erreur complémentaire gaussienne définie par : erfc(x ) 2 ∫ π x 0 e −t dt 2 (2.17) Dans le cadre d’une modulation MAQ-M, on a : αM = 1 2 1 − log 2 M M βM = et 3 2(M − 1) (2.18) Le précodeur cherche à minimiser le TEB par une optimisation Lagrangienne s’écrivant : D TEB = αM b b ∑ erfc i =1 ( ) b β M f iσ i + µ ∑ f i 2 − P0 i =1 (2.19) où est le multiplicateur de Lagrange. La solution de ce problème d’optimisation fournit les coefficients de la matrice Fd qui minimise le TEB : fi2 = 2σ i4α M2 β M2 W 0 2 2 2 β M σ i2 µ πb 1 (2.20) où W0(.) représente la fonction de Lambert d’index 0 [120]. Une optimisation est nécessaire afin de déterminer la valeur du paramètre permettant de respecter la contrainte de b 2 puissance ∑i =1 f i = P0 . La complexité de cette solution peut être considérablement amoindrie par une approximation de la fonction de Lambert d’index 0 tel que : W0 ( x ) ≈ ln ( x ) − ln (ln ( x )) pour x >> 1 (2.21) En utilisant cette approximation dans l’équation 2.20, on obtient directement la solution simplifiée : f i2 = où : ( ) a i 1 − ∑ k Ak + Ai ∑k a k ∑ k (2.22) ak Ai = a i (ln (bi ) − ln (ln (bi ))) ai = 1 β M σ i2 et bi = (2.23) 2σ i4α M2 β M2 πb 2 (2.24) 45 CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES JPWL La solution simplifiée n’est plus valable pour de faibles valeurs de RSB. Effectivement, le terme ln(bi) peut être négatif, rendant ainsi le calcul du terme Ai impossible. Dans ce cas de figure, les sous-canaux concernés sont considérés comme trop défavorables et sont donc négligés ( f i 2 = 0 ), à l’image des précodeurs WF et MMSE. 2.2.3 Les précodeurs non-diagonaux Les précodeurs non-diagonaux ne présentent pas de matrice de précodage diagonale ( ) b (Fd ≠ diag f i 2 i =1 ). La figure 2.3 illustre le fonctionnement de ces précodeurs. s1 s M U X Hv nv σ1 n v1 × + ML y1 ŝ1 D E M U X Fd sb Solution nondiagonale σb n vb × + Gain du canal yb s^ ŝb Bruit virtuel Figure 2.3. Schéma bloc d’un précodeur non-diagonal La structure des précodeurs non-diagonaux ne leur permet pas de réduire la complexité du décodage ML qui est alors égale à Mb. La non-diagonalité fournit néanmoins un degré de liberté supplémentaire au précodeur qui peut alors modifier les géométries des constellations de réception. Dans cette section, nous présentons deux précodeurs qui illustrent ce principe. Maximisation de la distance minimale de la constellation de réception : Max-dmin La distance euclidienne minimale a un rôle déterminant lorsque le récepteur est basé sur le ML. Ce récepteur agit directement sur la probabilité d’erreur. Or, plus deux points de la constellation de réception sont proches et plus la probabilité de commettre une erreur au décodage augmente. Partant de cette constatation, le précodeur Max-dmin [117] calcule les coefficients de la matrice Fd permettant de maximiser la distance minimale de la constellation de réception notée dmin telle que : dmin(Fd) = min ( sk , sl )∈ , sk ≠ sl ||HvFd(sk - sl)|| (2.25) où représente l’ensemble des symboles complexes de la constellation. Les coefficients de la matrice Fd doivent maximiser dmin. Le problème s’écrit : Fd = arg max {dmin(Fd)} Fd 46 avec trace(FdFd*) = P0 (2.26) CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES JPWL La résolution de ce problème prend en compte divers paramètres tels que le canal virtuel Hv, la modulation et le nombre de voies b. Toutefois, les solutions trouvées sont proposées pour b = 2 voies avec des modulations BPSK64, MAQ-4 et MAQ-16 [117] [121]. La solution est indépendante du RSB et ne dépend que d’un paramètre unique γ défini par la suite. La solution proposée dans [117] est obtenue grâce à un changement de variable entre les deux valeurs propres du canal notées σ1 et σ2. Il s’agit d’un changement de coordonnées cartésiennes en coordonnées polaires. Les deux nouvelles variables sont : σ2 σ 1 = ρ cos γ γ = arctan σ1 ⇔ sin = σ ρ γ 2 2 ρ = σ + σ 2 1 2 (2.27) Le canal virtuel peut alors s’écrire : 0 σ cos γ Hv = 1 = ρ 0 σ 0 2 0 sin γ (2.28) où ρ ϵ ℜ + agit comme un gain sur toute la chaîne et γ (π/4 ≥ γ > 0) est un angle caractéristique du canal Hv et permet de savoir si tous les sous-canaux sont équilibrés ou non. Effectivement, une valeur de γ proche de 0 implique que la voie 1 est fortement privilégiée, tandis qu’une valeur proche de π/4 signifie que les deux voies sont équivalentes. De plus, cette notation fait apparaître ρ comme un facteur d’échelle de la distance minimale et n’intervient en rien dans l’optimisation (2.26). L’optimisation ne dépend alors que du paramètre γ permettant une simplification notable dans la détermination de la solution. Nous donnons à titre d’exemple la matrice de précodage Fd pour une modulation MAQ-4 correspondant à deux formes de précodeurs : Si 0 ≤ γ ≤ γ0 Si γ0 < γ ≤ π 4 alors alors π 3 − 3 j 12 e 6 0 Fd = Fd1 = 3+ 3 P0 6 0 Fd = Fd2 = π j 0 1 e 4 P0 cosυ/ π j sin υ/ 2 0 4 − 1 e (2.29) (2.30) où 2 −1 υ/ = arctan tan γ γ = arctan 3 3 − 2 6 + 2 2 − 3 ≈ 17,28° 0 3 3 − 2 6 +1 64 (2.31) Binary Phase Shift Keying 47 CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES JPWL Le précodeur Max-dmin prend la matrice la matrice Fd qui favorise une seule voie pour des valeurs de γ inférieure à 17,28° (éq. 2.31). Le précodeur choisit alors de mélanger les deux symboles et de les transmettre uniquement sur la meilleure voie. Ce cas de figure se présente lorsque l’écart entre les deux valeurs propres est grand. Dans le cas contraire, i.e. pour des valeurs de γ supérieures à 17,28°, le précodeur Max-dmin utilise les deux voies à travers la matrice de précodage Fd2 pour transmettre les deux symboles. La solution pour la MAQ-16, détaillée dans [121], conduit à 4 formes différentes de précodeurs. Extension du précodeur Max-dmin : le précodeur E-dmin L’inconvénient majeur du précodeur Max-dmin tient dans sa complexité de décodage par ML qui croît exponentiellement avec le nombre de voies considérées : Mb. La généralisation de cette solution pour un système MIMO, comprenant plus de deux antennes à l’émission et à la réception, a été proposée dans [122]. Bien que non-optimale, cette solution permet d’obtenir un bon compromis entre les performances en termes de TEB et une complexité modérée pour le décodage ML. Cette solution, appelée E-dmin, s’applique sur un canal MIMO comprenant b voies, avec b = min(nT, nR) ≥ 4 et b un nombre pair. Les différentes étapes de la solution E-dmin sont résumées ci-dessous : 1. Décomposition du canal MIMO en b > 2 sous-canaux SISO parallèles et indépendants par la transformation en canal virtuel (§ 2.2.1) ; 2. Séparation du système MIMO en b/2 sous-systèmes MIMO virtuels comprenant deux voies de données chacun, notés sous-systèmes MIMO χ i avec i = 1,…, b/2 ; 3. Application du précodeur Max-dmin sur chacun des sous-systèmes MIMO χ i ; 4. Répartition de la puissance totale P0 sur les différents sous-systèmes MIMO en affectant à chacun d’eux une puissance ϒi qui maximise dmin sous la contrainte ∑ b/2 i =1 ϒi² = P0 . 2.3 Stratégie de transmission d’images sur canal MIMO 2.3.1 Motivations Dans le cadre nos travaux, nous utilisons le codeur JPWL car celui-ci intègre des outils de robustesse ayant fait leurs preuves afin d’améliorer la robustesse contre les erreurs de transmission [64]. Ce codeur a, de plus, été désigné comme codeur de référence dans le cadre du projet ANR CAIMAN dans lequel s’inscrivent ces travaux. En outre, ce codeur intègre une forte hiérarchisation de son flux de données comme la majorité des standards multimédias récents. Cette hiérarchisation permet en particulier d’atteindre un haut degré de scalabilité. La transmission d’un flux hiérarchisé peut naturellement être exploitée, dans le cadre d’une transmission MIMO, par un schéma en boucle fermée intégrant une diagonalisation du canal ainsi que du précodage. La transmission sur un canal radiomobile conduit à considérer certains facteurs permettant d’optimiser le codage de la source. Par exemple, il n’est pas optimal de coder de manière très fine la source si la transmission s’avère impossible ou fortement contrainte. La connaissance du canal de transmission et de l’application liée au codage de source peut notamment amener à considérer une configuration de transmission optimale en rapport avec les capacités offerte par le canal. Ainsi une forte 48 CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES JPWL interaction au sein de la chaîne de transmission doit être requise. Le but est d’atteindre une qualité de services garantie. Il est donc nécessaire de prendre en compte l’impact sur le compromis débit/distorsion des différents paramètres de la chaîne de transmission. L’architecture proposée consiste à considérer un schéma de transmission qui réunisse les différents aspects adaptatifs caractérisant les principales stratégies de l’état de l’art (UEP, UPA et modulation adaptative). Cette stratégie doit s’articuler autour d’une architecture MIMO pour s’affranchir des difficultés liées aux environnements riches en multi-trajets. Pour la mise en place d’une stratégie UPA flexible, on considère disposer de la CSI à l’émission, ce qui permet de diagonaliser le canal MIMO. La stratégie UPA est alors réalisée par l’intégration de précodeurs qui doivent permettre d’évaluer la pertinence de différents critères pour la transmission d’image. La diagonalisation du canal permet de hiérarchiser les souscanaux SISO, ce qui assure la mise en place d’un schéma offrant à la fois scalabilité, robustesse et adaptabilité grâce à la modularité de certains paramètres. 2.3.2 Schéma de transmission L’idée de base sous-tendant le schéma de transmission proposé consiste à fournir une robustesse naturelle à la source sans aucun ajout de redondance et uniquement par la prise en compte des caractéristiques du contenu en adéquation avec les caractéristiques du canal. La figure 2.4 illustre ce principe : COUCHE APPLICATION Décomposition de la source en couches de qualité hiérarchisées COUCHE PHYSIQUE Décomposition du canal MIMO en b sous-canaux SISO hiérarchisés RSB1 = f12σ 12 Qualité de base Couche d’amélioration 1 Couche d’amélioration b Précodage MIMO Correspondance source-canal RSB2 = f 22σ 22 RSBb = f b2σ b2 Figure 2.4. Correspondance entre la source et le canal dans la stratégie de transmission Du côté de la couche application, l’image est décomposée en b couches de qualité classées par ordre d’importance décroissante. Du côté de la couche physique, le canal est décomposé en b sous-canaux SISO classés dans l’ordre décroissant des RSB. L’idée première de cette stratégie de transmission consiste à allouer les couches de qualité de la source sur les sous-canaux SISO en respectant la correspondance en termes de hiérarchie. Le précodeur MIMO agit alors comme un lien entre la source et le canal en allouant la puissance sur les sous-canaux pour la transmission des différentes couches de qualité via l’optimisation d’un 49 CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES JPWL critère propre au précodeur. La figure 2.5 replace cette stratégie de transmission dans le schéma-bloc global illustrant la chaîne de communication mise en place. Codage source en couches de qualité hiérarchisées Multiplexage S/P Codage JPWL Codage canal (codes RS) Entrelaceur Mod. MAQ-M Entrelaceur Mod. MAQ-M Entrelaceur Mod. MAQ-M Mod. OFDM Précodeur MIMO (WF, MMSE, MBER, E-dmin) Mod. OFDM Mod. OFDM Tx-CSI Rx-CSI Canal MIMO Décodage source Décodage canal Démultiplexage P/S Décodage JPWL robuste Désentrelaceur Démod. MAQ-M Désentrelaceur Démod. MAQ-M Désentrelaceur Démod. MAQ-M Démod. OFDM Décodeur à Maximum de Vraisemblance Démod. OFDM Démod. OFDM Figure 2.5. Schéma de la stratégie de transmission d’image JPWL Le codage source et le codage canal sont assurés par le codeur JPWL. Les couches de qualité sont alors multiplexées sur les b voies du système, puis elles sont entrelacées avant d’être modulées via une modulation MAQ. Un précodeur MIMO vient allouer la puissance sur les différents sous-canaux par optimisation d’un critère. On applique ensuite une modulation OFDM avant émission sur le canal MIMO. En réception, on trouve les opérations duales incluant en particulier un décodage par Maximum de Vraisemblance. En fin de chaîne, un décodeur JPWL robuste applique le décodage canal puis le décodage source. L’architecture de cette transmission permet d’appliquer facilement une stratégie UPA, apportant ainsi de la robustesse au schéma sans redondance. On remarquera également que la décomposition du canal MIMO est idéale pour la mise en place de stratégie UEP ainsi que l’intégration de modulation adaptative, du fait de l’indépendance de chaque sous-canal SISO. 2.3.3 Décodeur JPWL robuste L’objectif de la stratégie proposée consiste à assurer la QoS dans des conditions de transmission difficiles. Malgré le fait que JPWL soit plus robuste que le codeur/décodeur JPEG 2000 classique, il arrive néanmoins que ce décodeur soit victime de boucle sans fin lorsque les erreurs sont trop nombreuses ou mal positionnées comme c’est le cas pour de très 50 CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES JPWL faibles valeurs de RSB. Pour remédier à ce problème, on utilise une version robuste du décodeur JPWL fournit par Thalès Communications dans le cadre du projet ANR CAIMAN. Codestream JPWL d’entrée Analyse et indexation du codestream en P paquets Décodage des marqueurs EPB i=0 i≥P non oui Décodage du ième paquet Détection des erreurs résiduelles oui non Stockage de l’image partiellement décodée Affichage de l’image partiellement ou totalement décodée i++ Figure 2.6. Implémentation du décodeur JPWL robuste Afin d’être robuste au phénomène de boucle sans fin pouvant caractériser le décodeur JPWL classique, le décodage est réalisé de manière itérative. Les premières opérations consistent à analyser le codestream composé de P paquets. Après avoir décodé les marqueurs EPB65 qui contiennent diverses informations sur les protections ainsi que la redondance allouée aux diverses portions du codestream [10], le décodage de l’image est effectué paquet par paquet. Après avoir décodé un paquet, l’image partiellement décodée est stockée puis on effectue le décodage du paquet suivant jusqu’à atteindre le dernier paquet ou bien qu’une erreur résiduelle sur un marqueur soit détectée dans le paquet en cours de décodage. Dans ce 65 Error Protection Block 51 CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES JPWL cas de figure, le décodage s’interrompt et la dernière version de l’image correctement décodée est fournie en sortie du décodeur. 2.4 Etude des performances des précodeurs linéaires Nous étudions, dans cette section, les performances de la stratégie de transmission proposée avec les précodeurs linéaires de la littérature. On évalue ainsi la pertinence des critères utilisés par les précodeurs afin d’assurer la QoS pour la transmission d’images JPWL. 2.4.1 Contexte de simulation 2.4.1.1 Paramétrage de la couche physique Nous considérons un système MIMO (4×4) conduisant à fournir 1 à 4 sous-canaux SISO après diagonalisation. En pratique, cette configuration matérielle constitue un bon compromis entre de bonnes performances et un coût matériel modéré. L’espacement entre les antennes est fixé à 0,4λ avec λ la longueur d’onde de l’onde porteuse. Il a été démontré que cet espacement fournit la plus faible corrélation entre les antennes [36]. Les paramètres de la couche physique (fréquence de la porteuse, modulation OFDM, puissance d’émission et seuil de sensibilité) sont fixés suivant la norme IEEE 802.11n. Nous ne tenons toutefois pas compte des codes correcteurs définis par la norme, car nous utilisons les codes Reed-Solomon fournis par le codeur JPWL. Dans le cadre de ces simulations, nous considérons une modulation MAQ-4 sur chaque sous-canal SISO. 2.4.1.2 Paramétrage de la couche application Dans le cadre de ces tests, nous transmettons les images Caps et Monarch (fig 2.7) de résolution 768 × 512 pixels. Nous utilisons des images présentant un contenu très différent et de résolution relativement importante, à l’image de l’évolution des services qui favorisent les images de grande dimension. Ces images sont codées par l’intermédiaire de JPWL pour être transmises sur le canal MIMO (4×4) décrit dans le paragraphe précédent. Comme la décomposition de ce canal conduit à considérer quatre sous-canaux SISO, nous codons les images JPWL en quatre couches de qualité hiérarchisées présentant chacune un débit de 0,25bpp66 offrant ainsi une granularité visible entre les couches de qualité. Chaque image est codée en une seule tuile. Nous intégrons les protections prédéfinies par le standard JPWL pour l’entête principal, l’entête de tuile et les entêtes de paquets. Nous intégrons également les marqueurs de resynchronisation en début de paquet (marqueurs SOP67) et en fin d’entête de paquet (marqueurs EPH68). Afin d’évaluer les performances des précodeurs, nous considérons un schéma sans codage canal sur les données utiles ainsi qu’un schéma EEP intégrant des codes RS(37,32) sur les données utiles. Nous utilisons le code RS(37,32) car il présente la redondance la plus faible parmi les codes du standard JPWL. Nous limitons ainsi la robustesse résultant uniquement du codage canal afin de mettre en avant la robustesse globale du schéma. 66 bit par pixel Start Of Packet 68 End of Packet Header 67 52 CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES JPWL (a) (b) Figure 2.7. Images transmises dans le cadre des simulations : (a) « Caps » et (b) « Monarch » Remarque sur le multiplexage spatial La norme JPWL spécifie la syntaxe que doit respecter le bitstream compressé. Cette norme spécifie en particulier que la redondance propre à chaque couche de qualité est intégrée dans les marqueurs EPB, qui prennent initialement place dans les données d’entête de tuile (tile-part header). Dans le cadre de notre stratégie de transmission, les données d’entête (main header et tile-part header) sont transmises avec la couche de base car, en l’absence de ces données, nous ne pouvons strictement rien décoder. Toutefois, nous sortons du cadre de la syntaxe JPWL standardisée en embarquant les marqueurs EPB (la redondance liée au codage canal) avec les couches de qualité correspondante (voir fig. 2.8). Nous considérons en effet, qu’il n’est pas logique du point de vue de la transmission, de transmettre toute la redondance de l’image sur le sous-canal uniquement alloué à la transmission de la couche de base, telle que la configuration standard le défini initialement. Sous-canaux SISO hiérarchisés σ 12 σ 22 σ 32 σ 42 1ère couche Main header Tile-part header 2ème couche 3ème couche 4ème couche Marqueur EPB Données utiles Marqueur EPB Données utiles Marqueur EPB Données utiles Marqueur EPB Données utiles Couche 1 Couche 1 Couche 2 Couche 2 Couche 3 Couche 3 Couche 4 Couche 4 0,25bpp 0,5bpp 0,75bpp 1bpp Figure 2.8. Répartition des couches de qualité JPWL et des données EPB sur les sous-canaux SISO 53 CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES JPWL 2.4.1.3 Métriques d’évaluation Nous évaluons les performances des précodeurs par l’intermédiaire de trois critères usuels à savoir : • le TEB : le taux d’erreur binaire est très souvent utilisé afin d’évaluer la QoS d’un lien radio ; • le PSNR : ce critère est certainement le plus utilisé à l’heure actuelle afin d’évaluer la qualité visuelle d’une image, bien qu’il présente des limites comme cela est illustré dans [123]. Il s’appuie sur l’Erreur Quadratique Moyenne (EQM) telle que (pour des échantillons codés sur 8 bits) : 255 2 PSNR = 10 log 10 EQM où EQM = 1 M ×N ∑ ∑ (Xˆ M N i =1 j =1 i, j − X i, j ) 2 (2.32) avec X̂ les échantillons reconstruits après codage/décodage ; X les échantillons originaux ; M et N le nombre d’échantillons en hauteur et en largeur respectivement. • le score SSIM : la métrique SSIM [124] (pour Structural Similarity) permet de mesurer la similarité entre une image compressée et l’image originale. A la différence du PSNR qui repose sur l’erreur quadratique (erreur pixel par pixel), la métrique SSIM est sensible à la similarité des structures des images comparées. L’hypothèse sousjacente étant que l’œil humain est plus sensible aux changements de structure dans l’image. Cette métrique assigne un score allant de 0 (très mauvaise qualité) à 1 (reconstruction parfaite). Le tableau 2.1 résume les scores PSNR et SSIM pour les différentes configurations de codage utilisé dans le cadre de nos simulations (voir §2.4.1.2). Caps sans CCE Caps avec RS(37,32) Monarch sans CCE Monarch avec RS(37,32) 1ère couche PSNR SSIM + 2ème couche PSNR SSIM + 3ème couche PSNR SSIM + 4ème couche PSNR SSIM 32,45 31,96 28,85 28,24 35,77 35,05 32,99 32,14 38,12 37,31 35,68 34,71 39,76 38,93 37,60 36,70 0,874 0,864 0,877 0,871 0,925 0,917 0,925 0,920 0,948 0,940 0,947 0,941 0,960 0,954 0,957 0,952 Tableau 2.1. Distorsion des images tests pour un codage de 0,25bpp par couche de qualité avec ou sans codage canal, en termes de PSNR (dB) et de score SSIM On note que le contenu de l’image a un impact sur les scores des deux métriques pour un codage à débit identique. On remarque également que la robustesse apportée par le codage canal se fait au prix de la qualité visuelle. On note en particulier que l’ajout de la redondance entraine une perte de 0,83dB pour l’image Caps et 0,90dB pour l’image Monarch pour un décodage avec 4 couches de qualité. Pour un débit source donné, cet écart augmente avec l’augmentation de la redondance dans le flux. Il est donc important, dans le cadre d’une stratégie de transmission, de choisir un CCE adapté aux conditions de transmission. 54 CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES JPWL 2.4.1.4 Modélisation du canal Nous utilisons deux modèles de canaux pour les simulations à savoir un canal statistique et un canal réaliste. Le canal statistique est utilisé car il permet de visualiser l’évolution des performances en fonction du RSB, alors que le canal réaliste permet de visualiser l’adaptation de la stratégie face à des conditions de transmission qui fluctuent de manière réaliste. Canal statistique Le canal statistique simule des évanouissements de Rayleigh. Une matrice de canal H ainsi qu’un vecteur de bruit sont tirés aléatoirement pour chaque vecteur de symboles émis. Les éléments de H sont indépendants et identiquement distribués. Ils appartiennent au domaine complexe et suivent une loi gaussienne centrée de variance unitaire. Le bruit est lui aussi gaussien. Comme la puissance reçue dépend du précodage, on considère que le RSB correspond au rapport entre la puissance totale émise sur la puissance totale du bruit. Enfin, dans le cadre des simulations sur canal statistique, nous considérons une connaissance parfaite de la CSI à l’émission et à la réception. Canal réaliste Nous utilisons le simulateur 3D à tracé de rayons présenté dans le chapitre 1 (§1.3.2.3) afin de fournir les réponses impulsionnelles du canal réaliste. La scène utilisée est un environnement suburbain correspondant à une portion du campus de l’Université de Poitiers. La figure 2.9 (a) représente cet environnement de transmission où les bâtiments sont représentés en rouge. Nous simulons une transmission dans laquelle l’émetteur MIMO est fixe et le récepteur MIMO se déplace le long d’une trajectoire de 138m à la vitesse de 5m/s. Les conditions de transmission alternent successivement entre mauvaises (NLOS dans la zone 1), moyennes (NLOS dans les zones 2 et 4) et bonnes (LOS dans la zone 3). L’évolution du gain σ du canal est présentée sur la figure 2.9 (b) où σ est défini par l’équation (2.7). Dans le cadre des simulations sur canal réaliste, nous considérons une connaissance imparfaite de la CSI avec une estimation, tous les 20 symboles OFDM (conforme à la norme IEEE 802.11n) via une séquence d’apprentissage. Cette mise à jour de la CSI permet de limiter l’impact de l’effet Doppler. Emetteur MIMO Trajectoire Récepteur MIMO (mètres) 138 120 Position sur la trajectoire Bâtiments 70 0 (a) Gain canal MIMO 4×4 en dB Gaindu of 4x4 MIMO channel in dB 20 Zone 1 Zone 2 Zone 3 Zone 4 18 16 14 12 10 8 6 0 500 1000 1500 2000 Position receiver du trajectory (×λ) (×λ) Position suron la the trajectoire récepteur (b) Figure 2.9. (a) Topologie de l’environnement de transmission et (b) évolution du gain du canal MIMO 55 CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES JPWL 2.4.2 Résultats de simulation 2.4.2.1 Résultats sur canal statistique La figure 2.10 illustre les performances en termes de TEB global des différentes stratégies de précodage. Le TEB global est évalué en faisant la moyenne des TEB sur chaque sous-canal. Système MIMO 4×4, b = 4, MAQ-4 0 10 MMSE MBER WF E-dmin -1 TEB global 10 -2 10 -3 10 -4 10 0 5 10 15 RSB en dB 20 25 30 Figure 2.10. Courbe de TEB global des différentes stratégies de précodage Nous remarquons que le précodeur qui fournit les moins bonnes performances est le précodeur WF. Ce précodeur maximise la capacité théorique de la transmission. Pour cela, il peut sacrifier une ou plusieurs voies conduisant à un TEB de 0,5 sur les voies sacrifiées, ce qui pénalise le TEB global. Le précodeur MMSE peut également sacrifier des voies mais il présente une politique d’allocation plus favorable aux voies défavorisées, ce qui conduit à un TEB global inférieur à celui présenté par le précodeur WF. Comme nous pouvions nous y attendre, le précodeur MBER présente les meilleure performances (TEB le plus faible) des précodeurs diagonaux étudiés car il minimise le TEB global de la transmission. Les meilleures performances sont atteintes par le précodeur E-dmin. La non-diagonalité de ce précodeur lui offre un degré de liberté supplémentaire ce qui lui permet de présenter les meilleures performances. Les figures 2.11 et 2.12 illustrent les résultats en termes de PSNR et de score SSIM pour les images Caps et Monarch. A partir de ces courbes, nous pouvons relever trois points importants. Premièrement, le PSNR et la métrique SSIM convergent vers les mêmes conclusions quelles que soient l’image et/ou la configuration de codage canal. On précisera tout de même que les images présentant un PSNR ou un score SSIM nul correspondent à des cas de figure où le décodeur JPWL est dans l’incapacité de fournir un fichier en sortie. De la même façon, on remarque la présence d’un « palier » sur certaines courbes avec des images présentant un PSNR de 7,5dB. Ces cas de figures correspondent à des images majoritairement noires (donc inexploitables) en sortie du décodeur. Ces cas de figures sont d’ailleurs notés plus sévèrement par la métrique SSIM qui attribue un score d’environ 0,005 pour ces configurations. 56 CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES JPWL Système MIMO 4×4, b = 4, MAQ-4 Pas de CCE sur les données utiles Système MIMO 4×4, b = 4, MAQ-4 Pas de CCE sur les données utiles 40 1 35 0.9 0.8 30 Score SSIM PSNR en dB 0.7 25 20 15 5 0 0 5 10 15 RSB en dB 20 25 0.5 0.4 0.3 MMSE MBER WF E-dmin 10 0.6 MMSE MBER WF E-dmin 0.2 0.1 0 30 0 Codes RS(37,32) sur les données utiles 5 10 15 RSN en dB 20 25 30 Codes RS(37,32) sur les données utiles 40 1 35 0.9 0.8 30 Score SSIM PSNR en dB 0.7 25 20 15 5 0 0 5 10 15 RSB en dB 20 25 0.5 0.4 0.3 MMSE MBER WF E-dmin 10 0.6 MMSE MBER WF E-dmin 0.2 0.1 30 0 0 5 10 15 RSB en dB 20 25 30 Figure 2.11. Evolution du PSNR et du score SSIM avec différentes configurations de codage canal sur un canal statistique pour l’image « Caps » Deuxièmement, les résultats sur la qualité des images (PSNR et SSIM) montrent des résultats contradictoires avec les courbes de TEB présentées sur la figure 210. Par exemple, le précodeur WF qui présente les moins bonnes performances en termes de TEB, montrent de bonnes performances en termes de qualité d’images. A l’inverse, les précodeurs MBER et Edmin, qui présentent les meilleures performances en termes de TEB, fournissent les résultats les moins bons en termes de qualité d’images. Ces résultats contradictoires s’expliquent par les politiques d’allocation de puissance des différents précodeurs sur chaque sous-canal (voir fig. 2.13 dans la suite de l’analyse des résultats). Enfin, nous pouvons constater l’impact du codage canal sur les données utiles. En l’absence de CCE, les données sont inexploitables pour les faibles RSB. L’ajout d’un code correcteur RS(37,32) permet de limiter cet inconvénient. On remarque en particulier les bonnes performances sur la qualité des images décodées à très faibles RSB pour le précodeur WF alors que celui-ci est le moins performant en termes de TEB global. Nous noterons également que le précodeur E-dmin est beaucoup plus faiblement impacté par l’ajout de 57 CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES JPWL Système MIMO 4×4, b = 4, MAQ-4 Pas de CCE sur les données utiles Système MIMO 4×4, b = 4, MAQ-4 Pas de CCE sur les données utiles 40 1 35 0.9 0.8 30 Score SSIM PSNR en dB 0.7 25 20 15 5 0 0 5 10 15 RSB en dB 20 25 0.5 0.4 0.3 MMSE MBER WF E-dmin 10 0.6 MMSE MBER WF E-dmin 0.2 0.1 0 30 0 Codes RS(37,32) sur les données utiles 5 10 15 RSB en dB 20 25 30 Codes RS(37,32) sur les données utiles 40 1 35 0.9 0.8 30 Score SSIM PSNR en dB 0.7 25 20 15 MMSE MBER WF E-dmin 10 5 0 0 5 10 15 RSB en dB 20 25 0.6 0.5 0.4 0.3 MMSE MBER WF E-dmin 0.2 0.1 30 0 0 5 10 15 RSB en dB 20 25 Figure 2.12. Evolution du PSNR et du score SSIM avec différentes configurations de codage canal sur un canal statistique pour l’image « Monarch » redondance. Il faut toutefois rappeler que la robustesse fournie par la redondance des codes RS se fait au détriment de la qualité d’image à fort RSB. Par exemple, en l’absence de CCE, le précodeur E-dmin peut atteindre un PSNR d’environ 40dB pour l’image Caps, alors qu’avec la redondance introduite par le code RS(37,32), on perd environ 1dB sur la qualité maximale atteignable. Afin de justifier les performances contradictoires en termes de TEB global et de qualité visuelle des précodeurs, nous étudions sur la figure 2.13, l’évolution du TEB par souscanal en fonction des différentes stratégies de précodage. L’étude de l’évolution du TEB sur chaque sous-canal justifie en effet les résultats contradictoires entre TEB global et qualité visuelle. Nous rappelons que les images JPWL sont codées en couches de qualité hiérarchisées. Les images étant hiérarchisées, pour décoder une couche d’indice n, il faut décoder au préalable toutes les couches d’indice inférieur à n. Les précodeurs qui présentent les meilleures performances en termes de qualité visuelle sont ceux qui respectent le mieux la hiérarchie de la source. Par exemple, à faible RSB, le précodeur WF favorise les voies 1 et 2 ce qui lui permet de décoder les premières couches de qualité et d’obtenir la meilleure qualité 58 30 CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES JPWL Système MIMO 4×4, b = 4, MAQ-4, sous-canal 1 0 10 MMSE MBER WF E-dmin -1 -1 -2 10 -3 10 -4 -4 0 5 10 15 RSB en dB 20 25 10 30 Système MIMO 4×4, b = 4, MAQ-4, sous-canal 3 0 0 5 10 15 RSB en dB 20 25 30 Système MIMO 4×4, b = 4, MAQ-4, sous-canal 4 0 10 10 MMSE MBER WF E-dmin -1 -1 10 TEB 10 TEB -2 10 -3 10 -2 10 -2 10 MMSE MBER WF E-dmin -3 -3 10 10 -4 -4 10 MMSE MBER WF E-dmin 10 TEB TEB 10 10 Système MIMO 4×4, b = 4, MAQ-4, sous-canal 2 0 10 10 0 5 10 15 RSB en dB 20 25 30 0 5 10 15 RSB en dB 20 25 30 Figure 2.13. Evolution du TEB par sous-canal pour les différentes stratégies de précodage d’image. Toutefois, à fort RSB, le précodeur WF n’alloue pas assez de puissance à la 4ème voie ce qui peut l’empêcher d’atteindre le PSNR ou le score SSIM maximal. A l’inverse le précodeur E-dmin néglige les premiers sous-canaux en faveur des sous-canaux défavorisés. Cette stratégie lui permet d’obtenir les meilleures performances en termes de TEB global mais fournit des performances relativement mauvaises en termes de qualité d’image. Toutefois à fort RSB, il surpasse plus rapidement les autres précodeurs en termes de qualité car il fournit un TEB suffisamment faible sur l’ensemble des voies. Nous remarquons néanmoins que les précodeurs optimisent chacun un critère particulier qui ne prend pas en compte les spécificités du contenu transmis. Ainsi, aucun des critères utilisés n’est en mesure d’assurer la QoS pour toutes les valeurs de RSB. 2.4.2.2 Résultats sur canal réaliste Dans le cadre de ces simulations, les images sont transmises pour chaque position de la trajectoire du récepteur (décomposée en 2300 points de passage) en tenant compte de la mobilité (fig. 2.9). On dispose donc d’une image reçue pour chaque point de la trajectoire, soit 2300 images. Afin de rendre les courbes plus lisibles, les résultats ont été moyennés à l’aide d’une fenêtre glissante comprenant 20 valeurs. Cette valeur, déterminée 59 CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES JPWL Système MIMO 4×4, b = 4, MAQ-4 Pas de CCE sur les données utiles Zone 1 Zone 2 Zone 3 Système MIMO 4×4, b = 4, MAQ-4 Pas de CCE sur les données utiles Zone 4 Zone 1 1 40 35 Zone 2 Zone 3 Zone 4 0.8 Score SSIM PSNR en dB 30 25 20 15 WF MMSE MBER E-dmin 10 5 0 0 0.6 0.4 WF MMSE MBER E-dmin 0.2 0 500 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) 0 Codes RS(37,32) sur les données utiles Zone 1 40 Zone 2 Zone 3 500 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) Codes RS(37,32) sur les données utiles Zone 4 Zone 1 1 Zone 2 Zone 3 Zone 4 35 0.8 Score SSIM PSNR en dB 30 25 20 15 WF MMSE MBER E-dmin 10 5 0 0 500 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) 0.6 0.4 WF MMSE MBER E-dmin 0.2 0 0 500 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) Figure 2.14. Evolution du PSNR et du score SSIM avec différentes configurations de codage canal sur un canal réaliste pour l’image « Caps » expérimentalement, permet de lisser les résultats tout en conservant le comportement général des courbes les unes par rapport aux autres. Lorsqu’une image s’avère non décodable, son PSNR et son score SSIM sont considérés comme étant nul. Les figures 2.14 et 2.15 montrent les résultats de simulation en termes de PSNR et score SSIM pour les images « Caps » et « Monarch » sur le canal réaliste. On remarquera que globalement les résultats en termes de PSNR et de score SSIM montrent les mêmes dynamiques et la même hiérarchie dans les performances des différents précodeurs. Les remarques qui suivent s’appliquent donc aux deux métriques. Les tableaux 2.2 à 2.5 complètent les résultats en fournissant les performances moyennes des différentes stratégies de précodage en termes de PSNR moyen en fonction des conditions de transmission. On trouve également l’écart-type du PSNR sur la zone considérée. L’écart-type apporte ainsi une information sur la notion de stabilité du résultat en réception. 60 CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES JPWL Système MIMO 4×4, b = 4, MAQ-4 Pas de CCE sur les données utiles Système MIMO 4×4, b = 4, MAQ-4 Pas de CCE sur les données utiles Zone 1 40 Zone 2 Zone 3 Zone 4 Zone 1 1 Zone 2 Zone 3 Zone 4 35 0.8 25 Score SSIM PSNR en dB 30 20 15 WF MMSE MBER E-dmin 10 5 0 0 0.6 0.4 WF MMSE MBER E-dmin 0.2 0 500 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) 0 Codes RS(37,32) sur les données utiles Zone 1 40 Zone 2 Zone 3 500 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) Codes RS(37,32) sur les données utiles Zone 4 Zone 1 Zone 2 Zone 3 Zone 4 1 35 0.8 25 Score SSIM PSNR en dB 30 20 15 WF MMSE MBER E-dmin 10 5 0 0 500 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) 0.6 0.4 WF MMSE MBER E-dmin 0.2 0 0 500 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) Figure 2.15. Evolution du PSNR et du score SSIM avec différentes configurations de codage canal sur un canal réaliste pour l’image « Monarch » Résultats en l’absence de codage canal Pour de mauvaises conditions de transmission (zone 1), les précodeurs montrent de mauvaises performances car les conditions de transmission sont très difficiles (faible RSB sur le canal, pas de CCE). Seul le précodeur WF arrive à fournir un PSNR moyen autour de 15dB avec un écart-type par rapport au PSNR moyen très important (10,21dB pour « Caps » et 8,41dB pour « Monarch »). Cela signifie qu’il peut arriver que ce précodeur décode la couche de base car il est celui qui met le plus de puissance sur le premier sous-canal (cf. fig. 2.13). Toutefois, ce résultat est très instable et les performances de QoS sont globalement mauvaises. Lorsque les conditions deviennent moyennes (zones 2 et 4), le précodeur WF permet le décodage de une à deux couches de qualité. Il présente un PSNR moyen (34,41dB pour « Caps » et 31,23dB pour « Monarch ») avec un écart-type du PSNR beaucoup plus faibles (1,54dB pour « Caps » et 1,77dB pour « Monarch ») correspondant à une variation entre le décodage d’une ou de deux couches de qualité (cf. tab. 2.1). 61 CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES JPWL Précodeurs WF MMSE MBER E-dmin MAUVAISES CONDITIONS Zone 1 PSNR Ecart-type moyen (dB) 16,38 7,31 6,50 3,90 10,21 1,93 2,60 3,77 CONDITIONS MOYENNES Zones 2 et 4 PSNR Ecart-type moyen (dB) 34,41 26,23 8,41 12,47 1,54 8,83 3,23 9,64 BONNES CONDITIONS Zone 3 PSNR Ecart-type moyen (dB) 37,86 37,87 31,59 39,73 0,67 0,71 8,29 0,37 Tableau 2.2. Performances moyennes pour l’image « Caps » sans codage canal Précodeurs WF MMSE MBER E-dmin MAUVAISES CONDITIONS Zone 1 PSNR Ecart-type moyen (dB) 25,65 11,05 6,68 3,73 10,44 8,23 2,63 3,78 CONDITIONS MOYENNES Zones 2 et 4 PSNR Ecart-type moyen (dB) 35,11 34,09 23,85 27,93 0,72 2,35 9,79 12,73 BONNES CONDITIONS Zone 3 PSNR Ecart-type moyen (dB) 37,29 37,31 36,54 38,93 0,70 0,95 4,58 0,00 Tableau 2.3. Performances moyennes pour l’image « Caps » avec code RS(37,32) Précodeurs WF MMSE MBER E-dmin MAUVAISES CONDITIONS Zone 1 PSNR Ecart-type moyen (dB) 14,54 6,66 5,91 3,42 8,41 1,92 2,30 3,40 CONDITIONS MOYENNES Zones 2 et 4 PSNR Ecart-type moyen (dB) 31,23 22,70 7,67 11,11 1,77 7,75 2,76 7,94 BONNES CONDITIONS Zone 3 PSNR Ecart-type moyen (dB) 35,37 35,28 28,38 37,52 0,75 1,13 7,60 1,22 Tableau 2.4. Performances moyennes pour l’image « Monarch » sans codage canal Précodeurs WF MMSE MBER E-dmin MAUVAISES CONDITIONS Zone 1 PSNR Ecart-type moyen (dB) 22,26 9,34 6,06 3,47 9,25 6,47 2,46 3,40 CONDITIONS MOYENNES Zones 2 et 4 PSNR Ecart-type moyen (dB) 32,16 30,93 20,49 25,36 0,91 2,12 8,55 11,87 BONNES CONDITIONS Zone 3 PSNR Ecart-type moyen (dB) 34,70 34,72 33,99 36,70 0,32 0,76 4,28 0,00 Tableau 2.5. Performances moyennes pour l’image « Monarch » avec code RS(37,32) 62 CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES JPWL Le précodeur MMSE, qui ne permettait pas de décoder la couche de base lorsque les conditions étaient mauvaises, améliore sensiblement ses performances dans des conditions de transmission de qualité moyennes. Ainsi, ses performances oscillent entre le décodage de la couche de base avec plus ou moins d’erreurs et l’impossibilité de décoder la couche de base. Cette incertitude dans le décodage se traduit par un écart-type du PSNR très important (8,83dB pour « Caps » et 7,75dB pour « Monarch »). Les précodeurs MBER et E-dmin n’arrivent toujours pas à décoder la couche de base. Cette incapacité à fournir un résultat exploitable s’explique par le fait que pour satisfaire leur critère respectif, ces précodeurs favorisent les sous-canaux d’indice important au détriment du sous-canal transportant la couche de base. Les précodeurs WF et MMSE s’adaptent ainsi mieux à la transmission des images JPWL car ils respectent mieux la notion de hiérarchisation. Enfin dans de bonnes conditions de transmission (zone 3), les précodeurs WF et MMSE fournissent des résultats très similaires correspondant au décodage des trois premières couches de qualité sans erreur avec une très bonne stabilité dans les résultats (se traduisant par un faible écart-type). La puissance fournie sur le quatrième sous-canal n’est toutefois pas suffisante afin de décoder correctement la dernière couche de qualité. Le précodeur MBER fournit des résultats très contrastés qui se traduisent par un écart-type important. En effet, il présente des résultats correspondant au décodage de une à trois couches de qualité avec de temps à autre une image impossible à décoder. Ces performances très contrastées s’expliquent par le fait qu’ils n’attribuent que peu de puissance à la couche de base et à la première couche d’amélioration (sous-canaux 1 et 2). De ce fait, les premières couches deviennent très sensibles aux évanouissements sur le canal de transmission présentant ainsi une QoS médiocre. Contrairement aux performances affichées dans des conditions de transmission mauvaises ou moyennes, le précodeur E-dmin fournit d’excellents résultats lorsque le canal est bon. Le comportement singulier du précodeur E-dmin qui, on le rappelle, est le seul précodeur non-diagonal, provient de son fonctionnement très particulier. E-dmin est une généralisation du précodeur Max-dmin qui fonctionne pour des systèmes MIMO (2×2). Pour s’adapter à un système MIMO (4×4), E-dmin considère deux sous-systèmes MIMO (2×2). Or, il a été démontré dans [18], que la combinaison optimale permettant de minimiser dmin consiste à associer les sous-canaux 1 et b, 2 et b-1, …, b/2 et b/2 + 1. Dans le cadre d’un système MIMO (4×4), le premier sous-système MIMO est donc composé des sous-canaux 1 et 4 alors que le second est composé des sous-canaux 2 et 3. Par conséquent, lorsque les conditions sont mauvaises ou moyennes, le quatrième sous-canal pénalise le premier, ce qui entraîne des difficultés pour décoder la couche de base et donc une mauvaise QoS. Toutefois, lorsque les conditions sur le canal sont bonnes, le précodeur E-dmin arrive à fournir un TEB nul sur toutes les voies, conduisant à obtenir la qualité maximale en réception. Cette supériorité lorsque les conditions sont bonnes provient de la non-diagonalité offrant un degré de liberté supplémentaire. En effet, E-dmin agit sur la puissance mais également sur la géométrie des constellations, ce qui lui permet de surpasser les précodeurs diagonaux. Impact du codage canal Les précodeurs utilisés dans le cadre de ces simulations ne modifient pas leur politique d’allocation de la puissance en fonction du codage canal utilisé. Cependant, le TEB présenté en réception avant décodage canal par certain précodeur peut devenir suffisamment faible après décodage canal pour permettre d’exploiter une ou plusieurs couches de qualité. On notera en particulier que l’ajout du codage canal permet au précodeur WF d’augmenter significativement le nombre d’image décodée avec la couche de base dans de mauvaises conditions de transmission (zone 1). Il en résulte une augmentation importante du 63 CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES JPWL PSNR moyen. Lorsque les conditions deviennent moyennes (zones 2 et 4), le précodeur WF permet de décoder majoritairement les images avec deux couches de qualité et cela de manière plus stable qu’en l’absence de codage canal. En effet, l’écart-type est quasiment divisé par deux sur ces zones. De la même manière, le précodeur MMSE qui fournissait de mauvais résultats pour des conditions moyennes, arrive à décoder des images composées d’une ou deux couches de qualité avec un écart-type acceptable. Lorsque les conditions deviennent bonnes (zone 3), les précodeurs WF et MMSE présentent des TEB sur la quatrième voie, qui restent trop élevés par rapport à la capacité de correction du code RS(37,32). Ainsi, la QoS n’évolue pas vis-à-vis des performances sans CCE. A ce titre, nous rappelons que la redondance introduite par le code RS(37,32) se fait au détriment de la qualité visuelle. Ainsi, le PSNR moyen pour la configuration sans CCE, lorsque le canal est bon, est plus important que le PSNR moyen avec CCE. Concernant le précodeur MBER, les TEB affichés par ce précodeur sur les couches de qualité les plus importantes sont trop élevés pour obtenir une bonne QoS globale grâce au code RS(37,32). Ainsi, les images sont indécodables lorsque le canal est mauvais. Avec des conditions moyennes, ce précodeur oscillent entre une couche décodée correctement et des images inexploitables. On notera toutefois un gain lorsque les conditions deviennent bonnes. Ce gain s’explique par le nombre de cas de décodage impossible qui diminuent avec l’ajout du code RS(37,32). Ainsi, les performances moyennes sur cette zone sont moins pénalisées. Le précodeur E-dmin quant à lui, améliore sensiblement ses performances dans des conditions moyennes. Le codage canal n’a cependant aucun impact lorsque le canal est bon, car E-dmin atteignait déjà la qualité maximale sans codage canal sur cette zone. Finalement, l’étude des performances des précodeurs sur canal réaliste confirme le fait qu’il est indispensable de prendre en considération la hiérarchie de la source dans l’évaluation de la QoS. L’exemple du précodeur MBER est révélateur de cette caractéristique. En effet, ce précodeur minimise le TEB sur l’ensemble des sous-canaux par une répartition particulière de la puissance. Toutefois, le TEB atteint sur chaque sous-canal ne permet pas de décoder de manière satisfaisante les données transmises. A l’inverse, le précodeur WF qui présente le TEB global le plus mauvais, fournit la meilleure QoS pour la transmission d’image car il est le précodeur qui fournit le plus de puissance au premier et au second sous-canal, qui transportent les couches d’importance majeure. 2.5 Synthèse et conclusion Ce second chapitre a permis de présenter le principe du précodage linéaire dans les systèmes MIMO. Nous avons ainsi détaillé les étapes conduisant à la décomposition du canal MIMO en canal virtuel équivalent. Cette décomposition permet de voir le canal MIMO comme un ensemble de sous-canaux SISO hiérarchisés, parallèles et indépendants. Nous avons également présenté le principe du précodage diagonal et non-diagonal à travers les précodeurs WF, MMSE, MBER et E-dmin. Ces algorithmes sont basés sur la connaissance du canal à l’émission et peuvent être vus comme des pré-égaliseurs qui allouent la puissance d’émission en optimisant un critère lié à la transmission. Dans un second temps, nous avons présenté une stratégie de transmission qui s’appuie sur la décomposition du canal et sur les précodeurs MIMO. On fournit ainsi une stratégie de transmission d’image qui s’appuie sur la correspondance entre la hiérarchie du canal et la hiérarchie entre les couches de qualité issues du codeur JPWL. Les tests de simulation sur canal statistique et sur canal réaliste ont permis de mettre en avant la robustesse de cette stratégie de transmission en l’absence de CCE sur les données utiles. 64 CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES JPWL A l’issue de ces tests, nous avons pu mettre en évidence quelques conclusions. Nous avons montré en particulier que l’évaluation du TEB global n’est pas un critère pertinent pour juger de la QoS d’une transmission d’image hiérarchisée. Pour être pertinent, le TEB doit être pris en compte sur chaque sous-canal. Concernant les différentes stratégies de précodage évaluées, nous avons montré qu’aucune n’est en mesure d’assurer la QoS pour tous les états du canal. En effet, les critères optimisés ne tiennent pas compte des caractéristiques d’un contenu hiérarchisé. La puissance est alors allouée sans contrainte sur le décodage de la source ce qui conduit à des résultats sous-optimaux en termes de PSNR ou de score SSIM. L’ajout de CCE peut alors apparaître comme une solution pour combler le manque d’efficacité du schéma pour de faibles RSB. En fait, l’ajout de redondance peut être pénalisant en termes de qualité visuelle à fort RSB. Il y a donc un compromis à atteindre entre le codage de la source et le codage canal, optimal au sens de la qualité de l’image, et prenant évidemment en compte les conditions sur le canal de transmission. Compte tenu de la hiérarchisation de la source, les solutions UEP ainsi que les modulations adaptatives semblent particulièrement intéressantes dans le cadre de la stratégie de transmission proposée. Néanmoins, il existe un manque d’interaction entre les précodeurs et le codage canal ou la modulation, car l’optimisation des différents critères ne fait pas intervenir l’impact potentiel de ces paramètres. C’est pourquoi nous proposons dans le troisième chapitre une stratégie de précodage diagonale prenant conjointement en compte la hiérarchisation du contenu à transmettre, le codage canal et l’ordre de la modulation afin de maximiser la qualité visuelle des images reçues. 65 CHAPITRE 3 PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE Sommaire 3.1 Introduction 3.2 Algorithme de précodage basé sur le contenu 68 3.2.1 Principe 68 3.2.2 Modèle d’allocation successive de la puissance 69 3.2.3 Prise en compte du codage canal dans l’allocation de la puissance 71 3.2.4 Algorithme d’approximation du TEB cible 73 3.2.5 Algorithme d’allocation successive de la puissance 75 3.3 Résultats de simulations 3.3.1 Résultats sur canal statistique 3.3.2 Résultats sur canal réaliste 3.3.2.1 3.3.2.2 3.3.2.3 3.3.2.4 3.3.3 Performances en l’absence de CCE Impact du codage canal Impact de la modulation Analyse visuelle Impact des erreurs d’estimation sur la CSI 3.3.3.1 3.3.3.2 3.4 68 Modèle d’erreur d’estimation Robustesse des précodeurs aux erreurs d’estimation sur la CSI Synthèse et conclusion 77 77 79 80 83 83 85 88 88 89 91 67 CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE 3.1 Introduction Les précodeurs de la littérature déterminent leurs coefficients de précodage de sorte à optimiser un critère lié à la transmission (TEB, capacité, erreur quadratique moyenne, …). Le chapitre précédent a permis d’évaluer les performances de plusieurs précodeurs au sein d’une stratégie de transmission pour la transmission d’une image JPWL hiérarchisée. On a ainsi pu constater que, malgré la bonne robustesse présentée par certains précodeurs, ces derniers présentaient des limites. En premier lieu, les précodeurs respectent mal la hiérarchie du contenu à transmettre. Les données multimédias sont dans la grande majorité des cas des données fortement hiérarchisées. Dans nos simulations, les couches de qualité JPWL sont tributaires du décodage des couches de qualité qui les précèdent. Or, les précodeurs réalisent une optimisation sur l’ensemble des sous-canaux, sans faire le lien entre les performances sur chaque sous-canal et la qualité de l’image à la reconstruction. Il en résulte des précodeurs qui affichent de bonnes performances globales suivant leur critère respectif, mais qui trouvent des limites dans une application de transmission d’image. Deuxièmement, les précodeurs ne sont pas mis totalement en relation, conjointement avec les autres éléments de la chaîne de communication. Par exemple, ils ne modifient pas leur politique d’allocation de la puissance suite à un changement d’ordre de la modulation. Il serait toutefois intéressant de pouvoir compenser une perte de robustesse suite à une augmentation de l’efficacité spectrale de la modulation, et inversement. De la même façon, la capacité de correction d’un CCE pourrait être prise en compte pour adapter les coefficients de précodage. En effet, l’utilisation d’un CCE avec un très fort pouvoir de correction devrait permettre une économie de la puissance à allouer. Ces constatations permettent de dessiner les contraintes d’un précodeur efficace pour la transmission d’un contenu multimédia hiérarchisé. Ainsi, nous présentons dans ce chapitre une technique de précodage basée sur le respect de la hiérarchie du contenu à transmettre. Cette technique présente également un important aspect de dépendance entre plusieurs paramètres de la chaîne de communication, qui ont un impact sur le compromis débitdistorsion. En fin de chapitre, nous évaluons les performances de cette technique de précodage par rapport aux techniques de précodage de l’état de l’art dans un contexte de transmissions d’images. 3.2 Algorithme de précodage basé sur le contenu 3.2.1 Principe L’algorithme proposé est conçu pour transmettre une image décomposée en couches de qualité hiérarchisées sur des sous-canaux SISO, eux-mêmes hiérarchisés. Afin d’assurer le caractère conjoint de cet algorithme, il est nécessaire d’allouer la puissance en fonction des autres paramètres de la chaîne de communication numérique, à savoir : l’ordre des modulations utilisées, la capacité de correction des codes correcteurs d’erreur et le RSB sur les différents sous-canaux SISO. La figure 3.1 présente le synoptique de la stratégie UPA proposée. Le canal MIMO est décomposé en b sous-canaux SISO conduisant à considérer b couches de qualité JPWL. Le codage canal est réalisé par les codes Reed-Solomon fournis par le standard JPWL. Ces codes dépendent des paramètres N et K, le paramètre K étant commun à tous les codes RS du standard. L’algorithme peut prendre en compte un ordre de modulation M ajusté sur chaque sous-canal SISO. La puissance allouée par l’algorithme est également tributaire du RSB sur les sous-canaux. Cette information est fournie par la CSI. 68 CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE Codage JPWL en b couches de qualité hiérarchisées Codage canal JPWL RS(Ni,K) CSI : σ i2 , i = 1...b Mi i = 1…b Ni i = 1…b b MAQ-M1 MAQ-M2 γ 1 = f12σ 12 Stratégie UPA par précodage (Fd) γ 2 = f 22σ 22 Décodage ML (Gd) γ b = f b2σ b2 MAQ-Mb MAQ-M1 -1 MAQ-M2 -1 Décodage JPWL robuste MAQ-Mb -1 Canal MIMO-OFDM Matrice de canal virtuel Hv avec b sous-canaux SISO Codage JPWL Figure 3.1. Synoptique de la stratégie UPA Comme nous l’avons vu précédemment, il peut être judicieux de sacrifier des voies pour la transmission d’images hiérarchisées, car le décodage d’une couche de qualité dépend obligatoirement du décodage correct des couches précédentes. Il n’est donc pas nécessaire d’allouer de la puissance sur une voie si les voies précédentes n’assurent pas un décodage correct des données transmises. Afin de s’assurer du caractère décodable d’une couche de qualité, on introduit une notion de QoS par le biais d’un TEB cible sur chacune des voies. L’idée est alors de fournir la puissance nécessaire sur une voie pour permettre d’atteindre le TEB cible, en fonction des autres paramètres jouant un rôle dans le compromis débit/distorsion. 3.2.2 Modèle d’allocation successive de la puissance Le modèle d’allocation proposé est un modèle sous contrainte de TEB. Cet algorithme met en relation le RSB de chaque sous-canal SISO, l’ordre de la modulation MAQ et la capacité de correction des CCE utilisés, afin de calculer les coefficients de la matrice de précodage Fd = diag ( f i ) bi=1 (voir §2.2.2). Nous faisons l’hypothèse que le bruit sur chaque sous-canal SISO est gaussien, comme c’est communément le cas [125]. Par conséquent, la probabilité d’erreur binaire Peb ,i sur le sous-canal i pour une modulation MAQ-Mi peut être déterminée en utilisant l’expression suivante [17] : Peb,i = ( ) 2 M i −1 3γ i erfc M − 2 ( 1 ) M i log 2 M i i (3.1) où γ i est le RSB sur le sous-canal SISO i pondéré par le coefficient de précodage f i 2 tel que : γ i = f i 2σ i2 (3.2) L’objectif du modèle est de déterminer le coefficient de précodage f i 2 sur le sous-canal i permettant d’atteindre un TEB cible noté TEB C ,i . Ce paramètre correspond au TEB cible en réception avant décodage canal. Par conséquent, la probabilité d’erreur binaire Peb ,i peut être 69 CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE identifiée au TEB cible TEB C ,i dans des conditions asymptotiques. Ainsi, nous pouvons écrire : TEBC ,i = ( ) 3 f 2σ 2 i i erfc M i log 2 M i 2( M i − 1) 2 M i −1 (3.3) A partir de l’équation 3.3, nous pouvons calculer le coefficient de précodage f i 2 permettant d’atteindre le paramètre TEB c ,i et qui dépend alors de la valeur propre σ i2 (correspondant au RSB du sous-canal SISO d’indice i) et de l’ordre de la modulation MAQ-Mi. Le coefficient de précodage s’écrit : 2( M i − 1) −1 TEBC ,i M i log 2 M i erf 1 − fi = 3σ i2 2 M i −1 ( 2 ) 2 (3.4) Les variations du coefficient de précodage f i 2 en fonction du RSB σ i2 , de l’ordre de modulation Mi et du TEB cible sont présentées sur la figure 3.2. 1 MAQ-4 MAQ-16 MAQ-64 0.9 Coefficient de précodage fi² 0.8 TEBC,i = 10-6 TEBC,i = 10-9 TEBC,i = 10-12 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 10 15 20 25 RSB en dB 30 35 40 Figure 3.2. Evolution des coefficients de précodage en fonction du RSB, de l’ordre de modulation et du TEB cible Sur la figure 3.2 nous pouvons constater la quantité de puissance nécessaire permettant d’atteindre un TEB cible particulier. Pour un ordre de modulation donné, une diminution de la valeur du TEB cible conduit l’algorithme à allouer plus de puissance (augmentation de la valeur du coefficient de précodage). De même, si l’on souhaite augmenter l’efficacité spectrale de la modulation pour atteindre un TEB cible équivalent, l’algorithme doit fournir plus de puissance. 70 CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE 3.2.3 Prise en compte du codage canal dans l’allocation de la puissance Rappelons que le paramètre TEBC,i correspond au TEB cible en réception avant décodage canal. Ainsi, il est possible de prendre en compte la capacité de correction des codes correcteurs utilisés, dans le réglage du paramètre TEBC,i. Nous considérons les codes ReedSolomon intégrés dans la norme JPWL. Notons qu’un code RS est défini par un nombre de blocs de symboles en entrée et un nombre de blocs de symboles en sortie notés respectivement K et N. On définit si le nombre de bits par symbole sur le sous-canal i tel que si = log 2 ( M i ) avec i = 1…b. Ainsi, la probabilité d’erreur binaire après décodage canal PRS ,i pour un code RS(Ni,Ki) donné sur des symboles de si bits est définie par [17] : PRS ,i = 1 si Ni j N −j PS ,i (1 − PS ,i ) i j Ni j j =ti +1 N i ∑ (3.5) N où i est un coefficient binomial, PS ,i = si Peb ,i est la probabilité d’erreur symbole pour des j symboles de si bits, et ti est la capacité de correction d’un code RS(Ni,Ki) donné telle que : N − Ki ti = i 2 (3.6) où x représente la partie entière de x. Les performances des codes RS implémentés dans le standard JPWL sont représentées sur la figure 3.3 (cf. équation 3.5). 1,E-02 RS(37,32) RS(43,32) RS(51,32) RS(64,32) RS(85,32) RS(128,32) RS(38,32) RS(45,32) RS(53,32) RS(75,32) RS(96,32) No RS RS(40,32) RS(48,32) RS(56,32) RS(80,32) RS(112,32) 1,E-03 1,E-04 BER Probabilité d’erreur après décodage canal PRS,i 1,E-01 1,E-05 1,E-06 1,E-07 1,E-08 1,E-09 1,00E-04 1,00E-03 BER input 1,00E-02 1,00E-01 Probabilité d’erreur avant décodage canal Peb,i Figure 3.3. Performances des codes RS implémentés dans la norme JPWL 71 CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE A partir de la figure 3.3, nous pouvons comparer le gain relatif sur la probabilité d’erreur après décodage canal des différents codes RS. On distingue alors deux groupes de codes : les codes RS qui présentent un impact important en termes de correction, au regard de la redondance introduite (code RS(37,32) au code RS(48,32)) et les codes RS qui ont un impact plus modéré compte tenu de la grande quantité de redondance introduite (code RS(51,32) au code RS(128,32)). Cette constatation est en accord avec les conclusions de [64] qui spécifie que le gain sur le TEB au-delà du code RS(64,32) n’est pas justifié par rapport à la redondance introduite. Cette constatation confirme l’intérêt de prendre en compte plusieurs paramètres complémentaires liés à la robustesse. En effet, l’étude sur l’état de l’art a montré que les gains liés à l’allocation de la puissance pouvaient être plus importants que les gains liés au codage canal. Il est donc judicieux de mettre en relation ces paramètres afin de limiter l’utilisation des codes correcteurs introduisant trop de redondance au profit de l’allocation de la puissance. D’après les équations 3.1 et 3.3, Peb,i dépend du coefficient de précodage f i 2 et s’identifie au TEBC,i. Ainsi : PS ,i = si Peb,i = si TEBC ,i (3.7) On définit le paramètre Bi comme étant le TEB cible après décodage canal sur le sous-canal i de telle sorte que PRS ,i ≤ Bi . D’après l’équation 3.5, nous pouvons alors écrire : 1 si Ni j j =ti +1 N i ∑ Ni j N −j (siTEBC ,i ) (1 − siTEBC ,i ) i ≤ Bi j (3.8) Le paramètre Bi correspond donc au TEB acceptable sur la couche de qualité i avant le décodage source. Cette valeur doit être déterminée suivant le contenu considéré. Par exemple, dans le cas d’un codage à longueur variable où une seule erreur est susceptible de désynchroniser l’intégralité du flux, on choisira une valeur de Bi suffisamment faible pour correspondre à une transmission quasiment sans erreur. Si les désynchronisations ne sont pas un problème (codage à longueur fixe), on pourra régler le paramètre Bi en fonction du type de donnée transitant sur le canal en exploitant par exemple la hiérarchie existante entre des sousbandes d’ondelette ou, entre les coefficients DC ou AC d’un codeur basé DCT. Ainsi, cet algorithme reste flexible et peut s’adapter aux caractéristiques du contenu transitant sur le canal. Le paramètre TEBC,i est approximé grâce à un algorithme itératif qui sera présenté dans le paragraphe 3.2.4. La figure 3.4 montre les variations du paramètre TEBC,i en fonction de la capacité de correction ti des codes RS définis dans le standard JPWL. Ce standard spécifie les valeurs des paramètres si et Ki qui sont respectivement égales à 8 et 32. Ainsi, le codage canal s’effectue pour des blocs de 32 symboles de 8 bits. Par conséquent, le choix d’un code RS particulier dépend uniquement du paramètre Ni correspondant au nombre de symboles en sortie du code RS. La figure 3.4 illustre l’impact de la capacité de correction et du paramètre Bi sur la valeur du TEB cible. La diminution de la valeur de Bi implique une diminution du TEB cible et, par conséquent, une augmentation de la valeur du coefficient de précodage (voir fig. 3.2). Ainsi, la solution proposée fournit une grande flexibilité dans le processus d’allocation de la puissance, qui s’adapte conjointement avec l’état du canal ainsi qu’avec l’importance des couches de qualité JPWL transmises à travers les b sous-canaux SISO. De plus, l’allocation de la puissance est finement ajustée afin de prendre en compte la capacité de correction et l’ordre de modulation. 72 CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE -1 10 -2 Paramètre TEBC,i 10 -3 10 -4 10 -6 Bi = 10 -9 Bi = 10 -12 Bi = 10 -5 10 -6 10 0 10 20 30 40 50 Capacité de correction ti d’un code RS(Ni,Ki) Figure 3.4. Variation du paramètre TEBC,i pour différentes valeurs de Bi et pour différentes capacités de correction ti 3.2.4 Algorithme d’approximation du TEB cible L’expression du TEB cible en fonction de PRS étant difficile à écrire analytiquement, on utilise un algorithme itératif (fig. 3.5) afin d’approximer le TEB cible suivant l’équation 3.8. Cet algorithme converge rapidement vers une valeur de TEBC,i pour laquelle PRS,i est quasiment égal à Bi. Le tableau 3.1 montre les valeurs fournies par l’algorithme d’approximation pour un TEB cible de 10-9 avec les différents codes RS de la norme JPWL. Code RS(Ni,K) RS(37,32) RS(38,32) RS(40,32) RS(43,32) RS(45,32) RS(48,32) RS(51,32) RS(53,32) RS(56,32) RS(64,32) RS(75,32) RS(80,32) RS(85,32) RS(96,32) RS(112,32) RS(128,32) Capacité de correction ti TEB cible TEBC,i 2 3 4 5 6 8 9 10 12 16 21 24 26 32 40 48 2,92.10-5 1,27.10-4 3,17.10-4 5,88.10-4 9,49.10-4 1,9.10-3 2,39.10-3 2,95.10-3 4,2.10-3 6,7.10-3 9,59.10-3 1,14.10-2 1,24.10-2 1,55.10-2 1,9.10-2 2,18.10-2 Tableau 3.1. Approximation du TEB cible pour les codes de la norme JPWL avec Bi = 10-9 73 CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE Initialisation max = 5.10-1 min = 10-15 TEB = 10-4 Bi fixé par l’utilisateur Calcul PRS j Ni 1 j N −j (s i TEB ) (1 − s i TEB ) i = ∑ s i j = ti +1 N i j Ni PRS ,i Test log (Bi ) − log (PRS ,i ) < 10 −3 oui non non Test PRS , i > B i oui TEBC,i = TEB FIN min = TEB max = PRS Actualisation TEB TEB = 10 log(max) + 0,5[log(min) − log(max) ] Figure 3.5. Algorithme d’approximation du TEB cible Le tableau 3.1 permet de quantifier l’impact du codage canal sur le paramètre de TEB cible. Bien sûr, plus la capacité de correction augmente et plus le TEB cible peut être important, ce qui conduit à diminuer la quantité de puissance à allouer au sous-canal considéré. Le paramètre TEBC,i constitue donc un paramètre lié à la qualité de service mais il permet également d’intégrer l’impact du codage canal dans le processus de précodage. De plus, ce paramètre est spécifique à chaque sous-canal, ce qui permet de facilement mettre en œuvre des stratégies UEP, en considérant un code RS différent pour chaque couche de qualité. On remarquera également que ce modèle s’applique avec des codes Reed-Solomon. Rappelons que nous avons choisi ce type de codes car ils sont intégrés dans le standard JPWL. Toutefois, ce modèle peut très bien prendre en compte d’autres types de codes correcteurs d’erreurs. Il suffit pour cela d’établir le lien entre le TEB d’entrée et le TEB de sortie pour un code donné. 74 CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE 3.2.5 Algorithme d’allocation successive de la puissance La transmission d’un contenu hiérarchisé implique de s’assurer que les données prioritaires soient correctement décodées afin de permettre le décodage des données de moindre importance. La plupart des précodeurs minimisent leur critère via une méthode d’optimisation sous contrainte résolue par les multiplicateurs de Lagrange. Cette solution permet de trouver l’ensemble des coefficients de la matrice Fd qui optimisent la fonction objectif. Toutefois, la définition du problème d’optimisation des précodeurs est souvent contradictoire avec la notion de hiérarchie, car l’optimisation est considérée sur l’ensemble des sous-canaux, sans contrainte sur les flux binaires transitant sur chaque sous-canal. Ceci explique les résultats paradoxaux obtenus entre l’optimisation d’un critère pertinent (l’erreur quadratique ou le TEB par exemple) et de mauvais résultats en termes de qualité visuelle. Ainsi, l’intégration du respect de la hiérarchie de la source passe par la prise en compte de caractéristiques (contrainte sur le décodage, distorsion, etc.) propre à chacun des flux binaires transitant sur les sous-canaux. Une solution de ce type est proposée dans [19] où l’optimisation Lagrangienne consiste à minimiser la distorsion d’une vidéo H.264. Bien que la solution proposée améliore la QoS pour une modulation et un codage canal donné, le problème devient complexe à exprimer, dès lors que l’on que l’on souhaite faire varier ces paramètres en lien avec les variations du canal. Parallèlement à cette approche, nous proposons ici d’exploiter la notion de hiérarchie au sein de la source dans l’attribution des valeurs de coefficients de précodage, en attribuant successivement la puissance sur les souscanaux, et non globalement par le biais d’une optimisation. Cette notion d’allocation successive permet au sous-canal i, transportant la couche de qualité i, de se voir attribuer la puissance nécessaire au respect des contraintes de QoS et de puissance telles que : QoS : TEBi ≤ Bi Puissance : ∑f b i =1 2 i = P0 (3.9) Ensuite, nous traitons la couche de qualité et le sous-canal suivant en réitérant ce processus jusqu’à ce que l’on ait traité tous les sous-canaux ou que la totalité de la puissance disponible ait été allouée. Le traitement d’un sous-canal d’indice i se décompose ainsi en quatre étapes : 1. On détermine la valeur du TEB cible TEBC,i en fonction du paramètre de codage canal Ni et du paramètre de qualité de service Bi. Dans la suite, nous considérerons la même contrainte de QoS sur tous les sous-canaux soit Bi = B pour i = 1…b ; 2. On détermine la puissance nécessaire Pi pour atteindre TEBC,i en fonction de l’ordre de modulation Mi et du RSB du sous-canal σ i2 ; 3. On vérifie que la puissance nécessaire Pi sur le sous-canal i est inférieure à la puissance résiduelle Pr, qui correspond à la puissance restante non-utilisée (initialisée par rapport à la puissance totale disponible P0) ; 4. En fonction du test, on alloue la puissance nécessaire ou la puissance résiduelle au coefficient de précodage f i 2 . De par le fonctionnement de cet algorithme, une voie peut être sacrifiée si les contraintes ne peuvent pas être respectées. On notera toutefois que la puissance résiduelle est systématiquement attribuée sur la dernière voie utilisée pour permettre l’utilisation de la totalité de la puissance disponible. La figure 3.6 schématise le processus d’allocation de la puissance suivant l’algorithme proposé. 75 CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE Initialisation b = min(nT,nR) Pr = P0 CSI : σ i2 , i = 1…b Modulations : Mi, i = 1…b Codes RS : Ni, i = 1…b Réglage de B f i 2 = 0 , i = 1…b i=0 Approximation de TEBC,i tel que : 1 si Ni j j = t i +1 N i ∑ Ni j N −j (s i TEB C ,i ) (1 − s i TEB C ,i ) i ≤ B j Calcul de la puissance nécessaire Pi i = i +1 2( M i − 1) erf Pi = 3σ i2 TEB C ,i M i log 2 M i −1 1− 2 M i −1 ( Test sur la puissance résiduelle Pi ≤ Pr 2 ) non oui f i 2 = Pi Pr = Pr − Pi f i 2 = Pr non i=b oui f i 2 = f i 2 + Pr Fin Figure 3.6. Algorithme d’allocation successive de la puissance 76 CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE Dans le cadre de nos simulations, nous réglons le paramètre B pour atteindre une transmission quasiment sans erreur. Les transmissions d’images ne requièrent pas de contraintes de temps comme pour les applications vidéo qui doivent opérer en temps réel. Ainsi, la notion de TEB quasiment sans erreur ne peut pas être définie, dans notre cas, sur la base d’une erreur par heure à un débit donné comme c’est le cas des standards ADSL69 ou DVB-T par exemple. Dans notre cas, le formalisme mathématique est décrit pour des flux binaires asymptotiquement longs. En pratique, les flux binaires JPWL considérés dans nos simulations sont de l’ordre de 105 bits. Par conséquent, nous fixons le paramètre B de telle sorte que : B << 10 −5 (3.10) Ainsi, nous avons considéré dans la suite qu’une transmission est quasiment sans erreur pour une valeur de B = 10-9. 3.3 Résultats de simulations Dans cette section, nous évaluons les performances de la stratégie proposée en comparaison des précodeurs de la littérature dans un contexte de transmission d’images. Nous évaluons les performances de la stratégie proposée, appelée CBP pour « Content-Based Precoder », à travers les canaux statistique et réaliste présentés dans le paragraphe 2.4.1.4. Le paramétrage des couches physique et application correspond aux descriptions des paragraphes 2.4.1.1 et 2.4.1.2 respectivement. Nous transmettons les images « Caps » et « Monarch ». 3.3.1 Résultats sur canal statistique La figure 3.7 présente les résultats de simulations en termes de TEB global en fonction du RSB sur le canal MIMO (4×4), dont les coefficients sont générés statistiquement suivant une distribution de Rayleigh. Les courbes de TEB affichées sont déterminées à partir du TEB moyen sur l’ensemble des sous-canaux. Le TEB global constitue le critère de comparaison classique des performances des précodeurs dans la littérature. Si l’on se réfère au TEB global, nous constatons que les performances affichées par le précodeur CBP sont relativement médiocres au regard des performances affichées par les autres précodeurs. Le précodeur CBP obtient ainsi les performances les plus mauvaises jusqu’à un RSB de 15dB. A partir de cette valeur, il présente un TEB global inférieur au précodeur WF mais il faut atteindre un RSB d’environ 22dB pour que les performances en termes de TEB global convergent avec celles présentées par les précodeurs MMSE et MBER. Comme nous l’avons vu dans le chapitre précédent, le précodeur non-diagonal E-dmin surpasse largement les précodeurs diagonaux en termes de TEB global et pour cette configuration de transmission. Les mauvaises performances apparentes du précodeur CBP s’expliquent aisément par la stratégie d’allocation de la puissance de ce précodeur en comparaison des autres stratégies de précodage. Nous avons montré précédemment que les précodeurs de la littérature fournissent généralement la solution d’un problème d’optimisation d’un critère pour allouer la puissance sur l’ensemble des sous-canaux sans contrainte sur le décodage. Néanmoins, nous avons également mis en évidence l’importance de respecter la hiérarchie de l’image afin d’assurer la QoS. En effet, les données hiérarchisées imposent souvent que le décodage d’une couche d’indice i nécessite le décodage correct des couches d’indice inférieur à i. De ce fait, il est indispensable, dans un 69 Asymetric Digital Subscriber Line 77 CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE contexte de transmission d’images, d’évaluer les performances des précodeurs sur chaque sous-canal, comme le montre la figure 3.8. Système MIMO 4×4, b = 4, MAQ-4 0 10 MMSE MBER WF E-dmin CBP -1 TEB global 10 -2 10 -3 10 -4 10 0 5 10 15 RSB en dB 20 25 30 Figure 3.7. Courbe de TEB global des différentes stratégies de précodage Cette figure présente les résultats en termes de TEB sur chacun des sous-canaux en fonction du RSB sur le canal MIMO. Cette figure permet en outre, de comprendre la stratégie du précodeur CBP afin de garantir la QoS d’une transmission d’image. Lorsque le canal présente un RSB très faible traduisant des conditions de transmission difficiles, le précodeur CBP alloue toute la puissance sur le premier sous-canal et sacrifie les autres voies. De cette manière, il assure la transmission du premier flux de données. Les trois autres voies étant sacrifiées, le TEB qu’elles affichent atteint 5.10-2 ce qui explique les mauvaises performances en termes de TEB global. Par la suite, à mesure que les conditions sur le canal deviennent meilleures (augmentation du RSB), le précodeur utilise les sous-canaux d’indice supérieur afin d’acheminer correctement le deuxième flux de données (à partir de 5dB), puis le troisième (à partir de 10dB) et finalement le dernier (à partir de 15dB). Nous remarquons que dès lors que la seconde voie est utilisée, le TEB présenté par CBP sur cette voie devient rapidement meilleur que le TEB présenté par les autres précodeurs. Sur la troisième voie, nous constatons que le TEB surpasse celui des autres précodeurs diagonaux alors que sur la quatrième voie, le TEB se met à converger vers le TEB présenté par les autres précodeurs diagonaux. Ainsi, nous constatons que le précodeur CBP prend en compte la notion de hiérarchie de la source par une utilisation cohérente des sous-canaux au regard de l’évolution des conditions de transmission. Ce schéma permet d’acheminer correctement les couches de qualité composant l’image, là où les autres précodeurs répartissent la puissance sur l’ensemble des sous-canaux, pouvant ainsi mettre en péril le décodage des données hiérarchisées. Finalement, si l’on évalue les performances des précodeurs à partir du TEB global sur une séquence pseudo-aléatoire, nous constatons que les autres précodeurs fournissent de meilleures performances, mais ils n’offrent toutefois aucune garantie sur la QoS pour la transmission d’images hiérarchisées. 78 CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE Système MIMO 4×4, b = 4, MAQ-4, sous-canal 1 Système MIMO 4×4, b = 4, MAQ-4, sous-canal 2 0 0 10 10 MMSE MBER WF E-dmin CBP -1 -1 10 TEB TEB 10 -2 10 10 -4 -4 0 0 5 10 15 RSB en dB 20 25 10 30 Système MIMO 4×4, b = 4, MAQ-4, sous-canal 3 5 10 15 RSB en dB 20 25 30 Système MIMO 4×4, b = 4, MAQ-4, sous-canal 4 10 MMSE MBER WF E-dmin CBP -1 10 -1 10 -2 TEB TEB 0 0 10 10 -3 -2 10 MMSE MBER WF E-dmin CBP -3 10 10 -4 10 -2 10 -3 -3 10 10 MMSE MBER WF E-dmin CBP -4 0 5 10 15 RSB en dB 20 25 30 10 0 5 10 15 RSB en dB 20 25 30 Figure 3.8. Evolution du TEB par sous-canal pour les différentes stratégies de précodage 3.3.2 Résultats sur canal réaliste On rappelle que le canal réaliste est défini par les réponses impulsionnelles obtenues via un simulateur à tracé de rayons 3D, dans l’environnement suburbain présenté dans le paragraphe 2.4.1.4. Dans le cadre de ces simulations, les images sont transmises pour chaque position de la trajectoire du récepteur en tenant compte de la mobilité. On dispose donc d’une image reçue pour chaque point de la trajectoire. On rappelle que les résultats ont été moyennés à l’aide d’une fenêtre glissante comprenant 20 valeurs, afin de rendre les courbes plus lisibles (voir §2.4.2.2). Les figures 3.9 et 3.10 montrent les résultats de simulation en termes de PSNR et score SSIM pour les images « Caps » et « Monarch » sur le canal réaliste. On remarquera que globalement les résultats en termes de PSNR et de score SSIM montrent les mêmes dynamiques et la même hiérarchie dans les performances des différents précodeurs. Les remarques qui suivent s’appliquent donc aux deux métriques. Les tableaux 3.2 à 3.5 complètent les résultats en fournissant les performances moyennes des différentes stratégies de précodage en termes de PSNR moyen en fonction des conditions de transmission. On trouve également l’écart-type par rapport au PSNR moyen sur la zone considérée. L’écart-type fournit ainsi une information sur la notion de stabilité du résultat en réception. 79 CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE Système MIMO 4×4, b = 4, MAQ-4 Pas de CCE sur les données utiles Zone 1 Zone 2 Zone 3 Système MIMO 4×4, b = 4, MAQ-4 Pas de CCE sur les données utiles Zone 4 Zone 1 1 40 Zone 2 Zone 3 Zone 4 35 0.8 Score SSIM PSNR en dB 30 25 20 CBP WF MMSE MBER E-dmin 15 10 5 0 0 0.6 0.4 CBP WF MMSE MBER E-dmin 0.2 0 500 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) 0 Codes RS(37,32) sur les données utiles Zone 1 40 Zone 2 Zone 3 500 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) Codes RS(37,32) sur les données utiles Zone 4 Zone 1 1 Zone 2 Zone 3 Zone 4 35 0.8 25 20 CBP WF MMSE MBER E-dmin 15 10 5 0 0 500 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) Score SSIM PSNR en dB 30 0.6 0.4 CBP WF MMSE MBER E-dmin 0.2 0 0 500 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) Figure 3.9. Evolution du PSNR et du score SSIM avec différentes configurations de codage canal sur un canal réaliste pour l’image « Caps » 3.3.2.1 Performances en l’absence de CCE Nous remarquons que, globalement, notre stratégie est meilleure que les autres pour garantir de manière stable la qualité (PSNR et score SSIM) des images en réception. En l’absence de codes RS, nous constatons en effet un écart particulièrement significatif lorsque les conditions sont mauvaises (zone 1). Le précodeur CBP est ainsi le seul à fournir de manière stable un résultat exploitable en réception. On notera que l’écart-type du PSNR est relativement élevé sur cette zone (7,37dB pour « Caps » et 6,35dB pour « Monarch »). Ces valeurs s’expliquent par les conditions extrêmement défavorables en début de parcours (jusqu’aux environs de la position 150) qui s’améliorent par la suite. Les bonnes performances affichées par le précodeur CBP s’expliquent par le fait que toute la puissance est allouée au premier sous-canal qui transporte la couche de base. Les autres précodeurs quant à eux, utilisent aux moins deux sous-canaux sur cette zone. Ainsi la puissance n’est pas assez importante sur le premier sous-canal pour permettre un décodage correct de la couche 80 CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE Système MIMO 4×4, b = 4, MAQ-4 Pas de CCE sur les données utiles Zone 1 40 Zone 2 Zone 3 Système MIMO 4×4, b = 4, MAQ-4 Pas de CCE sur les données utiles Zone 4 Zone 1 1 Zone 2 Zone 3 Zone 4 35 0.8 25 Score SSIM PSNR en dB 30 20 15 CBP WF MMSE MBER E-dmin 10 5 0 0 0.6 0.4 CBP WF MMSE MBER E-dmin 0.2 0 500 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) 0 Codes RS(37,32) sur les données utiles Zone 1 40 Zone 2 Zone 3 500 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) Codes RS(37,32) sur les données utiles Zone 4 Zone 1 1 Zone 2 Zone 3 Zone 4 35 0.8 25 20 15 CBP WF MMSE MBER E-dmin 10 5 0 0 500 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) Score SSIM PSNR en dB 30 0.6 0.4 CBP WF MMSE MBER E-dmin 0.2 0 0 500 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) Figure 3.10. Evolution du PSNR et du score SSIM avec différentes configurations de codage canal sur un canal réaliste pour l’image « Monarch » de base. Lorsque les conditions sont moyennes (zone 2 et 4), la différence avec le précodeur WF est relativement moins importante. Elle reste toutefois significative vis-à-vis des autres stratégies de précodage. Le précodeur CBP exploite l’amélioration des conditions sur le canal en allouant de la puissance au second sous-canal. On peut ainsi obtenir des images en réception composée de deux couches de qualité alors que les autres précodeurs cherchent à transmettre trois à quatre couches de qualité, ce qui conduit à des configurations présentant beaucoup de distorsions. Dans de bonnes conditions, les précodeurs diagonaux transmettent trois couches de qualité sans erreur. Bien que le précodeur CBP permette d’obtenir un meilleur TEB sur la quatrième voie que les autres précodeurs diagonaux, il n’est toutefois pas suffisamment bas pour obtenir un décodage correct de la dernière couche de qualité. De ce fait, nous obtenons une qualité d’image reçue équivalente. La non-diagonalité du précodeur E-dmin lui permet de transmettre quatre couches de qualité sans erreur comme cela a été expliqué dans le chapitre 2. Globalement, la stratégie de précodage proposée permet d’assurer la QoS, sans apport de redondance sur les données utiles et quels que soient les états du canal de transmission. En comparaison, les autres précodeurs n’y arrivent que lorsque les conditions sont bonnes, ou moyennes dans le cas du précodeur WF. 81 CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE Précodeurs WF MMSE MBER E-dmin CBP MAUVAISES CONDITIONS Zone 1 PSNR Ecart-type moyen (dB) 16,38 7,31 6,50 3,90 29,40 10,21 1,93 2,60 3,77 7,37 CONDITIONS MOYENNES Zones 2 et 4 PSNR Ecart-type moyen (dB) 34,41 26,23 8,41 12,47 35,20 1,54 8,83 3,23 9,64 1,34 BONNES CONDITIONS Zone 3 PSNR Ecart-type moyen (dB) 37,86 37,87 31,59 39,73 38,12 0,67 0,71 8,29 0,37 0,31 Tableau 3.2. Performances moyennes pour l’image « Caps » sans codage canal Précodeurs WF MMSE MBER E-dmin CBP MAUVAISES CONDITIONS Zone 1 PSNR Ecart-type moyen (dB) 25,65 11,05 6,68 3,73 32,45 10,44 8,23 2,63 3,78 1,88 CONDITIONS MOYENNES Zones 2 et 4 PSNR Ecart-type moyen (dB) 35,11 34,09 23,85 27,93 35,89 0,72 2,35 9,79 12,73 1,08 BONNES CONDITIONS Zone 3 PSNR Ecart-type moyen (dB) 37,29 37,31 36,54 38,93 37,39 0,70 0,95 4,58 0,00 0,71 Tableau 3.3. Performances moyennes pour l’image « Caps » avec code RS(37,32) Précodeurs WF MMSE MBER E-dmin CBP MAUVAISES CONDITIONS Zone 1 PSNR Ecart-type moyen (dB) 14,54 6,66 5,91 3,42 26,17 8,41 1,92 2,30 3,40 6,35 CONDITIONS MOYENNES Zones 2 et 4 PSNR Ecart-type moyen (dB) 31,23 22,70 7,67 11,11 32,29 1,77 7,75 2,76 7,94 1,66 BONNES CONDITIONS Zone 3 PSNR Ecart-type moyen (dB) 35,37 35,28 28,38 37,52 35,60 0,75 1,13 7,60 1,22 0,45 Tableau 3.4. Performances moyennes pour l’image « Monarch » sans codage canal Précodeurs WF MMSE MBER E-dmin CBP MAUVAISES CONDITIONS Zone 1 PSNR Ecart-type moyen (dB) 22,26 9,34 6,06 3,47 28,78 9,25 6,47 2,46 3,40 2,51 CONDITIONS MOYENNES Zones 2 et 4 PSNR Ecart-type moyen (dB) 32,16 30,93 20,49 25,36 33,07 0,91 2,12 8,55 11,87 1,21 BONNES CONDITIONS Zone 3 PSNR Ecart-type moyen (dB) 34,70 34,72 33,99 36,70 34,80 0,32 0,76 4,28 0,00 0,52 Tableau 3.5. Performances moyennes pour l’image « Monarch » avec code RS(37,32) 82 CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE 3.3.2.2 Impact du codage canal Nous constatons que le codage canal permet, en outre, de contrer les mauvaises conditions en début de parcours (position 0 à 150). Etant donné que l’algorithme CBP prend en compte la capacité de correction du CCE afin de diminuer en conséquence la puissance allouée sur les sous-canaux, il peut alors transmettre plus de couches de qualité par rapport à la configuration sans code RS. Ainsi le précodeur CBP transmet une à deux couches sur la zone 1 ; puis de deux à trois couches sur les zones 2 et 4. On constate ainsi un gain en termes de PSNR moyen de 2,6 à 3dB dans de mauvaises conditions, et environ 0,7dB dans des conditions moyennes. Dans de bonnes conditions, le TEB sur le quatrième sous-canal n’est pas suffisamment bas au regard de la capacité de correction du code RS(37,32) afin de décoder cette dernière couche. Ainsi, nous remarquons une fois de plus que la qualité en termes de PSNR moyen diminue avec l’ajout du code RS (-0,73dB pour « Caps » et -0,80dB pour « Monarch ») du fait de la redondance sur les couches de qualité. En se basant sur ces résultats, nous pouvons envisager une solution pour améliorer la qualité des images reçues. En effet, la capacité de correction du code RS pourrait être augmentée sur le dernier sous-canal lorsque le canal est bon, afin de permettre le décodage de la quatrième couche de qualité. De la même manière, la redondance sur les trois premières couches de qualité pourraient être supprimée au profit du codage source (augmentation de la qualité visuelle). Plus globalement, cette solution consisterait à adapter le codage source et le codage canal en fonction des conditions de transmission. 3.3.2.3 Impact de la modulation Les figures 3.11 et 3.12 montrent les performances des précodeurs sur le canal réaliste avec une modulation MAQ-16. Nous utilisons la configuration de codage intégrant les codes RS(37,32) pour limiter la perte de robustesse due à la hausse de l’efficacité spectrale de la modulation. Les tableaux 3.6 et 3.7 fournissent les performances moyennes en termes de PSNR en fonction des conditions de transmission, ainsi que les écarts-type respectifs pour les images « Caps » et « Monarch ». Nous notons que le précodeur CBP est celui qui s’adapte le mieux à un changement d’ordre de modulation. Il fournit ainsi une bonne QoS pour des conditions de transmission moyennes ou bonnes, avec les meilleurs PSNR moyen ainsi que les écarts-type les plus faibles (si ce n’est le cas particulier d’E-dmin). Dans la zone 1, les performances sont contrastées avec l’impossibilité de décoder l’image sur les positions de réception 0 à 150. Sur la fin de la zone 1 (position 151 à 436), les conditions s’améliorent légèrement ce qui permet au précodeur CBP de transmettre fréquemment la couche de base. Il en résulte un écart-type important (12,36dB pour « Caps » et 10,53dB pour « Monarch ») sur l’ensemble de cette zone. Nous précisons que sur l’ensemble de la zone 1, le précodeur CBP n’utilise qu’un seul sous-canal en lui attribuant toute la puissance. Il n’est donc pas possible, compte tenu de la configuration de codage, d’obtenir de meilleurs résultats sur cette zone. Concernant les autres précodeurs diagonaux (WF, MMSE et MBER), nous remarquons qu’ils assurent une bonne QoS uniquement lorsque le canal est bon (zone 3). Le précodeur WF arrive à transmettre quelques images correctes dans des conditions moyennes mais il n’assure pas une stabilité dans les résultats (écarts-type de 10,44dB pour « Caps » et 8,82dB pour « Monarch »). 83 CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE Système MIMO 4×4, b = 4, MAQ-16 Code RS(37,32) sur les données utiles Zone 1 40 Zone 2 Zone 3 Zone 4 CBP WF MMSE MBER Zone 1 1 E-dmin Zone 2 Zone 3 Zone 4 0.9 35 0.8 30 Score SSIM PSNR en dB 0.7 25 20 15 0.6 0.5 0.4 0.3 10 0.2 5 0 0.1 0 500 1000 1500 2000 0 Position sur la trajectoire du récepteur (×λ) 0 500 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) Figure 3.11. Evolution du PSNR et du score SSIM de l’image « Caps » sur le canal réaliste avec une modulation MAQ-16 Précodeurs WF MMSE MBER E-dmin CBP MAUVAISES CONDITIONS Zone 1 PSNR Ecart-type moyen (dB) 3,74 0,02 1,80 0,00 18,39 3,94 0,36 3,22 0,00 12,36 CONDITIONS MOYENNES Zones 2 et 4 PSNR Ecart-type moyen (dB) 22,78 6,42 9,12 0,00 32,24 10,44 3,79 5,68 0,00 0,93 BONNES CONDITIONS Zone 3 PSNR Ecart-type moyen (dB) 36,39 35,26 36,20 7,80 37,06 1,14 3,97 4,06 7,05 0,70 Tableau 3.6. Performances moyennes pour l’image « Caps » avec code RS(37,32) et modulation MAQ-16 Enfin, le précodeur E-dmin fournit une mauvaise QoS en termes de qualité d’images, sur l’ensemble du canal de transmission. Son cas est particulier, car bien qu’il fournisse les meilleures performances en termes de TEB global sur l’ensemble des sous-canaux, le TEB sur le premier sous-canal est trop élevé pour garantir le décodage correct de la couche de base. Cela s’explique du fait que le précodeur E-dmin combine le premier sous-canal avec le dernier, pour former un des deux sous-systèmes MIMO (voir §2.2.3). Le dernier sous-canal pénalise alors le premier, ce qui est incompatible avec la transmission d’un flux hiérarchisé. Globalement, les précodeurs de la littérature ont du mal à prendre en compte une augmentation de l’efficacité spectrale pour garantir une bonne qualité d’image en réception. On rappelle que seul les précodeurs MBER et E-dmin prennent en compte l’ordre de modulation dans le processus d’allocation de la puissance. Toutefois, comme leur problème d’optimisation est orienté vers la minimisation de leur critère respectif (TEB et dmin) sans prise en compte de la notion de hiérarchie de la source, ces précodeurs sont incapables d’assurer une bonne qualité d’image reçue pour l’ensemble des conditions de transmission. Au contraire, le précodeur CBP modifie de façon adéquate l’allocation de la puissance pour contrer la perte de robustesse engendrée par l’augmentation de l’efficacité spectrale en tenant compte de l’impact du codage canal, ce qui se traduit par une bonne QoS en réception. 84 CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE Système MIMO 4×4, b = 4, MAQ-16 Code RS(37,32) sur les données utiles Zone 1 Zone 2 Zone 3 Zone 4 CBP WF Zone 1 1 35 MMSE MBER Zone 2 E-dmin Zone 3 Zone 4 0.9 30 0.8 0.7 Score SSIM PSNR en dB 25 20 15 0.6 0.5 0.4 0.3 10 0.2 5 0.1 0 0 500 1000 1500 2000 0 Position sur la trajectoire du récepteur (×λ) 0 500 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) Figure 3.12. Evolution du PSNR et du score SSIM de l’image « Monarch » sur le canal réaliste avec une modulation MAQ-16 Précodeurs WF MMSE MBER E-dmin CBP MAUVAISES CONDITIONS Zone 1 PSNR Ecart-type moyen (dB) 3,42 0,01 1,58 0,00 16,18 3,49 0,33 2,87 0,00 10,53 CONDITIONS MOYENNES Zones 2 et 4 PSNR Ecart-type moyen (dB) 20,25 5,68 8,30 0,00 28,58 8,82 3,20 4,76 0,00 1,19 BONNES CONDITIONS Zone 3 PSNR Ecart-type moyen (dB) 33,65 32,28 33,52 6,92 34,43 1,34 4,10 3,91 6,00 0,81 Tableau 3.7. Performances moyennes pour l’image « Monarch » avec code RS(37,32) et modulation MAQ-16 3.3.2.4 Analyse visuelle Les figures 3.13 et 3.14 présentent des exemples d’images reçues avec les différentes stratégies de précodage. La figure 3.13, nous montre ainsi un exemple représentatif de l’image « Caps » reçue dans de mauvaises conditions de transmission (zone 1, position 251) et sans code RS. Dans de telles conditions de transmission, nous constatons que les précodeurs MMSE, MBER et E-dmin ne sont pas en mesure de fournir une image exploitable (fig. 3.13 (c), (d) et (e)). Concrètement, le décodeur robuste JPWL commence le décodage des données mais tombe très rapidement sur une erreur qui avorte le processus de décodage (voir §2.3.3). Ce fonctionnement aboutit à une image quasiment vide si ce n’est le coin supérieur gauche issu du décodage des premières données. Pour cet exemple, seuls les précodeurs WF et CBP fournissent un résultat acceptable. L’image reçue par l’intermédiaire du précodeur WF (fig. 3.13 (b)) est uniquement constituée de la couche de base malgré une allocation de puissance sur les trois premiers sous-canaux. La répartition de la puissance sur ces sous-canaux crée un manque de puissance sur le premier sous-canal qui aboutit au décodage de la couche de base avec de nombreuses distorsions. Les deux couches de qualité transitant sur les sous-canaux deux et trois ne sont pas décodées car elles portent beaucoup trop d’erreurs. 85 CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE CBP WF (a) Caps251 : PSNR = 32,45dB ; SSIM = 0,874 (b) Caps251 : PSNR = 24,01dB ; SSIM = 0,573 MMSE MBER (c) Caps251 : PSNR = 7,53dB ; SSIM = 0,004 (d) Caps251 : PSNR = 7,53dB ; SSIM = 0,004 E-dmin (e) Caps251 : PSNR = 7,53dB ; SSIM = 0,004 Figure 3.13. Comparaison visuelle entre les résultats fournis par les précodeurs pour l’image « Caps » dans de mauvaises conditions de transmission (zone 1, indice 251) et sans CCE sur les données utiles 86 CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE CBP WF (a) Monarch2259: PSNR = 34,71dB ; SSIM = 0,941 (b) Monarch2259 : PSNR = 32,10dB ; SSIM = 0,901 MMSE MBER (c) Monarch2259 : PSNR = 30,38dB ; SSIM = 0,861 (d) Monarch2259 : PSNR = 19,28dB ; SSIM = 0,657 E-dmin (e) Monarch2259 : PSNR = 14,36dB ; SSIM = 0,407 Figure 3.14. Comparaison visuelle entre les résultats fournis par les précodeurs pour l’image « Monarch » dans des conditions de transmission moyennes (zone 4, indice 2259) avec un code RS(37,32) sur les données utiles 87 CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE Le précodeur CBP quant à lui ne transmet que la couche de base en allouant toute la puissance sur le premier sous-canal. On peut ainsi décoder cette couche sans erreur et obtenir ainsi le meilleur résultat visuel parmi les précodeurs utilisés. On rappelle que ce résultat est obtenu en l’absence de protection sur les données utiles. La figure 3.14, nous montre un exemple représentatif de l’image « Monarch » reçue dans des conditions de transmission moyennes (zone 4, position 2259) avec un code RS(37,32) sur les données utiles. Nous constatons tout d’abord que, contrairement au cas précédent, tous les précodeurs fournissent un résultat exploitable dans le sens où l’on est en mesure de comprendre l’image. Dans ce type de conditions de transmission, les précodeurs MBER et E-dmin fournissent des résultats très variables car ils allouent la puissance sur la totalité des sous-canaux. Or dans la grande majorité des cas, la puissance allouée pour la transmission d’une couche n’est pas suffisante pour obtenir un décodage correct. Même si le décodage RS atténue l’effet des erreurs de transmission, elles restent néanmoins trop nombreuses et se traduisent pas des distorsions visuellement très marquées (fig. 3.14 (d) et (e)). Les précodeurs CBP, WF et MMSE fournissent les meilleurs résultats (fig. 3.14 (a), (b) et (c)). Dans ces conditions de transmission, les précodeurs WF et MMSE allouent également de la puissance sur tous les sous-canaux. Malgré tout, ils transmettent généralement les deux premières couches sans erreur mais la troisième couche souffre d’un manque de puissance pour atteindre un TEB suffisamment faible. Ainsi le décodage de cette couche est susceptible de provoquer des distorsions relativement légères (fig. 3.14 (b) et (c)). Le précodeur CBP quant à lui, n’alloue la puissance que sur les trois premiers sous-canaux ce qui lui permet de décoder fréquemment les trois premières couches sans erreur. Il surpasse ainsi globalement les résultats fournis par les autres précodeurs. 3.3.3 Impact des erreurs d’estimation sur la CSI La connaissance de la CSI est une problématique à part entière dans le domaine des télécommunications. Effectivement, il n’est pas réaliste de considérer une connaissance parfaite de la matrice de canal instantanée caractérisant le canal MIMO-OFDM. C’est pour cela que nous considérons dans nos travaux une connaissance parfaite à instant donné et pour un nombre limité de symboles OFDM. Nous ne faisons donc pas l’hypothèse d’une connaissance parfaite de la CSI, mais d’une mise à jour « parfaite » à intervalles réguliers. Toutefois dans cette section, nous souhaitons étudier l’impact des erreurs d’estimation de la CSI au cours de la mise à jour. Nous introduisons ci-dessous le modèle d’erreur utilisé, puis nous évaluerons l’impact de ce modèle d’erreur sur les résultats de simulations sur le canal de transmission réaliste. 3.3.3.1 Modèle d’erreur d’estimation Nous utilisons un modèle d’erreur gaussien sur l’estimation de la CSI. Ce modèle est fréquemment rencontré dans la littérature [117] [126] [127] afin de caractériser les erreurs d’estimation sur la CSI. Il consiste à modifier les coefficients complexes de la matrice de canal par une perturbation gaussienne dont la variance dépend du RSB sur le canal. On rappelle que la matrice de canal virtuel Hv définie telle que Hv = GvHFv, contient les valeurs propres du canal MIMO telles que : Hv = diag (σ i )i =1 b 88 (3.11) CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE où σ i2 représente le RSB sur le sous-canal SISO d’indice i. On définit le RSB global σ sur le canal MIMO tel que : b ∑σ σ= i =1 2 i (3.12) Comme la puissance reçue dépend du précodage, on considère que le RSB correspond au rapport entre la puissance totale émise P0 sur la puissance totale du bruit défini par sa variance 2 σ bruit : σ= P0 (3.13) 2 nRσ bruit Ce qui conduit à : P0 2 = σ bruit (3.14) b nR ∑σ i =1 2 i 2 En connaissant la valeur de σ bruit correspondant à la variance du RSB global du canal MIMO, nous pouvons générer une matrice d’erreur d’estimation sur le canal Herr dont les 2 coefficients complexes sont indépendants de H, iid, centrés et de variance σ err avec 2 2 σ err = ασ bruit . Le paramètre α est généralement fixé à 0,25 [117]. De cette manière, plus le 2 est faible. RSB sur le canal MIMO est élevé et plus l’erreur d’estimation définie par σ err Nous pouvons ainsi déterminer la matrice de canal estimée Hest à partir de la matrice de canal réel H et de la matrice d’erreur d’estimation Herr : Hest = H + Herr (3.15) En utilisant Hest à la place de H, nous intégrons ainsi une erreur d’estimation sur la CSI dans nos simulations. 3.3.3.2 Robustesse des précodeurs aux erreurs d’estimation sur la CSI Dans cette section, nous évaluons l’impact des erreurs d’estimation de la CSI sur le PSNR et le score SSIM des images transmises. Pour cela, nous utilisons la configuration de codage la plus robuste parmi celles citées précédemment, incluant les codes RS(37,32) sur les données utiles. La figure 3.15 présente l’évolution du PSNR et du score SSIM pour l’image « Caps ». Nous ne représentons que les résultats de l’image « Caps » car les conclusions sont exactement les mêmes pour « Monarch ». Le tableau 3.8 présente une comparaison du PSNR moyen en fonction des conditions de transmission obtenues avec et sans modèle d’erreur. Nous pouvons ainsi évaluer la perte moyenne due à la présence d’erreurs d’estimation sur la matrice de canal. Dans le cadre de ces tests, nous considérons deux configurations du paramètre B (10-9 en gris et 10-12 en noir) pour le précodeur CBP. On rappelle que le paramètre B correspond au TEB cible après décodage canal. 89 CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE CBP, B = 10-9 CBP, B = 10-12 Système MIMO 4×4, b = 4, MAQ-4 Codes RS(37,32) sur les données utiles MMSE MBER WF E-dmin Sans modèle d’erreur sur l’estimation de la CSI Zone 1 40 Zone 2 Zone 3 Zone 4 Zone 1 1 Zone 2 Zone 3 Zone 4 0.9 35 0.8 30 Score SSIM PSNR en dB 0.7 25 20 15 0.6 0.5 0.4 0.3 10 0.2 5 0 0.1 0 500 1000 1500 0 2000 0 500 Position sur la trajectoire du récepteur (×λ) 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) Avec modèle d’erreur sur l’estimation de la CSI Zone 1 Zone 2 Zone 3 Zone 4 Zone 1 40 Zone 2 Zone 3 Zone 4 1 35 0.8 25 Score SSIM PSNR en dB 30 20 15 0.6 0.4 10 0.2 5 0 0 500 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) 0 0 500 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) Figure 3.15. Impact des erreurs d’estimation sur la CSI en termes de PSNR et de score SSIM pour l’image « Caps » Conditions de transmission Mauvaises Zone 1 Moyennes Zones 2 et 4 Bonnes Zone 3 Modèle d’erreur Sans Avec Sans Avec Sans Avec WF MMSE MBER E-dmin CBP avec B = 10-9 CBP avec B = 10-12 25,65 11,05 6,68 3,73 32,45 31,97 8,50 3,24 0,10 0,98 19,55 26,15 35,11 34,09 23,85 27,93 35,89 35,48 33,21 19,45 6,92 19,65 28,87 34,25 37,29 37,31 36,54 38,93 37,39 37,40 37,08 37,00 29,67 38,93 31,71 36,88 Tableau 3.8. Impact de l’erreur d’estimation sur la CSI en termes de PSNR moyen (en dB) pour l’image « Caps » avec un code RS(37,32) 90 CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE Comme nous pouvons le voir sur la figure 3.15, tous les précodeurs sont pénalisés par une baisse du PSNR et du score SSIM. En ce qui concerne les précodeurs de la littérature, nous constatons qu’ils sont inopérants (PSNR moyen inférieur à 10dB) dans de mauvaises conditions de transmission (zone 1). Dans des conditions de transmission moyennes (zones 2 et 4), seul le précodeur WF assure la QoS (PSNR moyen de 33,21dB) avec une perte modérée sur le PSNR moyen de 1,9dB. Dans de bonnes conditions de transmission (zone 3), les précodeurs de la littérature sont faiblement impactés par les erreurs d’estimation sur la CSI (perte sur le PSNR moyen inférieure à 1dB), mis à part pour le précodeur MBER qui perd environ 7dB sur le PSNR moyen. Nous pouvons constater que le précodeur CBP dans sa configuration définie précédemment (B = 10-9), est le plus fortement impacté par les erreurs d’estimation sur la CSI. Cela s’explique par le fait que le TEB cible est déterminé pour des hypothèses de transmission idéales impliquant une estimation correcte de la CSI. Le fait d’évaluer la puissance nécessaire aux sous-canaux à partir d’une matrice de canal erronée, conduit à obtenir un TEB en réception supérieur au TEB cible. Par conséquent, le code RS(37,32) doit corriger un nombre d’erreurs trop important au regard de sa capacité de correction. Il en résulte un grand nombre de cas où les erreurs non-corrigées sont trop nombreuses sur la couche de base, ce qui multiplie le nombre de cas d’images non-décodées. Ainsi les erreurs d’estimation de la CSI conduisent aux pertes les plus importantes sur le PSNR moyen (12,9dB, 7,02dB et 5,68dB pour des conditions de transmission respectivement mauvaises, moyennes et bonnes) parmi les précodeurs comparés. Toutefois, nous constatons que nous pouvons très significativement limiter l’impact des erreurs d’estimation sur la CSI en renforçant la contrainte sur le TEB en réception. Dans notre exemple, nous avons fixé le paramètre B égal à 10-12, ce qui permet de fournir globalement, la meilleure QoS parmi les stratégies de précodage comparées. Ce paramètre est spécifique au précodeur CBP et n’a pas d’équivalent chez les autres précodeurs qui ne peuvent donc pas s’adapter à des hypothèses d’erreurs d’estimation sur la CSI. L’augmentation de la valeur du paramètre B a pour conséquence d’augmenter la puissance allouée sur un sous-canal (afin d’atteindre un TEB cible plus faible). Par conséquent, il peut arriver que l’on manque de puissance afin d’utiliser efficacement un sous-canal supplémentaire pour transmettre une couche d’amélioration. L’augmentation du TEB cible présente essentiellement un impact lorsque le canal est mauvais (différence d’environ 0,5dB) ou moyen (différence de 0,4dB). Néanmoins, cette stratégie permet de diminuer efficacement l’impact des erreurs d’estimation sur la CSI. 3.4 Synthèse et conclusion Ce troisième chapitre a permis de présenter une méthode originale d’allocation de la puissance dont l’objectif est de maximiser la qualité visuelle des images reçues. L’algorithme proposé permet de faire le lien entre la puissance, l’efficacité spectrale de la modulation, la capacité de correction des CCE et le RSB des sous-canaux SISO. Cette méthode met donc en relation plusieurs paramètres ayant un impact sur le compromis débit-distorsion, afin d’ajuster finement la quantité de puissance allouée pour la transmission des couches de qualité JPWL. L’allocation de la puissance sur les sous-canaux répond à une contrainte de TEB cible. Ce paramètre est défini en relation avec la sensibilité du contenu aux erreurs de transmission. Si le contenu est très sensible, on peut définir une contrainte correspondant à une transmission quasiment sans erreur. A l’inverse, si de par sa nature le contenu est robuste aux erreurs, nous pouvons adapter le TEB cible en conséquence. 91 CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE Les tests sur canal statistique ont permis de confirmer le paradoxe entre l’évaluation des performances globales (TEB global sur l’ensemble des sous-canaux) et la notion de hiérarchie. En effet, la hiérarchisation des données, qui présente de nombreux avantages (scalabilité, stratégie de protection inégale, etc.), implique également un décodage progressif des couches de qualité. Cette notion, qui est une contrainte forte, est contradictoire avec le problème d’optimisation posé par les précodeurs usuels, qui ne tient pas compte de la hiérarchisation des données au décodage. Ainsi, la stratégie de précodage proposée fournit de moins bons résultats en termes de TEB global (critère fréquent d’évaluation), mais nous avons également montré que ce critère n’a aucun lien avec la QoS dans un contexte de transmission d’image hiérarchisée. Les tests sur canal réaliste ont confirmé l’intérêt de notre algorithme pour maximiser la qualité des images reçues. En premier lieu, nous avons montré la faculté de ce précodeur à assurer la robustesse de la transmission sans codage canal. L’ajout d’un CCE permet d’augmenter la valeur du TEB cible en lien avec la capacité de correction. On peut alors « économiser » de la puissance sur un sous-canal pour la redistribuer à un autre sous-canal, et transmettre ainsi un plus grand nombre de couches de qualité. L’algorithme montre également une bonne prise en compte de la perte de robustesse liée à l’augmentation de l’efficacité spectrale de la modulation. Enfin, nous avons évalué l’impact des erreurs d’estimation sur la CSI. Notre précodeur montre effectivement une sensibilité importante face à ces erreurs d’estimation. Toutefois, nous avons montré que nous pouvions significativement limiter l’impact des erreurs d’estimation en renforçant la contrainte sur le TEB après décodage canal, qui constitue un paramètre spécifique à notre méthode de précodage. L’algorithme proposé permet donc d’assurer une bonne QoS pour une configuration de codage (source et canal) et de transmission (modulation) définie. Il serait néanmoins intéressant de faire varier les paramètres mis en jeu, afin de trouver la combinaison de paramètres optimale permettant de maximiser la qualité visuelle des images reçues, en fonction des conditions de transmission. Cette étude fera l’objet du quatrième chapitre. 92 CHAPITRE 4 STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL Sommaire 4.1 Introduction 94 4.2 Stratégie de transmission optimisée 94 4.3 Définition des contraintes 4.3.1 Contrainte de débit 4.3.2 Contrainte sur la QoS 4.3.3 Contrainte sur la puissance 95 95 96 96 4.4 Minimisation de la distorsion 96 4.5 Représentation arborescente pour la résolution du problème 4.5.1 Commentaires sur le choix adopté 4.5.2 Construction de l’arbre 4.5.3 Recherche du chemin minimisant la distorsion 98 99 99 102 4.6 Résultats de simulations sur canal réaliste 4.6.1 Contexte de simulation 102 102 4.6.1.1 4.6.1.2 4.6.2 4.6.3 4.6.4 4.6.5 4.7 Définition de la configuration de base 103 Définition des paramètres pour la stratégie d’adaptation de lien 104 Apports de la stratégie d’adaptation de lien Gestion des ressources Complexité de la solution Analyse visuelle Synthèse et conclusion 105 108 109 111 115 93 CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL 4.1 Introduction Le chapitre précédent a permis de présenter une technique de précodage optimisée pour la transmission d’un contenu hiérarchisé. Ainsi, pour une configuration de transmission donnée (modulation et codage canal), la stratégie proposée est en mesure d’améliorer la qualité des images en comparaison d’autres techniques de précodage de la littérature. Le précodage MIMO est généralement associé à l’optimisation conjointe de l’émetteur et du récepteur en considérant les hypothèses de fonctionnement suivantes [50] : • Le débit des données est fixé. Il ne varie pas en fonction des conditions de travail ; • La modulation utilisée n’évolue pas ; • Le nombre de voie de données émises en parallèle est constant ; • Le codage de l’information est considéré comme indépendant du précodeur. Il s’effectue donc en amont sans être pris en compte. Toutefois, la stratégie de précodage qui a été proposée permet de mettre en relation l’allocation de la puissance avec les paramètres de modulation et de codage canal. Ainsi, il est envisageable de mettre au point une stratégie d’adaptation de lien, basée sur le précodeur CBP, permettant d’intégrer des stratégies UEP, UPA, modulation adaptative et codage de source adaptatif. Dans un tel schéma, le réglage des différents paramètres doit être défini par rapport à l’état du canal avec comme objectif la maximisation de la qualité des images en réception. Dans ce chapitre, nous proposons la mise en place d’une méthode d’optimisation permettant de sélectionner, avant la transmission, le jeu de paramètre le plus adapté aux conditions sur le canal de transmission. Pour cela, nous présentons les contraintes considérées puis nous formulons le problème d’optimisation à résoudre. Nous proposons ensuite une méthode de résolution de ce problème avant de tester l’efficacité de cette solution face aux conditions variables du canal réaliste. 4.2 Stratégie de transmission optimisée La figure 4.1 (à comparer avec la figure 3.1) présente le schéma bloc de la stratégie de transmission avec adaptation de lien. Le canal MIMO est décomposé en sous-canaux SISO sur lesquels on fait transiter les couches de qualité JPWL en respectant la correspondance entre la hiérarchie des sous-canaux et la hiérarchie des couches de qualité. L’architecture de cette solution reprend celle de la stratégie présentée dans le chapitre 3. La différence tient dans l’ajout d’un bloc d’optimisation conjointe prenant en entrée la CSI. A partir de la CSI, l’optimisation est en mesure de déterminer les paramètres suivants : • le nombre de sous-canaux utilisés L parmi les b sous-canaux disponibles avec L ≤ b ; • le débit source de chaque couche de qualité RS,i avec i = 1…L ; • le code RS sur chaque couche de qualité défini par le paramètre Ni avec i = 1…L ; • l’ordre de modulation sur chaque sous-canal Mi avec i = 1…L. Le bloc d’optimisation a pour but de déterminer les paramètres du système avant la transmission puis de transmettre l’image avec le précodeur CBP, intégrant ainsi une stratégie UPA. La stratégie offre la possibilité de ne pas utiliser tous les sous-canaux. Pour chacun des L sous-canaux utilisés, on transmet une couche de qualité JPWL dont le débit source RS,i dépend du choix de la modulation Mi et du code RS défini par le paramètre Ni. 94 CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL Optimisation conjointe RS,i i = 1…L Codage JPWL en L couches de qualité hiérarchisées Ni i = 1…L Codage canal JPWL RS(Ni,K) CSI : σ i2 , i = 1...b Mi i = 1…L MAQ-M1 MAQ-M2 γ 1 = f12σ 12 Stratégie UPA par précodage (Fd) MAQ-ML γ 2 = f 22σ 22 Décodage ML (Gd) γ L = f L2σ L2 MAQ-M1 -1 MAQ-M2 -1 Décodage JPWL robuste MAQ-ML -1 Matrice de canal virtuel Hv b sous-canaux disponibles L sous-canaux utilisés L≤b Codage JPWL Figure 4.1. Synoptique de la stratégie d’adaptation de lien 4.3 Définition des contraintes 4.3.1 Contrainte de débit Comme nous voulons intégrer la possibilité de faire varier l’ordre de modulation, le débit de la source ainsi que le CCE, il est nécessaire d’introduire une contrainte sur le débit. De cette manière, on sera en mesure de déterminer le meilleur jeu de paramètres correspondant à la contrainte de débit considéré. On introduit donc le paramètre Smax, correspondant au nombre de symboles OFDM maximum que l’on peut utiliser sur un souscanal. Le paramètre Smax pourrait être choisi spécifiquement pour chaque sous-canal (Smax,i avec i = 1…L) ce qui reviendrait à attribuer un temps d’utilisation propre à chacun d’eux. Dans le cadre des simulations, nous ne faisons pas cette hypothèse. Nous considérerons donc le même paramètre Smax sur tous les sous-canaux. Le fait de fixer la valeur du paramètre Smax entraîne une contrainte sur le débit que nous décrivons. Pour cela, nous introduisons le paramètre βi correspondant au nombre de bits qui peuvent être transmis à travers le sous-canal i, pour un nombre de symboles OFDM correspondant à Smax. Nous pouvons donc écrire : β i = S max N SC log 2 ( M i ) (4.1) où NSC est le nombre de sous-porteuses utiles OFDM (NSC = 48 dans la norme IEEE802.11n [29]). Ainsi, pour une valeur de Smax donnée, le nombre de bits transmissible sur le sous-canal i ne dépend que de l’ordre de modulation Mi. Après le codage source et le codage canal sur le sous-canal i, nous pouvons considérer les paramètres βS,i et βC,i correspondant respectivement au nombre de bits alloués au codage de la source et au nombre de bits alloués au codage canal. Par conséquent, le système doit respecter la contrainte suivante sur le débit : β S , i + β C ,i ≤ β i (4.2) 95 CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL Le paramètre Smax est défini par l’utilisateur. Toutefois, sa valeur peut dépendre d’une application particulière ou être défini dans le cadre d’une norme de transmission. La valeur de Smax à un impact sur le temps de transmission et, par conséquent, sur la qualité de l’image transmise. 4.3.2 Contrainte sur la QoS Comme pour la méthode d’allocation de la puissance présentée au chapitre 3, nous intégrons le paramètre B correspondant au TEB cible en réception après décodage canal. Comme pour le paramètre Smax, ce paramètre peut être considéré spécifiquement pour chaque sous-canal (Bi avec i = 1…L) si une application particulière le nécessite. Toutefois, par soucis de simplification, nous considérerons dans la suite du document la même valeur de B pour tous les sous-canaux. Le paramètre B permet de formuler la contrainte sur la QoS définie par l’utilisateur, telle que : TEBi ≤ B (4.3) où TEBi correspond au TEB effectif en réception après décodage canal. La valeur de B est déterminée par l’utilisateur en fonction de la sensibilité du contenu aux erreurs. En effet, le réglage de B influencera la quantité d’erreurs acceptables dans le flux binaire. 4.3.3 Contrainte sur la puissance Au cours de la transmission, les coefficients de précodage f i 2 avec i = 1…L sont définis sous la contrainte de puissance définie dans le paragraphe 3.2.5 à savoir : L ∑f i =1 2 i = P0 (4.4) où P0 est la puissance totale disponible à l’émission. Comme nous intégrons la possibilité de ne pas utiliser la totalité des b sous-canaux disponibles, nous considérons de fait f i 2 = 0 pour i = L...b . 4.4 Minimisation de la distorsion Le codeur JPWL utilise l’algorithme de contrôle de débit de JPEG 2000 afin de minimiser la distorsion de l’image sous contrainte de débit cible [9]. Le codage entropique par plan de bits de JPEG 2000 est réalisé en trois passes engendrant la création de trois points de troncature par code bloc. Il est toutefois possible de spécifier plusieurs débits cibles RS,i correspondant au débit des différentes couches de qualité. Dans ce cas, le flux binaire de chaque code bloc est coupé en différents endroits. La réunion des premières portions des flux binaires de chaque code bloc forme une première couche de qualité. L’ajout des secondes portions de chaque code bloc forme la deuxième et ainsi de suite. 96 CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL L’optimalité de la répartition des bits se fait suivant l’algorithme de contrôle de débit inclus dans le codeur JPEG 2000. Chaque sous-bande d’ondelette est divisée en code blocs dont les coefficients fréquentiels sont codés indépendamment. On définit ainsi {Φj}j = 1,2,… l’ensemble de tous les code blocs qui représentent l’image. Pour chaque code blocs Φj, un flux binaire indépendant est généré. Ces flux binaires présentent la propriété de pouvoir être tronqués en diverses longueurs discrètes notées x1j , x 2j , x 3j ,… La distorsion engendrée par la reconstruction de chacun des sous-flux tronqués peut alors être estimée et notée D 1j , D 2j , D 3j ,… Au cours du processus d’encodage, les longueurs x nj et les distorsions associées D nj sont calculées et stockées temporairement. Une fois que l’image entière a été compressée, une opération post-traitement traite tous les code blocs compressés et détermine les points de troncature optimaux afin d’atteindre la contrainte de débit spécifiée dans les paramètres de codage. L’algorithme JPEG 2000 utilise l’erreur quadratique moyenne comme mesure de la distorsion. Etant donné que l’erreur quadratique moyenne est une mesure additive, la distorsion totale D de l’image reconstruite peut s’écrire : D = ∑Dj j n (4.5) j où nj est le point de troncature pour le code bloc Φj. On définit X comme étant le nombre de bits associé au codage du flux binaire. Alors, pour un ensemble de points de troncature nj, nous pouvons écrire : X = ∑xjj n (4.6) j Le but de l’algorithme d’adaptation de débit est de trouver l’ensemble n des valeurs nj qui minimisent D, sous la contrainte X ≤ β S avec βS le nombre de bit alloué au codage de l’image tel que β S = ∑i =1 β S ,i . La méthode des multiplicateurs de Lagrange est une méthode L bien connue permettant de résoudre des problèmes d’optimisation sous contrainte. Dans notre cas, le problème d’optimisation s’écrit : ( (n, ) = min ∑ R j j − µD j j s.c X ≤ βS n n ) (4.7) où la valeur du multiplicateur de Lagrange doit être ajustée afin de trouver les points de troncature qui minimisent l’équation 4.7 en satisfaisant la condition X = βS. Il n’y a pas d’algorithme simple qui garantisse un optimum global pour un ensemble de points de troncature donné. Toutefois, chacun des ensembles de points de troncature ni qui minimisent l’équation 4.7, pour différentes valeurs de , est optimal au sens d’une distorsion minimum atteinte pour un débit cible donné. Si la plus grande valeur de est trouvée de telle sorte que l’ensemble des points de troncature ni, obtenus par la minimisation de l’équation 4.7, fournit un débit X ≤ βS, alors il n’est pas possible de trouver un autre ensemble de points de troncature qui fournira une distorsion globale plus faible pour un débit inférieur ou égal à X [9]. Ainsi, le contrôle de débit du codeur JPEG 2000 permet de s’assurer que pour un nombre de bits fixés, la répartition des bits dans le flux binaire assure la plus faible distorsion 97 CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL possible au sens de l’erreur quadratique. Par conséquent, dans notre stratégie d’adaptation de lien, le problème de minimisation de la distorsion peut être vu comme un problème de maximisation du débit de la source. Pour une image, le débit alloué au codage de la source RS peut se définir tel que : RS = βS 1 L = ∑ β S ,i ρ ρ i =1 (4.8) où ρ est le nombre total de pixels dans l’image. La minimisation de la distorsion D de l’image correspond à la maximisation du nombre de bits alloués au codage de la source βS en respectant les contraintes énumérées précédemment : Contrainte de débit : β S ,i + β C ,i ≤ β i Contrainte de QoS : TEB i ≤ B , Contrainte de puissance : ∑ L i =1 f i ≤ P0 2 avec β i = S max N SC log 2 (M i ) , β β C ,i = i ( N i − K ) , Ni avec L≤b. (4.9) Nous pouvons résumer la contrainte de débit par l’expression suivante : β S ,i − K S max N SC log 2 ( M i ) ≤ 0 avec i = 1... L Ni (4.10) Maintenant que les contraintes du système ont été introduites et que le problème d’optimisation a été formulé, nous pouvons décrire la méthode permettant de le résoudre. 4.5 Représentation arborescente pour la résolution du problème Le processus de transmission d’une image suivant la stratégie d’adaptation de lien peut être décrit en quatre étapes : 1. Initialisation : Acquisition de la CSI, réglage de Smax et B par l’utilisateur ; 2. Optimisation conjointe pour déterminer la configuration de codage/transmission {L, M i , N i , RS ,i }iL=1 optimale ; 3. Codage source et codage canal JPWL en fonction de L, Ni et Rs,i pour i = 1…L ; 4. Transmission sur le canal MIMO en utilisant l’allocation hiérarchisée source-canal, la modulation adaptative (Mi pour i = 1…L) et la stratégie UPA grâce au précodeur CBP ( f i 2 pour i = 1…L). Le rôle de l’optimisation conjointe est donc de fournir une méthode permettant de déterminer la configuration de codage qui maximise le débit de la source en fonction des autres contraintes sur les paramètres du système (débit, QoS et puissance). Comme les paramètres Mi et Ni sont discrets, on peut envisager de confronter toutes les configurations de codage qui respectent les contraintes données pour sélectionner ensuite la configuration qui maximise le débit de la source. La représentation sous forme d’arbre est un bon moyen de 98 CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL répertorier toutes les configurations possibles puis par la suite de sélectionner la configuration optimale. 4.5.1 Commentaires sur le choix adopté Il est à noter que la résolution de ce problème d’optimisation par la méthode des multiplicateurs de Lagrange, associé aux conditions de Kuhn et Tucker [118] qui garantissent les conditions d’optimalité d’un problème d’optimisation sous contraintes d’inégalités, serait trop complexe car il y a beaucoup de paramètres qui sont à la fois discrets et continus. En effet, cette méthode est basée sur l’usage de dérivées partielles conduisant à des valeurs optimales continues pour les variables discrètes. Une manière de résoudre ce problème serait alors d’associer la valeur discrète la plus proche ce qui n’assure plus l’optimalité de la solution. Par ailleurs, nous ne sommes pas certains de trouver un optimum global comme solution (problème de convexité). De plus, comme nous l’avons vu précédemment, la solution adoptée doit respecter la hiérarchie de la source par une prise en compte de chacun des souscanaux. On rappelle l’exemple du précodeur MBER étudié dans le chapitre 2 qui minimise globalement le TEB sur l’ensemble des sous-canaux mais qui ne définit pas de contraintes pour le décodage des couches de qualité, les rendant inexploitables en réception en l’absence d’un CCE très performant. Le traitement global des sous-canaux est en contradiction avec la transmission d’un contenu hiérarchisé, où il est nécessaire d’assurer une transmission correcte et exploitable sur chaque sous-canal. La représentation en arbre présente l’avantage de traiter l’allocation des ressources, sous-canal par sous-canal, respectant ainsi la hiérarchie de la source et du canal. Cette représentation est un bon moyen d’assurer une qualité de base avant la transmission des couches d’amélioration lorsque les conditions sur le canal le permettent. 4.5.2 Construction de l’arbre Un ensemble de paramètres optimisés {L, M i , N i , RS ,i }i =1 représente une configuration de codage/transmission avec Mi ∈ , l’ensemble de taille m contenant les ordres de modulation disponibles, avec j) représentant le jème élément de . Ni ∈ , l’ensemble de taille n contenant les codes RS disponibles, avec j) représentant le jème élément de . Par conséquent, il y a (m × n) configurations de codage possibles. La complexité de l’arbre est exponentielle. En effet, l’arbre se construit jusqu’au sous-canal d’indice b, ce qui représente de manière exhaustive (m × n)b configurations possibles (fig. 4.2). La construction de l’arbre repose sur un algorithme récursif. Pour chaque couple de modulation et de codage canal sur un sous-canal formant une configuration de codage potentiel, on stocke les informations relatives à la configuration (nœuds verts sur la figure 4.2). D’un point de vue pratique, on utilise une structure « config » contenant les éléments suivants : L • L’indice i du sous-canal courant ; • L’ordre de modulation Mi ∈ • Le code RS défini par le paramètre Ni ∈ • Le nombre de bits βS,i alloué au codage de la source pouvant être transmis via le souscanal i ; • La puissance résiduelle Pr après le calcul de l’allocation de puissance nécessaire pour garantir la contrainte de QoS compte tenu des paramètres sur le sous-canal. utilisé sur le sous-canal i ; utilisé sur le sous-canal i ; 99 CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL Sous-canal SISO 1 Modulation MAQ Code RS N1 = N1 = Sous-canal SISO 2 Stockage config Modulation MAQ Code RS N1 = N2 = 1 N2 = 2 N2 = 3 N2 = n 1 2 M2 = M1 = Stockage config 3 M2 = M1 = Racine de l’arbre (initialisation) N1 = n N1 = (m-1)×n + 1 M1 = N1 = M1 = N1 = N1 = M2 = M2 = N2 = n+1 M2 = N2 = n+2 M2 = N2 = n+3 N2 = 2×n (m-1)×n + 2 (m-1)×n + 3 m×n M2 = M2 = Figure 4.2. Exemple de représentation en arbre pour 2 sous-canaux SISO Les programmes décris ci-dessous (tableaux 1 et 2) permettent de créer l’arbre à partir d’une fonction récursive. 1: 2: 3: 4: 5: Initialisation de la puissance : config→Pr = P0 ; Sélection du sous-canal : config→i = 0 ; Réglages de l’utilisateur : Smax et B ; Acquisition CSI: Hv = diag(σ1,σ2,…,σb) ; Appel de la fonction récursive Créer_Arbre(config) ; Tableau 4.1. Programme d’initialisation pour la création de l’arbre La fonction d’initialisation de l’arbre (tableau 4.1) est nécessaire afin d’initialiser la puissance à sa valeur maximale, lire le CSI et définir les valeurs des paramètres Smax et B. La 100 CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL fonction récursive est appelé Créer_Arbre (tableau 4.2). Elle est appelée en utilisant une structure « config » en paramètre. La fonction Créer_Arbre permet de créer l’arbre de manière exhaustive et, par conséquent, de tester toutes les combinaisons de modulation et de codage canal sur chaque sous-canal. Cette fonction est appelée récursivement à chaque nœud vert de l’arbre (voir figure 4.2). Le principe de cet algorithme consiste à déterminer la quantité de puissance nécessaire pour atteindre la contrainte TEBC,i. Dès lors que la puissance nécessaire (correspondant au coefficient de précodage f i 2 ) est déterminée, cette valeur est comparée avec la quantité de puissance résiduelle Pr. Si l’on dispose d’une quantité de puissance suffisante, la configuration de transmission est considérée possible. La quantité de données utiles βS,i qui peut transiter par le sous-canal i est alors calculée pour cette configuration. Les informations de codage et de transmission sont stockées dans une nouvelle structure « config ». La puissance résiduelle est mise à jour puis la fonction « Créer_Arbre » est appelée avec la nouvelle structure « config » en paramètre s’il reste des sous-canaux disponibles. Si une condition d’arrêt intervient (lorsque qu’il n’y a plus de puissance résiduelle ou que tous les sous-canaux ont été utilisés), la branche courante de l’arbre est interrompu puis une autre configuration est testée. Créer_Arbre(config) 1: 2: 3: 4: 5: 6: pour chaque Mi ∈ faire pour chaque Ni ∈ faire Calculer TEBC ,i en fonction de B ; Calculer f i 2 en fonction de σ i2 ; si f i 2 ≤ (config→Pr) alors i = (config→L) + 1 ; 7: Calculer β i en fonction de Smax ; 8: Calculer βC,i en fonction de β i ; 9: Calculer β S ,i = β i − β C ,i ; 10: 11: 12: 13: 14: 15: 16: 17: 18: 19: Stockage de la configuration dans new_config = { i, Mi, Ni, β S ,i } ; (new_config→Pr) = (config→Pr) - f i 2 ; si( i + 1 ≤ b ) alors Créer_Arbre(new_config) ; sinon Fin de la branche ; fin de si sinon Fin de la branche ; fin de si fin de pour fin pour Tableau 4.2. Fonction récursive permettant la création de l’arbre répertoriant les configurations de codage/transmission 101 CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL Ainsi, nous pouvons créer un arbre contenant toutes les possibilités de codage et de transmission respectant les contraintes. Le respect des contraintes permet en outre de supprimer toutes les configurations inenvisageables ce qui conduit à créer un arbre nonexhaustif, diminuant ainsi la complexité. 4.5.3 Recherche du chemin minimisant la distorsion Une fois que l’arbre est construit, il ne reste plus qu’à déterminer la configuration de codage/transmission optimale qui minimise la distorsion de la source. Ce choix est relativement simple car nous cherchons simplement à maximiser le débit de la source. Pour ce faire, il suffit de parcourir toutes les feuilles de l’arbre afin de trouver le chemin qui maximise L le critère ∑i =1 β S ,i , avec L correspondant au nombre de sous-canaux utilisés par le chemin courant. Ainsi, le chemin optimal fournit le nombre de sous-canaux à utiliser (correspondant également au nombre de couches de qualité JPWL), le débit source de chaque couche de qualité, l’ordre de la modulation MAQ et le code RS sur chaque sous-canal. Lorsque les paramètres ont été calculés, l’image est codée puis transmise à travers le canal MIMO. Au cours de la transmission d’une même image, les paramètres restent constants à l’exception des coefficients de précodage f i 2 avec i = 1…L, qui sont calculés dynamiquement en fonction de l’état du canal et des autres paramètres du système. Remarque Dans le cas de figure peu fréquent où plusieurs feuilles de l’arbre fourniraient le même critère ∑i =1 β S ,i qui maximise le débit de la source, le choix de la configuration optimale L parmi ces configurations potentielles serait défini par le chemin qui maximise le L −1 critère ∑i =1 β S ,i . 4.6 Résultats de simulations sur canal réaliste 4.6.1 Contexte de simulation Les simulations qui suivent ont pour objet de mettre en avant l’apport de la stratégie d’adaptation de lien pour un canal MIMO 4×4 qui varie dans le temps par rapport aux stratégies de transmission non-adaptatives étudiées dans les chapitres 2 et 3. Ainsi, nous n’utiliserons que le canal réaliste présenté dans le paragraphe 2.4.1.4 qui permet de faire varier de manière réaliste les conditions de transmission en fournissant alternativement des conditions mauvaises (NLOS, zone 1), moyennes (NLOS, zone 2 et 4) ou bonnes (LOS, zone 3). A ce titre, le paramétrage de la couche physique est le même que pour les simulations des chapitres 2 et 3, et est défini dans le paragraphe 2.4.1.1. Nous ne considérons pas une connaissance parfaite de la CSI mais seulement une actualisation de la CSI tous les 20 symboles OFDM conformément à la norme IEEE 802.11n. Entre deux actualisations, des erreurs sur la CSI peuvent donc apparaître. 102 CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL Afin d’évaluer le gain apporté par la stratégie d’adaptation de lien, nous définissons tout d’abord une configuration de base permettant de fournir des résultats références avec les stratégies non-adaptatives. A partir de cette configuration de base, nous déterminons la valeur du paramètre Smax équivalent (correspondant au nombre de symboles OFDM maximum utilisables) fournissant ainsi la contrainte de base à la stratégie d’adaptation de lien. On peut ainsi évaluer le gain de cette stratégie dans des conditions comparables. 4.6.1.1 Définition de la configuration de base Nous transmettons les images « Caps » et « Monarch » (cf. fig 2.7) de résolution 768 × 512 pixels. Ces images sont codées par l’intermédiaire de JPWL pour être transmises sur le canal MIMO 4×4. Comme la décomposition de ce canal conduit à considérer quatre souscanaux SISO, nous codons les images JPWL en quatre couches de qualité hiérarchisées présentant chacune un débit de 0,125bpp. Chaque image est codée en une seule tuile. Nous intégrons les protections prédéfinies par le standard JPWL pour l’entête principal, l’entête de tuile et les entêtes de paquets. Nous intégrons également les marqueurs de resynchronisation en début de paquet (marqueurs SOP) et en fin d’entête de paquet (marqueurs EPH). Nous utilisons toujours le code RS(37,32) de JPWL sur les données utiles. Le tableau 4.3 résume les paramètres des couches physique et application pour la définition de la configuration de base. CONFIGURATION DE BASE COUCHE PHYSIQUE Système MIMO Sous-canaux SISO équivalents Modulation COUCHE APPLICATION Nombre de couche de qualité Débit de la source Codage canal (données utiles) 4×4 4 MAQ-4 / sous-canal 4 0,125bpp / couche de qualité RS(37,32) Tableau 4.3. Définition des paramètres de la configuration de base Les scores PSNR et SSIM des images codées via la configuration de base sont fournis dans le tableau 4.4 ci-dessous : Caps Monarch 1ère couche PSNR SSIM + 2ème couche PSNR SSIM + 3ème couche PSNR SSIM + 4ème couche PSNR SSIM 29,60 0,810 24,92 0,805 31,80 0,861 28,09 0,868 33,49 0,892 30,28 0,898 34,95 0,916 32,01 0,918 Tableau 4.4. Distorsion (PSNR en dB et SSIM) des images tests pour un codage de 0,125bpp par couche de qualité avec code RS(37,32) sur les données utiles Le tableau 4.4 permet de fournir des repères pour la lecture des courbes de PSNR et de score SSIM issus des résultats de simulation. 103 CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL 4.6.1.2 Définition des paramètres pour la stratégie d’adaptation de lien Dans le cadre de la stratégie d’adaptation de lien, l’utilisateur doit définir la valeur du paramètre Smax qui correspond au nombre de symboles OFDM maximum que la stratégie peut utiliser sur chaque sous-canal. Pour cela, nous définissons la valeur de Smax à partir des paramètres de la configuration de base (tab. 4.3) et des paramètres de la couche application. Considérant une résolution d’image de 768×512 pixels pour un débit de 0,125bpp par couches de qualité pour la configuration de base, nous pouvons faire transiter 49152 bits par souscanal SISO. Sachant qu’un symbole OFDM de la norme IEEE802.11n [29] utilise 48 sousporteuses utiles et que l’on utilise des modulations MAQ-4 sur chaque sous-canal, nous pouvons faire transiter 96 bits par symbole OFDM. Au final, il faut donc utiliser 512 symboles OFDM afin de faire transiter une image codée suivant la configuration de base définie par le tableau 4.3. Afin de se placer dans des conditions comparables, nous définissons donc le paramètre Smax de la stratégie d’adaptation de lien équivalent à 512 symboles OFDM. Le tableau 4.5 résume les autres paramètres utilisés dans le cadre de la stratégie d’adaptation de lien. CONFIGURATION POUR L’ADAPTATION DE LIEN COUCHE PHYSIQUE Système MIMO Sous-canaux SISO équivalents Ordre des modulations MAQ-M Nombre de symboles OFDM maximum par sous-canal Smax 4×4 4 {4, 16, 64} 512 COUCHE APPLICATION Nombre de couche de qualité Débit de la source Paramètres N des codes RS(N,32) TEB cible après décodage canal B 1à4 variable {37, 38, 40, 43, 45} 10-9 Tableau 4.5. Définition des paramètres de la stratégie d’adaptation de lien Dans le cadre de notre stratégie, nous utilisons trois ordres de modulation possibles (MAQ-4, MAQ-16 et MAQ-64) indépendamment sur chacun des sous-canaux SISO. Les quatre sous-canaux SISO peuvent être utilisés partiellement ou en totalité afin de transmettre une image composée de une à quatre couches de qualité. Le débit de la source est variable car il dépend du nombre de sous-canaux utilisés, des ordres de modulation ainsi que des CCE utilisés. On considère la possibilité d’utiliser cinq codes RS différents définis dans la norme JPWL allant du code RS(37,32) au code RS(45,32), pour une capacité de correction t pouvant aller de 2 à 6. Nous utilisons uniquement les codes présentant la redondance la plus faible afin de ne pas attribuer toute la robustesse du schéma aux performances du codage canal. Le choix des paramètres du tableau 4.5 (modulation, codage canal et système MIMO) conduit à considérer jusqu’à 50625 configurations ((m × n)b avec m = 3, n = 5 et b = 4). Le précodeur CBP qui est au cœur de la stratégie d’adaptation de lien est paramétré afin de fournir un TEB cible après décodage canal équivalent à 10-9 (voir §3.2.5). Il en est d’ailleurs de même pour l’utilisation du précodeur CBP avec la configuration de base. 104 CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL 4.6.2 Apports de la stratégie d’adaptation de lien Dans le cadre de ces simulations, les images sont transmises pour chaque position de la trajectoire du récepteur en tenant compte de la mobilité. On dispose donc d’une image reçue pour chaque point de la trajectoire. Afin de rendre les courbes plus lisibles, les résultats ont été moyennés à l’aide d’une fenêtre glissante comprenant 20 valeurs (voir §2.4.2.2). Les figures 4.3 et 4.5 montrent les résultats de simulation de transmission avec la configuration de base (tab. 4.3) pour les images « Caps » et « Monarch » respectivement. Les figures 4.4 et 4.5 montrent, quant à elles, le gain apporté par la stratégie d’adaptation de lien par rapport aux performances affichées par le précodeur CBP dans une configuration de transmission avec codage canal et modulation figés. Les tableaux 4.6 et 4.7 viennent compléter les résultats en fournissant les performances moyennes en termes de PSNR par zones de transmission ainsi que l’écart-type par rapport au PSNR moyen sur la zone considérée. L’écart-type fournit ainsi une information sur la dynamique des résultats. Premièrement, nous pouvons constater que les courbes des images « Caps » et « Monarch » présentent un comportement similaire entre les précodeurs. Cette constatation est également vraie concernant les métriques PSNR et SSIM. Deuxièmement, nous observons que le comportement des précodeurs est similaire à celui des chapitres 2 et 3. Nous noterons également qu’en l’absence d’optimisation, la meilleure QoS est fournie par le précodeur CBP avec une bonne stabilité dans les résultats et cela quelles que soient les conditions de transmission. Les explications quant à ces résultats ont été données précédemment dans les chapitres 2 et 3. Enfin, nous pouvons noter l’apport de la stratégie d’adaptation de lien par rapport à un schéma non-adaptatif. On remarque ainsi que la stratégie d’adaptation de lien améliore de façon significative la robustesse du schéma à la transmission en comparaison du précodeur CBP qui affiche les meilleures performances parmi les précodeurs dans une configuration non-adaptative. Dans de mauvaises conditions de transmission (zone 1), nous pouvons constater un gain moyen de 0,54dB pour « Caps » et de 0,7dB pour « Monarch » par rapport au précodeur CBP seul. De plus, ce gain est à mettre en relation avec l’écart-type du PSNR qui est le plus faible sur cette zone (1,07dB pour « Caps » et 1,47dB pour « Monarch ») parmi toutes les stratégies proposées. En effet, on remarque que la stratégie d’adaptation de lien est en mesure de choisir un jeu de paramètres permettant de contrer les évanouissements fréquentiels comme c’est typiquement le cas autour de la position d’indice 100. Dans des conditions de transmission de qualité moyennes (zone 2 et 4), le gain en robustesse est encore meilleur par rapport au précodeur CBP (en moyenne 0,87dB pour « Caps » et 0,99dB pour « Monarch »). Enfin, on constate une amélioration significative des performances due à la stratégie d’adaptation de lien lorsque le canal présente de bonnes conditions de transmission (zone 3). En effet, la stratégie peut pleinement tirer parti des conditions favorables en utilisant une modulation avec une haute efficacité spectrale (MAQ-64) ainsi qu’un faible niveau de redondance. La quantité de donnée utile est ainsi largement supérieure comparativement aux stratégies non-adaptatives, ce qui explique l’écart important avec le précodeur CBP seul en termes de PSNR moyen (4,34dB pour « Caps » et 5,09dB pour « Monarch »). D’une manière générale, la stratégie d’adaptation de lien fournit une bonne stabilité dans les résultats au regard des écart-type par rapport au PSNR moyen à peu près équivalent quelles que soient les conditions de transmission. 105 CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL Zone 1 Zone 2 Zone 3 Zone 4 Zone 1 1 35 30 Zone 2 Zone 3 Zone 4 0.8 Score SSIM PSNR en dB 25 20 CBP WF MMSE MBER E-dmin 15 10 5 0 0 0.6 CBP WF MMSE MBER E-dmin 0.4 0.2 0 500 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) 0 500 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) Figure 4.3. Résultats de simulation (PSNR et score SSIM) pour l’image « Caps » avec la configuration de base Zone 2 Zone 3 Zone 4 Zone 1 1 38 0.95 36 0.9 Score SSIM PSNR en dB Zone 1 40 34 32 30 28 Zone 3 Zone 4 0.85 0.8 0.75 0.7 CBP CBP optimisé 26 24 Zone 2 0 500 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) CBP CBP optimisé 0.65 0.6 0 500 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) Figure 4.4. Apport de la stratégie d’adaptation de lien (PSNR et score SSIM) pour l’image « Caps » Précodeurs WF MMSE MBER E-dmin CBP CBP optimisé MAUVAISES CONDITIONS Zone 1 PSNR Ecart-type moyen (dB) 24,52 11,58 6,55 3,60 30,40 30,94 9,08 8,18 2,70 3,85 2,27 1,07 CONDITIONS MOYENNES Zone 2 et 4 PSNR Ecart-type moyen (dB) 31,80 31,25 23,64 26,80 32,69 33,56 0,88 1,79 8,37 10,79 1,11 1,23 BONNES CONDITIONS Zone 3 PSNR Ecart-type moyen (dB) 33,48 33,53 33,12 34,95 33,65 37,99 Tableau 4.6. Performances moyennes pour l’image « Caps » 106 0,32 0,61 3,24 0,00 0,53 1,24 CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL Zone 1 Zone 2 Zone 3 Zone 4 Zone 1 35 Zone 2 Zone 3 Zone 4 1 30 0.8 Score SSIM PSNR en dB 25 20 15 CBP WF MMSE MBER E-dmin 10 5 0 0 0.6 0.4 CBP WF MMSE MBER E-dmin 0.2 0 500 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) 0 500 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) Figure 4.5. Résultats de simulation (PSNR et score SSIM) pour l’image « Monarch » avec la configuration de base Zone 1 Zone 2 Zone 3 Zone 4 Zone 1 38 1 36 0.95 30 28 26 Zone 4 0.85 0.8 0.75 0.7 24 CBP CBP optimisé 22 20 Zone 3 0.9 32 Score SSIM PSNR en dB 34 Zone 2 0 500 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) CBP CBP optimisé 0.65 0.6 0 500 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) Figure 4.6. Apport de la stratégie d’adaptation de lien (PSNR et score SSIM) pour l’image « Monarch » Précodeurs WF MMSE MBER E-dmin CBP CBP optimisé MAUVAISES CONDITIONS Zone 1 PSNR Ecart-type moyen (dB) 20,99 10,06 6,07 3,57 26,18 26,88 7,48 6,97 2,54 3,46 2,34 1,47 CONDITIONS MOYENNES Zone 2 et 4 PSNR Ecart-type moyen (dB) 28,14 27,33 20,36 24,29 29,28 30,27 0,96 1,83 6,98 9,50 1,23 1,52 BONNES CONDITIONS Zone 3 PSNR Ecart-type moyen (dB) 30,28 30,42 30,03 32,01 30,45 35,54 0,33 0,65 2,83 0,00 0,85 1,42 Tableau 4.7. Performances moyennes pour l’image « Monarch » 107 CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL 4.6.3 Gestion des ressources L’optimisation conjointe de la stratégie d’adaptation de lien calcule le débit source le plus adapté pour chaque image transmise. Ce débit peut donc changer au cours de la simulation de transmission de sorte à s’adapter à l’état du canal. La figure 4.7 montre comment le débit de la source varie en fonction de la position sur la trajectoire du récepteur. On remarque en outre, que le débit s’adapte parfaitement aux variations du canal, en variant d’environ 0,1bpp dans de mauvaises conditions (zone 1) à plus de 1bpp lorsque les conditions deviennent bonnes (zone 3). A titre de comparaison, la configuration de base est définie pour transmettre une image de 0,125bpp (la couche de base) à 0,5bpp (décodage de toutes les couches). L’adaptation du débit, conjointement à la modulation adaptative, la stratégie UEP et la stratégie UPA, est un facteur d’amélioration de la QoS, en comparaison des autres stratégies de la littérature qui n’ajustent généralement que les paramètres liés à la transmission. Zone 1 Zone 2 Zone 3 Zone 4 1.2 Débit source en bpp 1 0.8 0.6 0.4 0.2 0 0 500 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) Figure 4.7. Variation du débit source des images JPWL fournie par l’optimisation conjointe de la stratégie d’adaptation de lien La figure 4.8 met en avant l’évolution dans la sélection des sous-canaux ainsi que les ordres de modulation sur chacun d’eux. L’étude de cette figure montre que les sous-canaux et les ordres de modulation sont utilisés de manière cohérente au regard des conditions variables du canal de transmission, et dépendent ainsi de la position sur la trajectoire du récepteur. 108 CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL Zone 1 Ordre de modulation MAQ-64 Zone 2 Zone 3 Zone 4 Sous-canal 1 Sous-canal 2 Sous-canal 3 Sous-canal 4 MAQ-16 MAQ-4 0 500 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) Figure 4.8. Utilisation des ordres de modulation et des sous-canaux en fonction de la position sur la trajectoire du récepteur Lorsque les conditions sont mauvaises (zone 1), la solution utilise seulement un ou deux sous-canaux couplés avec la plus robuste des modulations (MAQ-4). Lorsque les conditions deviennent moyennes (zones 2 et 4), la stratégie utilise trois sous-canaux avec une modulation MAQ-4 ou MAQ-16 sur les deux premiers sous-canaux SISO et une modulation MAQ-4 sur le troisième. Si l’on fait le parallèle avec la figure 4.5, nous constatons que l’augmentation de l’efficacité spectrale sur les sous-canaux 1 et 2 est le facteur majeur de l’augmentation du débit source. Lorsque les conditions de transmission sont bonnes (zone 3), la stratégie utilise trois ou quatre sous-canaux. L’amélioration des conditions permet d’exploiter pleinement le canal en utilisant la modulation présentant la plus grande efficacité spectrale (MAQ-64) sur le premier sous-canal. Le second et le troisième sous-canal utilisent majoritairement soit la MAQ-64 soit la MAQ-16. Enfin le quatrième sous-canal utilise les modulations MAQ-16 ou MAQ-4. Ce sont ces hautes efficacités spectrales qui sont à l’origine de l’augmentation significative du débit source que l’on peut constater sur la figure 4.5. Cette augmentation est alors synonyme d’une augmentation de la qualité de l’image que l’on peut aussi constater sur les figures 4.4 et 4.6. Ainsi, nous pouvons noter que le schéma met en œuvre une adaptation rapide et cohérente dans l’utilisation des sous-canaux et des ordres de modulation face aux variations du canal de transmission. 4.6.4 Complexité de la solution La figure 4.9 présente l’évolution du nombre de configurations évaluées dans l’arbre pour chaque image transmise. On rappelle que compte tenu des paramètres de modulation, de codage canal et du système MIMO considéré, l’arbre peut comporter au maximum 50625 configurations possibles. Toutefois, de par les contraintes définies pour l’optimisation, on rappelle qu’un grand nombre de configurations ne sont pas possibles et ne sont donc pas évaluées, diminuant ainsi la complexité de la solution. 109 CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL Nombre de configurations possibles Zone 1 Zone 2 Zone 3 Zone 4 3500 3000 2500 2000 1500 1000 500 0 0 500 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) Figure 4.9. Evolution du nombre de configurations évaluées dans l’arbre Ainsi, nous pouvons noter que le nombre de configurations possibles augmente avec l’amélioration des conditions sur le canal. Cette constatation est logique car plus les conditions de transmission sont bonnes, plus nombreuses sont les solutions potentielles. On remarque malgré tout que l’on est relativement éloigné des 50625 configurations maximales et cela même lorsque les conditions de transmission sont bonnes. Ceci est dû à la difficulté de satisfaire toutes les contraintes, en particulier la contrainte sur la puissance qui limite le nombre de sous-canaux pouvant être utilisé. Le tableau 4.8 résume le nombre moyen de configurations évaluées en fonction des conditions de transmission : Nombre moyen de configurations possibles MAUVAISES CONDITIONS CONDITIONS MOYENNES BONNES CONDITIONS Zone 1 Zone 2 et 4 Zone 3 21 288 2939 Tableau 4.8. Nombre moyen de configurations évaluées par l’arbre en fonction des conditions de transmission Malgré le grand nombre de configurations possibles, il y en a relativement peu qui satisfassent les contraintes du système. Il est d’ailleurs important de rappeler que cette stratégie est essentiellement conçue pour la transmission d’image dans des conditions de transmission difficiles. Il est ainsi intéressant de constater que plus les conditions de transmission sont mauvaises et moins la solution est complexe, du fait des contraintes plus difficiles à satisfaire. Il est également important de noter qu’aucune méthode n’a été mise en œuvre afin de diminuer la complexité de l’arbre. On peut toutefois facilement envisager des hypothèses lors de la construction de l’arbre allant dans ce sens. A titre d’exemple, il n’est pas nécessaire de construire la branche de l’arbre utilisant une MAQ-4 sur le premier sous-canal lorsque le canal est bon. 110 CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL 4.6.5 Analyse visuelle Les figures 4.10 et 4.11 présentent un comparatif entre des images reçues par l’intermédiaire du précodeur CBP seul, par rapport au précodeur CBP inclut dans le cadre de la stratégie d’adaptation de lien. Ces exemples sont représentatifs pour les différentes configurations de transmission. Dans de mauvaises conditions de transmission (fig. 4.10 (a) et (b) ; fig. 4.11 (a) et (b)), le précodeur CBP permet la transmission d’une ou deux couches de qualité. Il arrive fréquemment que les images ne souffrent d’aucune distorsion comme c’est le cas pour la figure 4.11 (a). Il peut également arriver que l’on obtienne une image composée de deux couches de qualité avec des distorsions (apportées par le canal) sur la seconde couche. Par exemple, on peut distinguer l’apparition de fausses couleurs sur la figure 4.10 (a). La stratégie d’adaptation de lien fournit généralement des images de qualité légèrement supérieure présentant rarement des distorsions (fig. 4.10 (b) et fig. 4.11 (b)). Ceci est dû à la possibilité de l’algorithme adaptatif de sélectionner des codes RS présentant une capacité de correction plus élevée et donc mieux adaptée aux conditions de transmission difficiles rencontrées sur la zone 1. L’augmentation de la capacité de correction des codes RS est prise en compte lors de l’allocation de la puissance par le précodeur CBP qui peut alors assurer l’exploitation d’un à deux sous-canaux SISO. La qualité des images transmises est donc équivalente mais les codes RS limitent significativement les distorsions en réception ce qui permet à la stratégie d’adaptation de lien d’afficher de meilleures performances moyennes en termes de PSNR et SSIM. Dans des conditions de transmission moyennes (fig. 4.10 (c) et (d) ; fig. 4.11 (c) et (d)), on retrouve globalement le même schéma avec cette fois une qualité d’image oscillant entre deux et trois couches de qualité. Le précodeur CBP fournit trois types de résultats à savoir : 2 couches décodées sans erreurs (fig. 4.11 (c)), 3 couches décodées avec des distorsions portées par la troisième couche (fig. 4.10 (c)) ou 3 couches décodées sans erreur. Enfin, dans de bonnes conditions de transmission (fig. 4.10 (e) et (f) ; fig. 4.11 (e) et (f)) nous pouvons constater le gain en qualité obtenu par la solution adaptative en comparaison du précodeur CBP seul. En effet, les exemples présentés montrent des gains en PSNR de 4,75dB pour « Caps » et de 5,17dB pour « Monarch » résultant de l’augmentation du débit source par l’exploitation de modulations à plus haute efficacité spectrale (voir fig. 4.8). 111 CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL Précodeur CBP, zone 1 Précodeur CBP avec adaptation de lien, zone 1 (a) Caps399 : PSNR = 29,57dB ; SSIM = 0,804 (b) Caps399 : PSNR = 31,91dB ; SSIM = 0,863 Précodeur CBP, zone 2 Précodeur CBP avec adaptation de lien, zone 2 (c) Caps978 : PSNR = 31,82dB ; SSIM = 0,852 (d) Caps978 : PSNR = 34,77dB ; SSIM = 0,914 Précodeur CBP, zone 3 Précodeur CBP avec adaptation de lien, zone 3 (e) Caps1711 : PSNR = 34,95dB ; SSIM = 0,916 (f) Caps1711 : PSNR = 39,70dB ; SSIM = 0,959 Figure 4.10. Comparaison visuelle entre les résultats fournis par le précodeur CBP et par la stratégie d’adaptation de lien pour l’image « Caps » et pour différentes conditions de transmission 112 CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL Précodeur CBP, zone 1 Précodeur CBP avec adaptation de lien, zone 1 (a) Monarch151 : PSNR = 24,91dB ; SSIM = 0,805 (b) Monarch151 : PSNR = 28,04dB ; SSIM = 0,868 Précodeur CBP, zone 2 Précodeur CBP avec adaptation de lien, zone 2 (c) Monarch571 : PSNR = 28,13dB ; SSIM = 0,867 (d) Monarch571 : PSNR = 31,94dB ; SSIM = 0,917 Précodeur CBP, zone 3 Précodeur CBP avec adaptation de lien, zone 3 (e) Monarch1843 : PSNR = 32,01dB ; SSIM = 0,918 (f) Monarch1843 : PSNR = 37,18dB ; SSIM = 0,952 Figure 4.11. Comparaison visuelle entre les résultats fournis par le précodeur CBP et par la stratégie d’adaptation de lien pour l’image « Monarch » et pour différentes conditions de transmission 113 CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL Avant de clore cette analyse des résultats, nous présentons des cas de figure particuliers dans lesquels l’image fournie par le décodeur robuste JPWL est porteuse de distorsions dues au canal de transmission (fig. 4.12 (a) et (c)). Images fournies par le décodeur robuste JPWL Images fournies par le décodeur robuste JPWL si l’on s’abstient de décoder la dernière couche (a) Caps236 : 2 couches de qualité décodées PSNR = 26,25dB ; SSIM = 0,603 (b) Caps236 : 1 couche de qualité décodée PSNR = 29,60dB ; SSIM = 0,810 (c) Monarch2254 : 3 couches de qualité décodées PSNR = 23,41dB ; SSIM = 0,759 (d) Monarch2254 : 2 couches de qualité décodées PSNR = 28,00dB ; SSIM = 0,868 Figure 4.12. Présence de distorsions au décodage En l’absence d’instructions données au décodeur robuste JPWL, le décodage s’effectue sur la totalité des données reçues. Il peut alors arriver que la dernière couche de qualité soit victime d’erreurs de transmission qui se traduisent en distorsion plus ou moins marquées (fig. 4.12 (a) et (b)). Ces distorsions s’expliquent par le fonctionnement du précodeur CBP. On rappelle que dans le cadre du précodeur CBP, la répartition de la puissance est réalisée sous contrainte de TEB cible. Il peut arriver néanmoins qu’après allocation de la puissance sur les premiers sous-canaux, le dernier sous-canal utilisé ne dispose plus assez de puissance pour atteindre le TEB cible. Il en résulte ainsi une sensibilité accrue aux erreurs de transmission qui, dans certains cas de figure, n’empêche pas le décodage de la dernière couche de qualité, mais se traduit en distorsion. On remarquera néanmoins que les autres couches de qualité, disposant de suffisamment de puissance, ne souffre pas d’erreur de transmission non corrigée. Ainsi, en s’abstenant de décoder la dernière couche de qualité, nous pouvons fournir une meilleure qualité visuelle (fig. 4.12 (b) et (d)). 114 CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL A partir de cette constatation, nous pouvons envisager deux cas de figure : • Les distorsions présentées ne sont visuellement pas dérangeantes. Cependant, seule une analyse subjective peut nous apporter cette conclusion ; • Si cela est nécessaire, on s’abstient de décoder la dernière couche de qualité qui est généralement la seule qui porte des distorsions. Cette stratégie – qui pourrait également s’appliquer aux autres précodeurs – nécessite néanmoins un organe de décision au niveau du décodage. Ainsi ces constatations nous laissent envisager une stratégie de décodage basée sur l’analyse du contenu en réception. Cette étude fera l’objet du prochain chapitre. 4.7 Synthèse et conclusion Ce quatrième chapitre a permis de présenter une stratégie d’adaptation de lien s’appuyant sur la stratégie de transmission d’image sur un canal MIMO décomposé en souscanaux SISO, et sur le précodeur CBP présenté dans le chapitre 3. L’objectif de cette stratégie était d’intégrer la possibilité de mettre en œuvre conjointement de l’UEP, de l’UPA, de la modulation adaptative et du codage de source adaptatif pour maximiser la qualité visuelle des images reçues. Après avoir formulé le problème de minimisation de la distorsion et les contraintes liées à la stratégie, nous avons proposé un algorithme permettant d’évaluer toutes les possibilités de codage à travers une représentation en arbre. Le cœur de cet algorithme s’appuie sur le précodeur CBP, qui permet de s’assurer qu’une configuration de codage/transmission est envisageable ou non. Il permet en outre d’allouer la puissance en relation avec la valeur des autres paramètres du système (RSB des sous-canaux, modulation, codage canal, TEB cible) ce qui assure un caractère totalement conjoint à la stratégie. Après avoir construit l’arbre, le chemin maximisant le débit de la source représente la configuration optimale pour la transmission. Les tests de simulation de la stratégie d’adaptation de lien sur canal réaliste ont clairement mis en évidence l’intérêt d’intégrer une notion d’adaptabilité dans le schéma de transmission. On retiendra en outre, que cette stratégie permet de limiter l’instabilité dans les résultats lorsque les conditions sont mauvaises et améliore significativement la qualité des images reçues dans de bonnes conditions. De plus, nous avons montré que la complexité de cette solution diminue à mesure que les conditions deviennent difficiles, ce qui est un avantage étant donné que cette solution est essentiellement conçue pour les conditions de transmission les plus difficiles (faibles RSB, multi-trajets et mobilité). Enfin cette étude ouvre la porte à une stratégie de décodage basée sur le contenu en réception. En effet, nous avons montré que certaines images reçues sont porteuses de distorsions du fait de la gestion de la puissance sur le dernier sous-canal utilisé. Nous proposons donc une stratégie de décodage basée sur l’analyse du contenu en réception dans le chapitre 5. 115 CHAPITRE 5 ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE Sommaire 5.1 Introduction 118 5.2 Problématique 119 5.3 Les métriques de qualité 122 5.4 Solution proposée 5.4.1 La métrique à référence réduite QIP 5.4.2 Intégration de QIP dans la stratégie de transmission 5.4.3 Remarques sur l’utilisation de QIP dans la stratégie de transmission 125 5.5 Résultats de simulation sur canal réaliste 5.5.1 Analyse objective 5.5.2 Analyse visuelle 126 126 130 5.6 Validation subjective 5.6.1 Motivations 5.6.2 Protocole de test 135 135 135 5.6.2.1 5.6.2.2 5.6.2.3 5.6.3 5.7 Base d’images Panel d’observateurs Présentation des images Analyse des résultats Synthèse et conclusion 123 123 124 135 136 136 137 140 117 CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE 5.1 Introduction Au cours des dernières années, les recherches dans le domaine des communications numériques ont fait place au concept de qualité d’expérience (QoE). L’idée consiste à prendre en compte l’expérience de l’utilisateur final dans l’appréciation des performances d’un algorithme ou d’un système donné. Les recherches ayant pour objectif d’intégrer la QoE connaissent actuellement un essor important compte tenu des applications industrielles. Effectivement, l’intégration de la QoE dans les systèmes pourrait par exemple permettre de solutionner des problèmes liés à la congestion des réseaux, en allouant plus finement les ressources suivant l’utilisation qui en est faite. Par exemple, les auteurs de [128] s’intéressent à la QoE dans le cadre de la diffusion en temps réel de vidéoconférences dans un réseau filaire. Pour mesurer la QoE, les auteurs s’appuient sur une métrique objective (bVQM70). Cette métrique compare la vidéo originale et la vidéo reçue afin de fournir un score de fidélité. Toutefois, cette métrique nécessite un paramétrage. Comme aucune norme ne définit de paramétrage lié au Système Visuel Humain (SVH) afin de fournir des résultats liés à la perception humaine, les auteurs ont réalisé une campagne de tests subjectifs afin de calibrer la métrique bVQM pour qu’elle soit la plus proche du jugement des observateurs. A partir de la métrique calibrée, les auteurs testent l’impact de différents paramètres sur la QoE. Les conclusions de cette étude recommandent de contrôler le trafic via des algorithmes qui utilisent au mieux les ressources afin d’assurer une qualité stable. Les auteurs recommandent également de recoder les flux en temps réel (codage source adaptatif) afin de s’adapter aux variations sur le réseau. On notera que ces recommandations trouvent un écho dans notre stratégie. A l’heure actuelle les systèmes sont néanmoins majoritairement caractérisés par la qualité de services (QoS) qui est une indication plutôt liée à des critères objectifs qu’à l’expérience de l’utilisateur. Naturellement, le concept de QoE est étroitement associé au jugement subjectif humain. Toutefois, comme le font remarquer les auteurs de [129], le recours au jugement humain est plutôt mal considéré dans la littérature. L’hypothèse dominante étant que si on optimise la QoS, alors la QoE de l’utilisateur va nécessairement augmenter, ce qui d’après ces mêmes auteurs est faux, car même avec une excellente QoS, on peut obtenir une mauvaise QoE. Nous avons en outre proposé des résultats allant dans ce sens dans le chapitre 2, où le TEB n’était pas révélateur de la qualité des images en termes de PSNR et de score SSIM. Dans les chapitres précédents, nous avons présenté une méthode optimale afin d’ajuster conjointement les ressources liées aux stratégies UPA, UEP, modulation adaptative et codage source adaptatif, en fonction de l’état du canal de transmission. Dans ces travaux, la QoS est vue comme la capacité à minimiser la distorsion de la source au sens de l’erreur quadratique moyenne. Ainsi, les ressources de la chaîne sont ajustées de manière optimale en ce sens. Nous avons ainsi montré que notre stratégie d’adaptation de lien est en mesure de fournir une bonne QoS. Néanmoins, il serait intéressant d’enrichir cette dernière afin qu’elle recouvre la notion de QoE. Effectivement, bien que les critères objectifs employés (PSNR et score SSIM) indiquent que la QoS est atteinte, on a pu voir à la fin du chapitre 4 que des cas de figures pouvaient être relativement médiocres du point de vue de la QoE. La QoE peut être corrélée à la QoS lorsqu’il n’y a pas d’erreur en réception. A ce moment là, la stratégie fournit la meilleure qualité possible compte tenu des conditions sur le canal de transmission. Par contre, en cas d’erreurs de transmission (fréquentes compte tenu du contexte de transmission difficile), il devient difficile d’évaluer la QoE du fait que l’on ne sait ni quelle zone du flux de l’image codée va être touchée, ni l’importance de la dégradation (acceptable ou aberrante). C’est pour cela que la stratégie d’adaptation de lien est optimale au sens de la QoS mais pas 70 batch Video Quality Metric 118 CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE de la QoE car il faudrait alors, que la stratégie prenne en compte l’expérience de l’utilisateur afin de fournir une image de qualité satisfaisante au sens du jugement humain. C’est ce que l’on se propose de faire dans ce dernier chapitre qui constitue une ouverture vers le concept de QoE. Dans un premier temps, nous développerons la problématique liée à la QoE ainsi que les différentes familles de métrique objectives permettant de déterminer la qualité des images. Nous proposerons ensuite une solution basée sur l’utilisation d’une métrique à référence réduite intégrant des contraintes psychovisuelles. Puis nous analyserons les résultats de simulation sur canal réaliste de manière objective (PSNR et score SSIM) puis subjective (analyse visuelle). Finalement, nous présenterons la campagne de tests subjectifs réalisée afin de valider l’utilisation de la stratégie proposée pour maximiser la QoE de l’utilisateur. 5.2 Problématique Lors de la transmission d’une image codée en couches de qualité hiérarchisées, nous avons la possibilité de ne décoder qu’une version partielle de l’image. Si on prend l’exemple d’une image codée en quatre couches de qualité, nous pouvons donc obtenir jusqu’à quatre images présentant chacune une qualité différente. En l’absence de stratégie de décodage au niveau du récepteur, le décodeur robuste JPWL décode les données en totalité, ou jusqu’à rencontrer une erreur qui avorte le processus de décodage. Il arrive alors que le décodeur fournisse un résultat présentant des distorsions, qui sont généralement causées par un manque de puissance sur le dernier sous-canal utilisé. La figure 5.1 illustre un cas de figure tiré des simulations du chapitre 4 (CBP optimisé fig. 4.4) où le décodeur fournit un résultat sousoptimal autant objectivement (PSNR et score SSIM) que subjectivement. (a) Couche 1 : PSNR = 33,73dB ; SSIM = 0,899 (c) Couche 1+2+3 : PSNR = 39,08dB ; SSIM = 0,955 Résultat présentant la meilleure qualité objective et subjective (b) Couche 1+2 : PSNR = 37,43dB ; SSIM = 0,941 (d) Couche 1+2+3+4 : PSNR = 28,53dB ; SSIM = 0,923 Résultat fourni par le décodeur JPWL robuste avec les 4 couches décodées Figure 5.1. Décodage sous-optimal de l’image « Caps1615 » 119 CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE Nous pouvons donc distinguer plusieurs configurations de décodage en réception, fournissant chacune un PSNR ou un score SSIM que l’on peut confronter. On peut mettre en évidence un nombre de cas non négligeable dans lesquels le PSNR ou le score SSIM de l’image reçue (noté PSNRreçu ou SSIMreçu) est inférieur au PSNR ou au score SSIM maximal atteignable correspondant au meilleur score parmi toutes les configurations de décodage possible en réception (noté PSNRmax ou SSIMmax). Les figures 5.2 et 5.3 montrent les cas de figure obtenus lors des simulations sur canal réaliste du chapitre 4, où le score reçu est différent du score maximal atteignable. Zone 1 40 Zone 2 Zone 3 Zone 4 PSNR en dB 35 30 PSNRmax PSNRreçu 25 0 500 1000 1500 Position sur la trajectoire du récepteur (×λ) 2000 Figure 5.2. Cas de décodage sous-optimal en termes de PSNR pour l’image « Caps » Zone 1 Zone 2 Zone 3 Zone 4 1 0.95 0.9 Score SSIM 0.85 0.8 0.75 0.7 0.65 SSIMmax SSIMreçu 0.6 0.55 0.5 0 500 1000 1500 Position sur la trajectoire du récepteur (×λ) 2000 Figure 5.3. Cas de décodage sous-optimal en termes de score SSIM pour l’image « Caps » 120 CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE Le tableau 5.1 résume la fréquence d’apparition de ces cas de figure, et la perte moyenne (l’écart) entre le score maximal et le score reçu lorsque ces cas se présentent. Fréquence d’apparition des cas où PSNRreçu < PSNRmax Perte moyenne Fréquence d’apparition des cas où SSIMreçu < SSIMmax Perte moyenne MAUVAISES CONDITIONS BONNES CONDITIONS MOYENNES CONDITIONS Zone 1 Zones 2 et 4 Zone 3 1,22 % 11,33 % 16,15 % 1,30dB 0,73dB 0,47dB 1,68% 16,29% 24,35% 0,064 0,028 0,014 Tableau 5.1. Analyse des cas de décodage sous-optimal pour les images « Caps » et « Monarch » En étudiant les figures 5.2, 5.3 ainsi que le tableau 5.1, on constate qu’il y a très peu de cas de figure problématiques lorsque les conditions de transmission sont mauvaises (1,22% pour le PSNR et 1,68% pour SSIM). Cela s’explique par le fait que lorsque les conditions sont mauvaises, on n’utilise généralement que les premiers sous-canaux (le premier et le second, voir fig. 4.8). Or, le fait d’utiliser peu de sous-canaux implique d’être plus robuste aux évanouissements fréquentiels qui touchent en premier lieu les sous-canaux d’indice important (sous-canal trois et quatre). De ce fait, il y a très peu de cas de figure où la puissance allouée n’est pas suffisante pour décoder correctement la dernière couche transmise. Néanmoins, lorsqu’un cas de figure apparaît, la perte moyenne sur la qualité est relativement importante (1,30dB en termes de PSNR et 0,064 sur le score SSIM) car elle touche la première couche d’amélioration qui contient des détails visuellement significatifs. A mesure que les conditions s’améliorent sur le canal de transmission, notre stratégie utilise le troisième sous-canal (zones 2 et 4) puis le quatrième sous-canal (zone 3). Toutefois, l’augmentation du nombre de souscanaux utilisés est synonyme d’une plus grande sensibilité aux évanouissements fréquentiels. De ce fait, nous constatons une augmentation des cas de figure où le score reçu est inférieur au score maximal atteignable (de 11,33% à 16,15% en PSNR et de 16,29% à 24,35% pour SSIM). Toutefois, malgré l’augmentation du nombre de cas de décodage sous-optimal, nous remarquons que l’impact sur la qualité diminue (de 0,73dB à 0,47dB en PSNR et de 0,028 à 0,014 pour SSIM). Cela s’explique par le fait que le saut en qualité entre les couches décroît à mesure que l’on décode des couches d’indice élevé. Enfin, nous remarquons qu’il existe une différence entre les fréquences d’apparition des cas de décodage sous-optimal suivant la métrique considérée. Effectivement, la métrique SSIM présente un plus grand nombre de cas que la métrique PSNR. Cela provient du fait qu’il arrive fréquemment que malgré la présence de distorsions portées par la dernière couche, le PSNR reçu correspond tout de même au meilleur PSNR parmi toutes les configurations de décodage possibles. La métrique SSIM est beaucoup plus sévère car lorsqu’elle détecte une distorsion, elle pénalise suffisamment le score de l’image reçue de sorte qu’il ne représente plus le score SSIM maximal. Cette analyse met donc en avant une divergence dans l’appréciation des distorsions entre les deux métriques objectives utilisées. Pour résumer, lorsque les conditions de transmission sont mauvaises les cas de décodage sous-optimal sont rares mais présentent un impact important. A mesure que les 121 CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE conditions sur le canal de transmission s’améliorent, les cas de décodage sous-optimal se multiplient mais leur impact sur la qualité diminue. Cette analyse de cas met ainsi en avant le fait qu’il peut être plus judicieux du point de vue de la QoE, de s’abstenir de décoder la dernière couche de qualité dans certains cas de figure. Il est toutefois nécessaire d’intégrer un organe de décision qui doit être à même de capter l’expérience de l’utilisateur afin d’assister le décodeur vers la meilleure configuration de décodage. Cet organe de décision doit reposer sur une métrique de qualité appropriée. 5.3 Les métriques de qualité On dispose de deux méthodes afin d’évaluer la qualité des images numériques. La première consiste à effectuer des tests subjectifs dans lesquels un panel d’observateurs donne leur avis sur la qualité des images ou des vidéos présentées, comme c’est le cas dans [130] pour des vidéos H.264. Bien qu’il s’agisse de la méthode la plus fiable au sens du système visuel humain afin d’évaluer la qualité d’une image, elle est néanmoins délicate à mettre en place, coûteuse en temps et en argent. La seconde méthode permettant d’évaluer la qualité des images consiste à utiliser des mesures objectives. Il existe une grande variété de métriques objectives de qualité. Leur nombre ne cesse d’ailleurs d’augmenter compte tenu de l’effervescence actuelle dans le domaine de l’évaluation de la qualité [131] et de la prise en compte du SVH [132-134] dans cette tâche. Les métriques de qualité peuvent être classées en trois catégories basées sur la référence utilisée pour évaluer la qualité de l’image [123]. Les métriques à référence complète Les métriques à référence complète nécessitent d’avoir accès à l’image originale afin d’évaluer la qualité de l’image test. Ce type de métrique est très utilisé dans le contexte des transmissions d’image afin d’évaluer la robustesse des algorithmes ou des stratégies mises en œuvre. Le PSNR et le score SSIM sont des exemples connus et très utilisés. Toutefois, ce type de métrique ne peut pas être utilisé comme organe de décision dans le cadre de la stratégie envisagée car nous n’avons pas accès à l’image originale au niveau du récepteur. Les métriques sans référence A l’inverse des métriques à référence complète, les métriques sans référence ne nécessitent strictement aucune information issue de l’image originale afin d’évaluer la qualité de l’image test. Bien que cette tâche soit facile pour l’homme, c’est une tâche très complexe pour les machines. Ainsi, l’absence de référence permet d’utiliser ce type de métrique dans le cadre d’une stratégie de transmission. Cependant, la complexité de l’évaluation de la qualité en réception peut être une barrière à son intégration dans une application pratique. Pour plus d’information sur les principales métriques sans référence, nous renvoyons le lecteur vers [135]. Les métriques à référence réduite Les métriques à référence réduite exploitent une information tirée de l’image originale. Cette information - appelée référence réduite - est alors utilisée après une opération quelconque (compression, transmission, tatouage, etc.) afin d’évaluer la qualité de l’image. Ce type de métrique est particulièrement intéressant dans le cadre d’une stratégie de transmission car il est tout à fait envisageable de transmettre la référence réduite avec l’image pour une évaluation en réception. La taille de la référence réduite ne doit toutefois pas être prohibitive au regard des ressources utilisée pour la transmission, et doit également être protégée pour une évaluation fiable de la qualité au niveau du récepteur. Le lecteur trouvera une description des principales métriques à référence réduite dans [135]. 122 CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE 5.4 Solution proposée Dans le cadre du projet CAIMAN, une métrique à référence réduite, appelée QIP71, a été crée au département SIC de l’institut XLIM. Nous avons utilisé cette métrique afin de traiter la problématique liée à la QoE. Ce choix se justifie tout d’abord par la taille de la référence réduite qui, comme nous allons le voir, est négligeable et donc parfaitement adaptée dans un contexte de transmission. De plus, cette métrique s’appuie sur des contraintes psychovisuelles afin d’évaluer la qualité des images. Enfin, de par son fonctionnement basé sur les variations du nombre de points de saillance visuelle dans l’image (point attirant l’œil, également appelé point d’intérêt), elle est parfaitement adaptée aux distorsions caractéristiques de JPEG 2000 et JPWL. Nous préciserons ce propos après avoir présenté la métrique QIP. 5.4.1 La métrique à référence réduite QIP La métrique QIP a été récemment introduite dans [136]. Son fonctionnement repose sur l’analyse des points d’intérêt afin de prédire une variation entre l’image originale et l’image test. Les points d’intérêt sont liés aux points de saillance visuelle, c’est-à-dire les points qui attirent naturellement l’œil humain. La figure 5.4 présente le fonctionnement sur lequel repose la métrique QIP. Côté Côté émetteur récepteur Image originale Image test Construction du masque Information réduite : Série de bits Reconstruction du masque Détection des points d’intérêt (Harris) Détection des points d’intérêt (Harris) Masque d’activité Masque d’activité Masque d’activité Nombre de points d’intérêt par région de haute activité (NHA) Nombre de points d’intérêt par région de haute activité (NHA) Nombre de points d’intérêt par région de faible activité (NFA) Nombre de points d’intérêt par région de faible activité (NFA) Prédiction de la qualité Qualité perçue Figure 5.4. Organigramme de la métrique à référence réduite QIP La métrique décompose l’image originale en 12×12 partitions égales (bon compromis entre précision du découpage et le nombre de régions pour des images de 768×512 pixels [136]) sur lesquelles un détecteur de points d’intérêt de Harris [136] est appliqué. Ce détecteur fournit ainsi le nombre de point d’intérêt dans chaque région. Chacune de ces régions est alors classée en termes de saillance visuelle (HA : Haute Activité ou FA : Faible 71 Quality by Interest Points 123 CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE Activité). Une région de haute activité est typiquement une zone de détails alors qu’une région de faible activité représente une zone de l’image relativement homogène. Cette distinction en région d’activité se base sur le fait que, d’un point de vue psychovisuel, une erreur dans une zone de haute activité est susceptible d’être moins perceptible qu’une erreur dans une zone de faible activité. On détermine ensuite le nombre total de points d’intérêt dans les régions de faible activité (NFA) ainsi que le nombre total de points d’intérêt dans les régions de haute activité (NHA). La référence réduite est alors constituée des deux entiers NHA et NFA codés sur 2 octets chacun, et du masque d’activité codé sur 18 octets (12×12 bits) qui cartographie les régions de haute et faible activité. Au total, la référence réduite ne fait que 22 octets, ce qui est négligeable au regard de la taille des images transmises (environ 0,09% des images 768×512 pixels, compressées suivant la configuration de base définie dans le §4.6.1.1). En réception, la référence réduite est exploitée afin d’appliquer le masque d’activité sur l’image reçue. Le détecteur de Harris est appliqué afin de déterminer le nombre de points d’intérêt dans les régions de haute et faible activité. Ces nouvelles valeurs sont comparées aux valeurs contenues dans la référence réduite. Une étape de prédiction de la qualité, qui permet en outre de pondérer l’impact des variations des points d’intérêt suivant la nature des régions d’activité, permet alors d’assigner un score entre 0 (très mauvaise qualité) et 1 (excellente qualité). 5.4.2 Intégration de QIP dans la stratégie de transmission Au cours d’une transmission sur le canal sans fil, le nombre de points d’intérêt dans une zone touchée par des erreurs de transmission va varier, affectant le score issu de la métrique QIP. Nous pouvons ainsi attribuer un score grâce à la métrique QIP correspondant à chaque configuration de décodage et fournir au récepteur la configuration qui maximise le score QIP. QIP agit ainsi en tant qu’organe de décision pour assister le décodeur JPWL vers la configuration de décodage qui maximise la QoE. La figure 5.5 illustre la procédure pour un cas de figure présentant trois couches de qualité. Codage JPWL issu de l’optimisation Transmission à travers le canal MIMO Canal sans fil + référence réduite QIP Décodage JPWL robuste de toutes les configurations Evaluation QIP Couche 1 0,88 Couche 1+2 0,92 Résultat fourni à l’utilisateur PSNR = 34,85dB SSIM = 0,943 Couche 1+2+3 0,23 Figure 5.5. Stratégie de transmission intégrant QIP pour un cas de figure « extrême » à trois couches de qualité 124 CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE Après acquisition de la CSI, notre stratégie détermine la meilleure configuration de codage/transmission. Lors du codage de l’image via le codeur JPWL, nous générons la référence réduite QIP qui sera par la suite transmise avec la couche de base sur le premier sous-canal. Après transmission sur le canal, QIP est utilisée comme un sélectionneur de couche de qualité capable de détecter une réduction de la qualité perçue pendant le décodage d’une nouvelle couche de qualité JPWL. Nous décodons toutes les configurations possibles avec le décodeur robuste JPWL. Chaque configuration est évaluée par QIP qui assigne un score entre 0 (très mauvaise qualité) et 1 (excellente qualité). Nous retenons évidemment la configuration présentant le meilleur score QIP. 5.4.3 Remarques sur l’utilisation de QIP dans le cadre de la stratégie de transmission Comme nous l’avons montré, la métrique QIP repose sur l’analyse des variations des points de saillance visuelle dans l’image. Ce fonctionnement est particulièrement adapté afin de capter les distorsions typiques de JPWL. Comme nous pouvons le voir sur les figures 5.6 (a), (b), (c) et (d), les distorsions de JPWL ont tendance à augmenter significativement le nombre de points d’intérêt dans les zones touchées. Il est donc tout à fait cohérent d’utiliser une métrique qui exploite la variation des points d’intérêt pour prédire la qualité des images. (a) PSNR = 28,82dB ; SSIM = 0,803 (c) PSNR = 26,22dB ; SSIM = 0,785 (b) PSNR = 30,45dB ; SSIM = 0,779 (d) PSNR = 23,44dB ; SSIM = 0,732 Figure 5.6. Distorsions typiques de JPWL 125 CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE QIP est conçu à l’origine pour évaluer les variations entre une image originale et une image test ayant subi une opération dégradant plus ou moins la qualité (compression, transmission, tatouage, etc.). Dans le cadre de notre stratégie de transmission, la métrique ne doit pas nécessairement être générée par rapport à l’image originale. En effet, elle peut être générée par rapport à l’image présentant la meilleure qualité après compression (composée de toutes les couches de qualité sans erreur). Dans un contexte de transmission, ce choix est plus logique étant donné que l’évaluation en réception a pour but de choisir entre différentes configurations de décodage dont la qualité maximale ne peut être supérieure à l’image compressée composée de toutes les couches de qualité sans erreur de transmission. De ce fait, l’image composée de toutes les couches de qualité sans erreur se voit attribuer un score de 1. Indépendamment de l’aspect lié à la qualité, nous disposons alors d’un outil indiquant si l’image a subi des erreurs de transmission, dans le cas où le score de l’image reconstituée est différent de 1. De la même manière, le décodage peut être simplifié car il n’est pas nécessaire de décoder toutes les configurations possibles si le score QIP est égal à 1 en réception. Néanmoins, ce choix implique que l’on ne peut pas comparer les images reçues pour différentes transmissions sur la base du score QIP car l’image référence est spécifique à chaque cas. Nous continuerons donc de comparer les images reçues sur la base du PSNR et du score SSIM afin de mesurer l’impact de la métrique QIP. 5.5 Résultats de simulation sur canal réaliste Dans cette section, nous présentons des résultats de simulation sur le canal réaliste. Nous intégrons la stratégie de décodage basée sur la métrique à référence réduite dans la stratégie d’adaptation de lien présenté dans le chapitre 4. Nous utilisons les mêmes paramètres que dans les simulations du paragraphe 4.6 afin de montrer l’impact de la stratégie de décodage sur les résultats présentés précédemment. La référence réduite est protégée et transmise avec la couche de qualité de base sur le premier sous-canal SISO. 5.5.1 Analyse objective Les figures 5.7 et 5.8 montrent les performances de la stratégie d’adaptation de lien avec ou sans stratégie de décodage pour les images « Caps » et « Monarch ». Ces figures ne représentent que les cas de figure où le score de qualité fourni par le décodeur JPWL (PSNRreçu et SSIMreçu) est différent du score de qualité obtenu via la stratégie de décodage (PSNRQIP et SSIMQIP) basée sur la métrique QIP. Le tableau 5.2 renseigne sur les performances moyennes en fonction des conditions de transmission. On rappelle que le PSNR moyen et le score SSIM moyen sont déterminés uniquement à partir des cas qui vérifient la condition PSNRreçu ≠ PSNRQIP (ou SSIMreçu ≠ SSIMQIP). En observant les courbes de PSNR, nous pouvons faire deux principales constatations. Tout d’abord, la stratégie de décodage basée sur QIP permet d’éliminer les cas de figure où le PSNR reçu est nettement dégradé. Cette observation traduit la capacité de la métrique QIP à capter les cas de figure où des distorsions semblent importantes. Ces cas de figure semblent donc aller dans le sens de la QoE. Dans un second temps, nous observons une quantité non négligeable de cas où la métrique QIP sélectionne une configuration qui présente un PSNR inférieur au PSNR fourni par le décodeur JPWL sans stratégie de décodage. Par conséquent, il ne se dégage pas une supériorité évidente de la stratégie de décodage en termes de PSNR moyen (tab. 5.2). Nous rappelons que les cas traités sur les courbes contiennent obligatoirement des erreurs (score QIP ≠ 1) qui sont plus ou moins marquées. Ainsi des 126 CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE distorsions présentant un faible impact du point de vue de l’erreur quadratique moyenne, sont jugées plus sévèrement par la métrique QIP qui indique au décodeur de ne pas prendre en compte la dernière couche de qualité. Ces cas de figure ne permettent donc pas de savoir de manière objective si la décision prise va dans le sens de la QoE. Nous sommes donc typiquement dans des cas de figure nécessitant une évaluation subjective de la qualité. 40 1 38 0.95 0.9 Score SSIM PSNR en dB 36 34 32 0.85 0.8 30 PSNRreçu PSNRQIP 28 26 0 SSIMreçu SSIMQIP 0.75 0.7 500 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) 0 500 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) Figure 5.7. Comparaison des performances de la stratégie d’adaptation de lien avec ou sans stratégie de décodage pour l’image « Caps » 38 1 36 0.95 0.9 34 Score SSIM PSNR en dB 0.85 32 30 28 0.8 0.75 0.7 0.65 26 PSNRreçu PSNRQIP 24 22 0 500 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) 0.6 SSIMreçu SSIMQIP 0.55 0.5 0 500 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) Figure 5.8. Comparaison des performances de la stratégie d’adaptation de lien avec ou sans stratégie de décodage pour l’image « Monarch » Si l’on fait le parallèle avec les courbes de score SSIM, nous constatons la même tendance concernant les valeurs « extrêmes » de score SSIM reçu, qui sont captées par la métrique QIP. Toutefois, on remarque que les cas de figure où le score SSIM issu de la stratégie de décodage est inférieur au score SSIM fourni par le décodeur JPWL, sont moins nombreux. Cette constatation indique que la métrique QIP sélectionne des configurations de décodage qui respectent mieux la structure de l’image. Les performances en termes de score SSIM moyen fournit dans le tableau 5.2 vont dans ce sens. Ainsi, les meilleures performances moyennes sont systématiquement fournies par la stratégie utilisant QIP. 127 CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE MAUVAISES CONDITIONS CONDITIONS MOYENNES Zone 1 Zones 2 et 4 Sans QIP Avec QIP Sans QIP Avec QIP PSNR moyen Caps PSNR moyen Monarch SSIM moyen Caps SSIM moyen Monarch BONNES CONDITIONS Zone 3 Sans QIP Avec QIP 30,15dB 29,99dB 32,76dB 32,84dB 37,26dB 37,38dB 25,12dB 25,52dB 29,23dB 29,53dB 34,78dB 34,37dB 0,769 0,815 0,857 0,887 0,931 0,938 0,789 0,813 0,865 0,887 0,929 0,937 Tableau 5.2. Performances moyennes en fonction des conditions de transmission 12 10 8 6 4 2 0 -2 -4 0 500 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) Impact de la stratégie de décodage sur le score SSIM Impact de la stratégie de décodage sur le PSNR Les figures 5.9 et 5.10 permettent de quantifier l’écart (gain ou perte défini par PSNRQIP-PSNRreçu et SSIMQIP-SSIMreçu) sur le score de qualité (PSNR ou SSIM) correspondant aux figures 5.7 et 5.8. Les tableaux 5.3 et 5.4 apporte une analyse statistique pour ces figures. 0.3 0.25 0.2 0.15 0.1 0.05 0 -0.05 -0.1 0 500 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) Figure 5. 9. Impact de la stratégie de décodage basée QIP pour l’image « Caps » RESULTAT POUR L’IMAGE « CAPS » Pourcentage de cas favorable/défavorable Ecart moyen Impact positif sur le PSNR Impact négatif sur le PSNR 48,16% 51,84% +0,57dB -0,35dB Impact positif sur SSIM Impact négatif sur SSIM 63,88% 36,12% +0,017 -0,005 Tableau 5.3. Statistiques sur l’impact de la stratégie de décodage pour l’image « Caps » 128 12 10 8 6 4 2 0 -2 -4 0 500 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) Impact de la stratégie de décodage sur le score SSIM Impact de la stratégie de décodage sur le PSNR CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE 0.3 0.25 0.2 0.15 0.1 0.05 0 -0.05 -0.1 0 500 1000 1500 2000 Position sur la trajectoire du récepteur (×λ) Figure 5.10. Impact de la stratégie de décodage basée QIP pour l’image « Monarch » RESULTAT POUR L’IMAGE « MONARCH » Pourcentage de cas favorable/défavorable Ecart moyen Impact positif sur le PSNR Impact négatif sur le PSNR 40% 60% +0,55dB -0,73dB Impact positif sur SSIM Impact négatif sur SSIM 67,62% 32,38% +0,021 -0,005 Tableau 5.4. Statistiques sur l’impact de la stratégie de décodage pour l’image « Monarch » Dans le tableau 5.4, le pourcentage de cas favorable ou défavorable est déterminé uniquement sur la base des cas où PSNRQIP ≠ PSNRreçu ou SSIMQIP ≠ SSIMreçu. Ces résultats confirment l’impact modéré de notre stratégie de décodage si l’on se place du point de vue de l’erreur quadratique moyenne (PSNR). En effet, l’impact sur le PSNR est globalement négatif avec 51,85% des cas pour « Caps » et 60% des cas pour « Monarch ». On constate également des résultats qui ne sont pas identiques entre les deux images. Cette constatation indique que le contenu de l’image présente un impact sur l’efficacité de la stratégie de décodage au sens de l’erreur quadratique. Ce n’est cependant pas le cas de la métrique SSIM qui présente globalement des résultats similaires quelle que soit l’image. Ainsi, l’impact sur le score SSIM est positif dans environ 65% des cas avec des gains moyens (de l’ordre de 0,02) relativement plus important que les pertes moyennes (-0,005). Pour résumer, nous constatons que la métrique QIP est efficace afin d’éliminer les cas aberrants. On remarque également que la métrique QIP est sévère avec les distorsions impliquant une faible erreur quadratique et qu’elle favorise les configurations de décodage qui respectent mieux la structure de l’image. Ces résultats pointent ainsi une différence dans l’appréciation des distorsions qui ne peut être tranchée que par des tests subjectifs. 129 CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE 5.5.2 Analyse visuelle Les figures 5.11 à 5.14 proposent une analyse visuelle de cas où l’on peut comparer des images fournies selon un mode de décodage classique (fig. 5.11 (a), fig. 5.12 (a), fig. 5.13 (a) et fig. 5.14 (a)) face à des images décodées à l’aide de la stratégie de décodage basée sur QIP (fig. 5.11 (b), fig. 5.12 (b), fig. 5.13 (b) et fig. 5.14 (b)). Les images présentent volontairement un format important afin d’aider le lecteur à se faire une opinion sur la qualité respective de chacune d’elles. Nous pouvons distinguer trois types de résultats. Le premier type est constitué par des cas de figure où des distorsions grossières sont présentes sur l’image comme c’est le cas pour les figures 5.11 (a) et 5.12 (a). Dans ces exemples, la dernière couche de qualité est porteuse d’erreurs de transmission qui se traduisent au décodage en distorsions visuellement gênantes. La métrique QIP détecte ces erreurs et indique au décodeur de ne pas prendre en compte la dernière couche de qualité, obtenant ainsi des images d’une qualité supérieure. Pour ces deux cas de figure, nous constatons que les métriques PSNR et SSIM vont dans le même sens que QIP, en attribuant de meilleurs scores à la configuration indiquée par QIP. On peut ainsi vraisemblablement penser que ce choix maximise la QoE de l’utilisateur. La seconde étude de cas porte sur l’image « Monarch780 » (fig. 5.13). Cet exemple porte sur une image constituée de trois couches de qualité. Le décodage JPWL classique (fig. 5.13 (a)) exploite toutes les couches de qualité. On peut alors apercevoir de très légères distorsions dans le coin supérieur droit de l’image. La métrique QIP capte ces distorsions et indique de ne pas décoder la dernière couche, ce qui induit une perte de détail sur l’ensemble de l’image (fig. 5.13 (b)), mais également la suppression de ces légères distorsions. Dans le cas de figure présenté, la configuration sélectionnée par QIP n’est validée par aucune des deux autres métriques (PSNR et SSIM). Il est assez difficile de se faire une opinion sur ce cas sur la seule base des métriques de qualité objectives, car malgré la perte sur le PSNR et le score SSIM, la version présentée par QIP peut être recevable du point de vue de la QoE. Seule une validation visuelle (subjective) serait en mesure de nous donner des indications allant en ce sens. La dernière étude de cas porte sur l’image Caps1012. Ce cas est particulièrement intéressant car la version de l’image issue du décodage JPWL classique (fig. 5.14 (a)) contient des distorsions qui altèrent violemment la structure de l’image. La métrique QIP détecte les distorsions et indique de ne pas décoder la dernière couche ce qui donne un résultat moins détaillé (fig. 5.14 (b)) mais sans les distorsions présentes sur la figure 5.14 (a). Le choix de la stratégie de décodage est justifié au sens de la métrique SSIM, par contre la configuration présentée par QIP présente un PSNR inférieur à la configuration classique. La différence entre ces deux versions de l’image n’est que de 0,56dB alors que visuellement, la différence est importante. On est typiquement dans un cas de figure où le PSNR montre ses limites en attribuant un score quasiment équivalent à deux images de qualité différentes. Finalement, nous constatons que lorsque la stratégie de décodage entraîne un gain en termes de PSNR et de score SSIM, il y a de fortes chances que ce choix aille dans le sens de la QoE. Par contre, lorsque QIP entraîne une baisse du score attribué par ces métriques, cela ne met pas forcément en avant de mauvaises performances de la stratégie de décodage. Nous sommes alors confrontés à un choix entre plusieurs configurations, recevables du point de vue de la QoE, qui ne peut être validé ou infirmé que par des tests dits subjectifs. 130 CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE (a) Décodage classique - Caps1567 : PSNR = 28,03dB ; SSIM = 0,908 (b) Décodage avec QIP - Caps1567 : PSNR = 38,76dB ; SSIM = 0,953 Figure 5.11. Analyse visuelle de l’impact de la stratégie de décodage pour « Caps1567 » 131 CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE (a) Décodage classique - Monarch886 : PSNR = 23,42dB ; SSIM = 0,680 (b) Décodage avec QIP - Monarch886 : PSNR = 28,09dB ; SSIM = 0,869 Figure 5.12. Analyse visuelle de l’impact de la stratégie de décodage pour « Caps886 » 132 CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE (a) Décodage classique - Monarch780 : PSNR = 31,23dB ; SSIM = 0,892 (b) Décodage avec QIP - Monarch780 : PSNR = 27,54dB ; SSIM = 0,858 Figure 5.13. Analyse visuelle de l’impact de la stratégie de décodage pour « Monarch780 » 133 CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE (a) Décodage classique - Caps1012 : PSNR = 30,23dB ; SSIM = 0,771 (b) Décodage avec QIP - Caps1012 : PSNR = 29,67dB ; SSIM = 0,811 Figure 5.14. Analyse visuelle de l’impact de la stratégie de décodage pour « Monarch1012» 134 CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE 5.6 Validation subjective 5.6.1 Motivations Nous rappelons que l’objectif de notre stratégie de décodage consiste à maximiser la QoE de l’utilisateur. Pour cela, nous avons proposé d’adapter la métrique à référence réduite QIP pour être utilisée dans un contexte de transmission, afin de fournir une stratégie de décodage en réception. Cependant, bien qu’elle s’appuie sur des contraintes psychovisuelles, la métrique à référence réduite QIP n’en reste pas moins une métrique de qualité objective, basée sur un algorithme. Afin de vérifier que les choix proposés par la stratégie de décodage vont dans le sens de la QoE de l’utilisateur, il est indispensable de se confronter au jugement subjectif humain. Cette validation subjective doit permettre de tester la pertinence des choix de la métrique QIP dans le cadre de la stratégie de transmission. Cette étude permettra également d’apporter une réponse à certains cas problématiques où QIP contredit le PSNR ou le score SSIM. Ce n’est qu’après validation statistique que l’on pourra affirmer ou non, que la stratégie proposée maximise la QoE. 5.6.2 Protocole de test 5.6.2.1 Base d’images Pour les besoins des tests, nous devons utiliser des images représentatives. A ce titre nous utilisons les images « Caps », « House » et « Monarch » (fig. 5.15) avec une résolution de 768×512 pixels, très différentes par leur contenu. (a) (b) (c) Figure 5.15. Base d’images utilisée : (a) Caps, (b) House et (c) Monarch 135 CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE Nous avons choisi une résolution importante à l’image de l’évolution des technologies qui favorisent les images de grande dimension. L’image « Caps » (fig. 5.15 (a)) a été choisie car elle n’est pas « très détaillée » et met en scène des couleurs vives qui interpellent la vision humaine. A l’inverse, l’image « House » (fig. 5.15 (b)) a été choisi car elle comporte beaucoup plus de détail avec des couleurs plus neutres. Enfin, l’image « Monarch » (fig. 5.15 (c)) fournit un contraste intéressant entre un fond flou et un premier plan détaillé. De plus, la zone d’intérêt dans cette image est bien marquée (le papillon et quelques fleurs) ce qui permet d’évaluer l’impact des distorsions sur des zones d’importance visuelle différentes en termes d’information. Cet ensemble d’images présente donc une variété intéressante malgré le faible nombre d’images utilisées. De plus, l’expérience générant des milliers de résultat par image et étant par nature très chronophage, nous devons limiter le nombre d’images utilisées. Les images ont été transmises à travers le canal réaliste avec la stratégie d’adaptation de lien conformément au paramétrage défini dans le paragraphe 4.6. Les images ont ensuite été décodées à l’aide du décodeur JPWL robuste ainsi qu’avec la stratégie de décodage basée sur la métrique QIP. La base d’images a alors été constituée uniquement à partir des cas où la stratégie de décodage fournit un résultat différent du décodeur JPWL en l’absence de stratégie. Il n’est effectivement pas intéressant de retenir les cas de figure où le décodeur JPWL et la stratégie de décodage convergent vers un résultat équivalent. La base d’images comprend ainsi 765 images. 5.6.2.2 Panel d’observateurs Dix-sept observateurs non-experts de la thématique ont participé à la campagne d’évaluation. Ce nombre est conforme à l’exigence minimale mentionnée dans [137], après rejet des observateurs/observations aberrants. Le panel de participants est constitué de sept femmes et dix hommes pour la plupart étudiants, présentant une moyenne d’âge de 25 ans. Sachant que les jeunes représentent la majorité des utilisateurs des nouvelles technologies, il est souvent recommandé par les différentes instances d’évaluation d’avoir un panel relativement jeune, hormis pour des études spécifiques. 5.6.2.3 Présentation des images L’expérience psychovisuelle se déroule en trois étapes. Tout d’abord, on effectue une collecte des informations personnelles de l’observateur puis de celui-ci passe des tests d’acuité visuelle et de vision des couleurs. Par la suite, le test est expliqué aux observateurs afin qu’ils comprennent sa finalité. Ainsi, un discours unique est lu lors de la phase d’entraînement indispensable afin d’appréhender le test. Les participants sont alors invités à poser toutes les questions en cas de besoin avant de commencer le test. L’évaluation proprement dite consiste à présenter aux participants, les 765 images dans un ordre aléatoire. La présentation est faite selon un protocole strict. Les images sont affichées comme le montre la figure 5.16. L’idée consiste à demander à l’observateur de comparer deux images issues du décodage à une couche de qualité de différence. Par exemple, une image issue du décodage de la première et la seconde couche est comparée au décodage de l’image avec trois couches de qualité. La position des images est aléatoire et l’observateur ne dispose naturellement pas de cette information, afin d’éviter un phénomène d’habitude. Le temps d’évaluation de chaque couple d’image n’est pas fixé. Pour limiter la 136 CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE fatigue visuelle, l’application comporte un compteur obligeant l’observateur à s’arrêter toutes les vingt minutes. Figure 5.16. Interface développée pour le test subjectif La notation se fait sur une échelle discrète composée de deux parties (une pour chaque image). Si les deux images présentent une qualité similaire, l’observateur peut choisir le qualificatif « équivalente ». Dans le cas où une des images présente une meilleure qualité, trois gradations sont possibles : « légèrement meilleure », « meilleure » et « bien meilleure ». 5.6.3 Analyse des résultats Dans cette section, nous présentons les résultats issus de la campagne d’évaluation subjective. Les résultats sont donnés tout d’abord dans leur forme globale. Dans un second temps, nous étudierons les résultats par image afin de constater l’impact du contenu. La figure 5.17 montre la proportion de cas où le choix des utilisateurs correspond à la configuration proposée par la stratégie de décodage basée sur QIP, pour l’ensemble de la base d’images. On peut ainsi remarquer que dans la grande majorité des cas (73,63%), les observateurs sont allés dans le sens de la stratégie de décodage. Il est à noter que dans 19,55% des cas, la qualité est jugée comme étant équivalente, ce qui signifie que la stratégie ne pénalise pas la qualité de l’image perçue. Seulement 6,82% des cas de figure sont favorables au décodage initialement proposé par le décodeur robuste JPWL. Ces résultats montrent que les décisions prises par la stratégie de décodage sont corroborées par le jugement humain. Nous pouvons donc dire que la stratégie proposée va dans le sens de la QoE des utilisateurs. 137 CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE Proportion de préférences 80% 70% 60% 50% 40% 30% 20% 10% 0% Décodage JPWL classique Qualité équivalente Stratégie de décodage avec QIP Figure 5.17. Proportion de préférence des observateurs pour l’ensemble de la base d’images 50% Proportion de préférences 45% 40% 35% 30% 25% 20% 15% 10% 5% 0% Bien meilleure Meilleure Légèrement meilleure Décodage JPWL classique Qualité équivalente Légèrement meilleure Meilleure Bien meilleure Stratégie de décodage avec QIP Figure 5.18. Détail des scores moyens pour toutes les images et tous les observateurs 138 CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE La figure 5.18 détaille les résultats de la figure 5.17 en faisant ressortir les différents qualificatifs utilisés par les observateurs sur l’ensemble de la base d’image. Nous constatons ainsi que le qualificatif le plus utilisé est « légèrement meilleure » en faveur de la stratégie basée sur QIP. Ceci s’explique par le fait que les configurations de décodage sélectionnées par QIP contiennent une couche de qualité de moins (moins de détails) que les images fournies par le décodeur JPWL classique contenant des erreurs de transmission. La différence est donc jugée comme étant légère mais néanmoins le nombre d’occurrence important (48,28% des cas) indique une tendance nette des observateurs. Les observateurs préfèrent donc avoir moins de détails plutôt que les distorsions caractéristiques de JPWL. On remarque également que les observateurs jugent tout de même les images proposées par QIP comme étant « meilleure » dans 23,78% des cas ce qui constitue le second meilleur résultat. Le dernier résultat significatif concerne des qualités d’images jugées équivalentes (19,55%). On rappelle que ce qualificatif ne pénalise aucune des deux méthodes. Le score lié à ce qualificatif peut donc être additionné avec les résultats de chacune des deux méthodes. Ainsi, les trois résultats les plus significatifs, représentant 91,61% des cas, vont dans le sans de la stratégie de décodage basée sur la métrique à référence réduite QIP. La figure 5.19 détaille quant à elle les résultats pour les trois images de la base. Cette figure permet ainsi d’évaluer l’impact du contenu des images sur les résultats. 55% Proportion des préférences 50% 45% 40% 35% 30% Caps 25% House 20% Monarch 15% 10% 5% 0% Bien meilleure Meilleure Légèrement Qualité Légèrement Meilleure meilleure équivalente meilleure Décodage JPWL classique Bien meilleure Stratégie de décodage avec QIP Figure 5.19. Détail des scores moyens par image pour tous les observateurs On constate globalement que la nature du contenu influence relativement peu le choix des observateurs. On retrouve ainsi un comportement similaire au comportement moyen pour les images « House » et « Monarch ». La seule différence avec le comportement moyen concerne l’image « Caps » qui présentent un peu plus de cas « légèrement meilleur » en faveur du décodage classique JPWL à savoir 9,48% des cas (environ deux fois plus que pour 139 CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE les autres images). De la même manière, on dénombre plus de cas présentant une qualité équivalente pour cette image (27,24%). L’augmentation de ces deux catégories se fait au détriment des cas jugés meilleurs pour la stratégie de décodage avec QIP (14% des cas). Toutefois malgré ces variations, la stratégie de décodage basé sur QIP va dans le sens des observateurs dans 61,22% des cas (88,46% en comptant les cas équivalents). Bien que ces résultats soit encourageants, les tests mériteraient d’être confirmées sur un plus grand nombre d’images. 5.7 Synthèse et conclusion A l’issue du chapitre précédent, nous disposions d’une stratégie de transmission optimale du point de vue de la QoS, relativement aux paramètres considérés. Néanmoins, nous avons mis en évidence des cas de figure ne maximisant pas la qualité de l’expérience de l’utilisateur. Ce dernier chapitre constitue donc une ouverture vers le concept de QoE. Après avoir décrit la problématique qui se pose en réception d’une image hiérarchisée en couches de qualité, nous avons suggéré d’employer la métrique à référence réduite QIP qui intègre des contraintes psychovisuelles afin d’évaluer la qualité des différentes configurations de décodage en réception. La référence réduite nécessaire à l’évaluation des images en réception présente l’avantage d’avoir un coût relativement minime (seulement 22 octets) et peut donc être transmise avec la couche de base. Les résultats de simulation sur le canal réaliste avec la stratégie d’adaptation de lien, ont montré que QIP est efficace afin d’écarter les cas de figure aberrants au sens du PSNR ou du score SSIM. Nous avons également vu que la stratégie de décodage permet de préserver la structure des images (amélioration globale suivant le score SSIM) mais que du point de vue de l’erreur quadratique moyenne (PSNR), les gains ou les pertes sont à relativiser. Toutefois, l’analyse visuelle a mis en évidence que les critères objectifs utilisés (PSNR et SSIM) montrent des limites et ne reflètent pas toujours la qualité visuelle perçue par l’utilisateur. Par conséquent, nous avons mené une campagne de tests subjectifs permettant de vérifier que la stratégie de décodage proposée sélectionne des configurations de décodage corroborées par le jugement humain. Les conclusions de ces tests ont montré de manière significative que la stratégie de décodage mise en œuvre va dans le sens de la QoE de l’utilisateur dans plus de 93% des cas. Ainsi, cette étude contribue à montrer qu’il est possible de prendre en compte l’expérience de l’utilisateur dans une chaîne de communications numériques pour un coût négligeable. De plus, le concept de QoE pousse à relativiser l’utilisation des critères objectifs usuels qui peuvent facilement être pris en défaut. Quelque soient les résultats, ils seront bons. 140 CONCLUSION ET PERSPECTIVES Cette thèse traite de la robustesse des transmissions d’images dans des environnements de transmission difficiles caractérisés par le phénomène de multitrajets (environnements urbains et suburbains), la mobilité et le bruit radioélectrique. Nous avons proposé d’exploiter la diversité spatiale du canal de transmission par le biais de la technologie MIMO, afin d’apporter de la robustesse au schéma de transmission. Nous avons considéré l’hypothèse de la connaissance de la CSI du côté de l’émetteur (MIMO en boucle fermée), ce qui permet de décomposer le canal de transmission en sous-canaux SISO virtuels, indépendants et hiérarchisés par niveau de RSB. Cette configuration permet, en outre, d’intégrer des précodeurs qui agissent comme des pré-égaliseurs, en faisant varier la puissance allouée sur chacun des sous-canaux, dans le but d’optimiser un critère pertinent. Dans le cadre de cette thèse et du projet CAIMAN, les images transmises sont issues du codeur JPWL qui intègre des outils de robustesse pour la transmission d’images sur canal sans fil. Ce codeur permet, en outre, de décomposer une image en couches de qualité hiérarchisées. La stratégie de transmission proposée repose alors sur la correspondance entre la hiérarchie des couches de qualité JPWL et celle des sous-canaux SISO. Les précodeurs MIMO permettent alors de fournir des stratégies UPA pour la transmission des couches de qualité JPWL. Après avoir évalué les performances des différents précodeurs dans le chapitre 2, nous avons pu mettre en évidence que la définition de leur problème d’optimisation respectif est incompatible avec la notion de hiérarchie de l’image. Nous avons également mis en avant le fait que qu’il n’y a pas de corrélation entre le TEB global et la qualité des images reçues. De plus, nous avons vu que les précodeurs MIMO classiques s’adaptent mal à un changement de l’ordre de la modulation ou de la capacité de correction d’un CCE. A partir de ce constat, nous avons proposé dans le chapitre 3, une méthode d’allocation de la puissance, appelé CBP, permettant de faire le lien entre la puissance, le codage canal, la modulation et les conditions sur le canal de transmission, sous une contrainte de TEB cible. Cette méthode permet en particulier de s’adapter à la sensibilité du contenu aux erreurs de transmission. Une série de simulations sur canal statistique et sur canal réaliste a permis de mettre en évidence la robustesse du schéma pour garantir une bonne qualité en réception, au regard des conditions imposées par le canal de transmission. Nous avons également monté la grande flexibilité dont fait preuve l’algorithme d’allocation de puissance face aux variations des paramètres liés à la modulation ou au codage canal. Par la suite, nous avons proposé dans le chapitre 4, une stratégie d’adaptation de lien reposant sur le précodeur CBP. L’idée était d’intégrer conjointement des stratégies UEP, UPA, de la modulation adaptative et du codage source adaptatif, en fonction de l’état du canal. Après avoir formulé le problème de minimisation de la distorsion ainsi que les contraintes du système, nous avons proposé une méthode de résolution basée sur une représentation arborescente des différentes configurations de codage/transmission. La configuration optimale correspond alors au chemin minimisant la distorsion de la source. Nous avons montré que cette méthode permettait d’améliorer, d’une part, la stabilité des 141 CONCLUSION résultats lorsque les conditions de transmission étaient mauvaises et, d’autre part, d’augmenter significativement la qualité des images reçues dans de bonnes conditions de transmission. Enfin, dans le chapitre 5, nous avons proposé d’intégrer des contraintes psychovisuelles dans la stratégie de transmission. En effet, nous avons montré que bien que la stratégie d’adaptation de lien est optimale du point de vue de la QoS, il n’en demeure pas moins que certains cas de figures ne vont pas dans le sens de la qualité de l’expérience de l’utilisateur. Nous avons ainsi présenté une stratégie de décodage basée sur l’usage de la métrique à référence réduite QIP afin d’évaluer les différentes configurations de décodage qui se présentent à l’utilisateur en réception. Une campagne de tests subjectifs devant un panel d’observateurs vient finalement corroborer les décisions prises par la stratégie de décodage dans plus de 93% des cas. A l’issue de ces tests, nous pouvons donc affirmer que la stratégie de transmission va dans le sens de la qualité de l’expérience de l’utilisateur. Différentes perspectives peuvent être suggérées à partir des travaux décrits dans ce manuscrit de thèse. Concernant le précodeur CBP, il pourrait être intéressant d’intégrer d’autres types de codes correcteurs d’erreurs comme les codes LDPC par exemple. De la même manière, on pourrait envisager d’autres hypothèses que l’hypothèse gaussienne dans la définition du précodeur CBP, sous réserve que la probabilité d’erreur de ces lois puisse s’exprimer en fonction des différents paramètres. La stratégie proposée a été conçue essentiellement pour assurer la robustesse via des techniques de codage conjoint. Néanmoins, des travaux intéressants sur le décodage conjoint source/canal itératif [5] [138] [139] ont permis d'améliorer notablement la qualité d'images JPEG 2000 en réception. Ces travaux pourraient être exploités de façon complémentaire avec notre stratégie, afin d'améliorer encore la robustesse du schéma global. L'association de ces stratégies pourraient aboutir, en outre, à une diminution du TEB cible ainsi qu’une augmentation de la qualité des images reçues. Une autre piste de réflexions concernent des travaux de l’équipe SYSCOM au laboratoire XLIM-SIC, qui ont commencé à aborder les problématiques liés à l’optimisation théorique de paramètres à la fois discrets (puissance) et continus (modulation, codage canal) ainsi que les problèmes liés au minimums locaux. Ces travaux pourraient alimenter l’étude théorique de la stratégie proposée. La connaissance de la CSI du côté de l’émetteur est une contrainte forte qui a mené beaucoup de travaux de recherche à limiter la taille des informations sur la voie de retour. Il serait particulièrement intéressant d’étudier l’impact d’un retour de la CSI quantifiée. Dans un tel schéma, la définition des paramètres s’effectuerait au niveau du récepteur qui ne renverrait, par exemple, que la configuration de codage/transmission ainsi qu’une CSI quantifiée. Il serait également intéressant d’évaluer la pertinence de cette stratégie pour de la transmission vidéo en temps réel. Cette évaluation nécessiterait évidemment de redéfinir certaines contraintes telles que par exemple, le délai de transmission. De plus, d’autres paramètres devraient être introduit telle que la taille des GOP72. Concernant l’aspect lié à la QoE, on pourrait dans un premier temps étendre les tests subjectifs sur une base d’images plus importante. De plus des travaux menés en parallèle de cette thèse dans le cadre du projet CAIMAN, ont mis en avant l’usage de cartes de saillance 72 Group Of Pictures 142 CONCLUSION hiérarchisées. L’idée est de décomposer l’image en plusieurs zones d’intérêt hiérarchisées au sens du SVH. La stratégie de transmission pourrait alors être adaptée pour transmettre ces zones d’intérêt à la place des couches de qualité classiques. A moyen terme, il serait intéressant d’étendre la stratégie proposée à une approche multi-utilisateurs et muli-services, faisant intervenir d’autres couches du modèle OSI73 telles que la sous-couche MAC. On aboutirait ainsi au développement d’une stratégie d’optimisation conjointe selon le concept cross-layer PHY/MAC/APPLICATION suffisamment générique, efficace, économique et compatible avec les différents services hétérogènes utilisés dans les systèmes de communications présents et à venir. 73 Open System Interconnection 143 BIBLIOGRAPHIE [1] J. G. Proakis, “Digital communications”, New-York: McGraw-Hill, 4th edition, 2000. [2] C. E. Shannon, “A Mathematical Theory of Communication”, Bell System Technical Journal, vol. 27, pp. 379-423, 623-656, Jul., Oct. 1948. [3] S. C. Chan, K. L. Ho, “A new two-dimensional cosine transform algorithm”, IEEE Transactions on Signal Processing, vol. 39, no. 2, pp. 481-485, 1993. [4] S. Mallat, “A theory for multiresolution signal decomposition: The wavelet representation”, IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 11, no. 2, pp. 674-693, 1989. [5] A. Zribi, “Décodage conjoint source/canal des codes entropiques. Application à la transmission d’images”, Thèse de doctorat de l’Université Telecom Bretagne, Dec. 2010. [6] D. A. Huffman, “A method for the construction of minimum-redundancy codes”, Proceedings of the Institute of Radio Engineering, vol. 40, no. 9, pp. 1098-1102, 1952. [7] J. J. Rissanen, G. G. Langdon, “Arithmetic coding”, IBM J. Res. Develop., vol. 23, pp. 149-162, 1979. [8] ISO/IEC DIS 10918-1. “Digital Compression and Coding of Continuous-Tone Still Image (JPEG)”, Technical report, CCITT Recommendation T.81, 1992. [9] ISO/IEC 15444-1 / ITU-T T.800, “JPEG 2000 Image Coding System: Core Coding System”, 2002. [10] ISO/IEC 15444-11:2007, “JPEG 2000 Image Coding System – part11: Wireless JPEG 2000”, May 2007. [11] F. Dufaux, “JPWL - JPEG 2000 Wireless (Part 11)”, in P. Schelkens, A. Skodras and T. Ebrahimi, editors, The JPEG 2000 Suite, Wiley, 2009. [12] F. Dufaux, G. Baruffa, F. Frescura, D. Nicholson, “JPWL - an Extension of JPEG 2000 for Wireless Imaging”, in IEEE Proc. Int. Symp. on Circuits and Systems(ISCAS), Island of Kos, Greece, May 2006. [13] F. Dufaux, G.J. Sullivan and T. Ebrahimi, “The JPEG XR Image Coding Standard”, in IEEE Signal Processing Magazine, vol. 26, no. 6, pp. 195-199, 204-204, Nov. 2009. 145 BIBLIOGRAPHIE [14] S. Lin, D. J. Costello, Jr., “Error Control Coding: Fundamentals and Applications”, 2nd edition, Prentice Hall: Englewoods Cliffs, NJ, 2004. [15] P. Elias, “Coding for noisy channels”, Proceedings of the IRE National Convention Record, vol. 3, no. 4, pp. 37-46, Mar. 1955. [16] C. Berrou, A. Glavieux, P. Thitimajhima, “Near shannon limit error correcting coding and decoding: Turbo-codes”, Proceedings of IEEE International Conference on Communications ICC’93, pp. 1067-1070, Geneva, Switzerland, May 1993. [17] A. Goldsmith, “Wireless Communications”, Cambridge, University Press, 2005. [18] B. Vrigneau, “Systèmes MIMO précodés optimisant la distance minimale : étude des performances et extension du nombre de voies”, Thèse de doctorat de l’Université de Bretagne Occidentale, Nov. 2006. [19] W. Hamidouche, “Stratégies de transmission vidéo sur un canal MIMO”, Thèse de doctorat de l’Université de Poitiers, Nov. 2010. [20] M. Paetzold, “Mobile fading channels”, Wiley, 2002. [21] J. D. Parsons, “The mobile radio propagation channel”, Wiley, 2000. [22] J. Gibson, “The communications handbook”, CRC Press, 1997. [23] R. G. Kouyoumjian, “Asymptotic high-frequency methods”, Proceedings of the IEEE, no. 53, pp. 864-876, Aug. 1965. [24] M. F. Catedra, J. Perez, F. S. Adana, O. Gutierrez, “Efficient ray-tracing techniques for three-dimensional analyses of propagation in mobile communications. Application to picocell and microcell scenarios”, IEEE Antennas Propagation Magazine, vol. 40, no. 2, pp. 15-28, Apr. 1998. [25] L. Aveneau, Y. Pousset, R. Vauzelle, M. Mériaux, “Development and Evaluations of Physical and Computer Optimizations for the UTD 3D Model”, IEEE Antennas and Propagation, Davos, Suisse, Apr. 2000. [26] G. Madi, “Optimisation d’un réseau de capteurs par techniques MIMO coopératives. Applications possibles : Smart Grid, télédetection, …”, Thèse de doctorat de l’Université de Poitiers, Mar. 2012. [27] Y. Chartois, Y. Pousset, R. Vauzelle, “A spatio-temporel radio channel characterization with 3D ray tracing propagation model in urban environment”, Proceedings of the IEEE International Symposium on Personal, Indoor and Mobile Radio Communications PIMRC’04, Barcelona, Spain, 2004. [28] F. Mora, L. Aveneau, “Optimized scanning of a visibility graph data structure for efficient ray-tracing, in ECWT’05, Paris, France, Oct. 2005. [29] IEEE Standard for Information Technology Part11. Wireless LAN Medium Access Control (MAC) and Physical Layer (PHY) Specifications Amendment: Enhancements for Higher Throughput (802.11n), 2009. 146 BIBLIOGRAPHIE [30] P. Bello, “Characterization of randomly time-variant linear channels”, IEEE Transactions on Communications, vol. 11, no. 4, pp. 360-393, 1963. [31] H. Bölcskei, A. Paulraj, “The Communications Handbook”, CRC Press, 2002. [32] B. L. Floch, M. Alard, C. Berrou, “Coded Orthogonal Frequency Division Multiplex”, IEEE Proceedings, vol. 83, no. 6, pp. 982-996, 1995. [33] O. Berder, C. Bouder, G. Burel, “Identification of frequency hopping communications”, in Proceedings of WSEAS Conference on Circuits, Systems, Communications and Computers (CSCC), pp. 3851-3856, Vouliagmeni, Greece, Jul. 2000. [34] G. Burel, C. Bouder, O. Berder, “Detection of direct sequence spread spectrum transmission without prior knowledge”, in IEEE Global Telecommunications Conference GLOBECOM’01, pp. 236-239, San Antonio (Texas), USA, Nov. 2001. [35] R. G. Vaughan, “Polarization diversity in mobile communications”, in IEEE Transactions on Vehicular Technology, vol. 39, pp. 177-186, 1990. [36] C. Pereira, Y. Pousset, R. Vauzelle, P. Combeau, “Sensitivity of the MIMO Channel Characterization to the Modeling of the Environment”, IEEE Transactions on Antennas and Propagation, vol. 57, no. 4, pp. 1218-1227, Mar. 2009. [37] I. E. Telatar, “Capacity of multi-antenna Gaussian channels”, European Transactions on Telecommunications, vol. 10, no. 6, pp. 585-595, 1999. [38] G. J. Foschini, M. J. Gans, “On limits of wireless communications in a fading environment when using multiple antennas”, Wireless Personal Communications, vol. 6, no. 3, pp. 311-335, Mar. 1998. [39] IEEE Standard for a Local and Metropolitan area networks Part16: Amendment for Physical and Medium Access Control Layers for Combined Fixed and Mobile Operation (802.11e), 2005. [40] S. Sesia, I. Toufik, M. Baker, “LTE – The UMTS Long Term Evolution – From Theory to Practice”, John and Wiley Sons, 2009. [41] A. Stanley, Y. Sun, “Space-time coding for wireless communications: an overview”, IEEE Proceedings Communications, vol. 153, no. 4, pp. 509-518, Aug. 2006. [42] V. Tarokh, N. Seshadri, A. R. Calderbank, “Space-time codes for high data rate wireless communications: Performance criterion and code construction”, IEEE Transactions on Information Theory, vol. 44, no. 2, pp. 744-765, Mar. 1998. [43] S. M. Alamouti, “A simple diversity technique for wireless communications”, IEEE Journal on Selected Areas in Communications, vol. 16, no. 8, pp. 1452-1458, Oct. 1998. [44] V. Tarokh, H. Jafarkhani, A. R. Calderbank, “Space-time block codes from orthogonal designs”, IEEE Transactions on Information Theory, vol. 45, no. 5, pp. 1456-1467, Jul. 1999. 147 BIBLIOGRAPHIE [45] M. O. Damen, K. Abed-Meraim, J.-C. Belfiore, “Diagonal algebraic space-time block codes”, IEEE Transactions on Information Theory, vol. 48, pp. 628-636, Mar. 2002. [46] H. E. Gamal, M. O. Damen, “Universal Space-Time Coding”, IEEE Transactions on Information Theory, vol. 49, no. 5, pp. 1097-1119, May 2003. [47] J.-C. Belfiore, G. Rekaya, E. Viterbo, “The Golen Code: A 2 × 2 Full-Rate Space-Time Code with Non-Vanishing Determinants”, in Proceedings of IEEE International Symposium on Information Theory, Chicago, USA, Jul. 2004. [48] G. Rekaya, “Nouvelles constructions algébriques de codes spatio-temporels atteignant le compromis multiplexage-diversité”, Thèse de doctorat de l’Ecole Nationale Supérieure des Télécommunications, Dec. 2004. [49] O. Berder, “Optimisation et stratégies d’allocation de puissance des systèmes de transmission multi-antennes”, Thèse de doctorat de l’Université de Bretagne Occidentale, Dec. 2002. [50] L. Collin, “Optimisation de systèmes multi-antennes basées sur la distance minimale”, Thèse de doctorat de l’Université de Bretagne Occidentale, Dec. 2002. [51] H. Lee, S. Park, I. Lee, “Orthogonalized spatial multiplexing for closed-loop MIMO systems”, IEEE Transactions on Communications, vol. 55, pp. 1044-1052, 2007. [52] Y. Kim, H.Lee, S. Park, I. Lee, “Optimal precoding for orthogonalized spatial multiplexing in closed-loop MIMO systems”, IEEE Journal on Selected Areas in Communication, vol. 26, no. 8, 2008. [53] W. Hamidouche, C. Perrine, Y. Pousset, C. Olivier, “A solution to efficient power allocation for H.264/SVC video transmission over a realistic MIMO channel using precoder designs”, Journal of Visual Communication and Image Representation, vol. 22, no. 6, pp. 563-574, Aug. 2011. [54] H. Sampath, P. Stoica, A. Paulraj, “Generalized Linear Precoder and Decoder Design for MIMO Channels Using the Weighted MMSE Criterion”, IEEE Transactions on Communication, vol. 49, no. 12, pp. 2198-2206, Dec. 2001. [55] S. Hara, R. Parasad, “OFDM for wireless communications systems”, Artech House, 2003. [56] W. Xiang, S. A. Barbulescu, S. S. Pietrobon, “Unequal Error Protection applied to JPEG Image Transmission using Turbo Codes”, Proc. 2001 IEEE Information Theory Workshop, Cairns, Australia, Sep. 2001. [57] T. P. Fowdur, Y. Beni, “An Unequal Error Protection Scheme for JPEG Image Transmission Using Enhanced Duo-Binary Turbo Codes”, in the 5th International Conference on Communications Theory, Reliability, and Quality of Service CTRQ’12, Chamonix/Mont Blanc, France, 2012. [58] C. Pouillat, D. Nicholson, P. Vila, “Sensibilité de JPEG 2000 aux erreurs”, CORESA 2001, Dijon, France, Nov. 2001. 148 BIBLIOGRAPHIE [59] D. Nicholson, C. Lamy-Bergot, X. Naturel, C. Pouillat, “JPEG 2000 backward compatible error protection with Reed-Solomon codes”, IEEE Transactions on Consumer Electronics, vol. 49, no. 4, pp. 855-860, Nov. 2003. [60] A. Natu, D. Taubman, “Unequal Protection of JPEG 2000 Codestreams in Wireless Channels”, Proccedings of IEEE GLOBECOM’02, vol. 1, pp. 534-538, Taipei, China, Nov. 2002. [61] C. Pouillat, D. Nicholson, “Impact and Efficiency of Error Resilience Tools for Mobile Applications”, ISO/IEC JTC1 SC29 WG1 N2176, Stockholm, Sweden, Jul. 2001. [62] V. Sanchez, M. K. Mandal, “Robust Transmission of JPEG 2000 Images over Noisy Channels”, Proccedings of IEEE ICCE’02, pp. 80-81, 2002. [63] F. Dufaux, D. Nicholson, “JPWL : JPEG 2000 for Wireless Applications”, SPIE Proc. Appl. Of Digital Image Proc. XXVII, Denver, CO, Aug. 2004 [64] W. Xiang, A. Clemence, J. Leis, Y. Wang, “Error Resilience Analysis of Wireless Image Transmission Using JPEG, JPEG 2000 and JPWL”, in 7th International Conference on Information, Communications and Signal Processing ICICS’09, Macau, Dec. 2009. [65] Y. M. Targali, E. V. Jones, “Unequal error protection for image transmission over GSM networks”, in Proceedings of the IEEE European Workshop on Distributed Imaging, London, England, 1999. [66] Y. Zhang, Y. Liu, R. Pickholtz, “Layered image transmission over cellular radio channels”, IEEE Transactions on Vehicular Technology, vol. 43, no. 3, pp. 786-794, Aug. 1994. [67] H. Liu, M. El Zarki, “Transmission of video telephony images over wireless channel”, Wireless Networks, vol. 2, no. 3, pp. 219-228, 1996. [68] C.-L. Huang, S. Liang, “Unequal Error Protection for MPEG-2 video transmission over wireless channels”, Signal Processing: Image Communication, vol. 19, no. 1, pp. 67-79, 2004. [69] N. Thomos, N. V. Boulgouris, M. G. Strintzis, “Transmission of Images Over Noisy Channels Using Error-Resilient Wavelet Coding and Forward Error Correction”, IEEE Trans. Circuits Syst. Video Tech., vol. 13, no. 12, pp. 1170-1181, Dec. 2003. [70] N. Thomos, N. V. Boulgouris, M. G. Strintzis, “Wireless Image Transmission Using Turbo Codes and Optimal Unequal Error Protection”, IEEE Transactions on Image Processing, vol. 14, no. 11, Nov. 2005. [71] N. Thomos, N. V. Boulgouris, M. G. Strintzis, “Optimized Transmission of JPEG2000 Streams Over Wireless Channels”, IEEE Transactions on Image Processing, vol. 15, no. 1, pp. 54-67, Jan. 2006. [72] A. Said, W. A. Pearlman, “A New Fast and Efficient Image Codec Based on Set Partitionning in Hierarchical Trees”, IEEE Trans. Circuits and Systems for Video Technology, vol. 6, no. 3, pp. 243-250, Jun. 1996. 149 BIBLIOGRAPHIE [73] M. Agueh, J.-F. Diouris, M. Diop, F.-O. Devaux, “Dynamic channel coding for efficient Motion JPEG 2000 video streaming over Mobile Ad Hoc Networks”, in Proceedings of the 3rd International Mobile Multimedia Communications Conference, Nafpaktos, Greece, Aug. 2007. [74] M. Agueh, J.-F. Diouris, M. Diop, F.-O. Devaux, C. De Vleeschouwer, B. Macq, “Optimal JPWL Forward Error Correction Rate Allocation for Robust JPEG 2000 Images and Video Streaming over Mobile Ad Hoc Networks”, EURASIP Journal on Advances in Signal Processing, May 2008. [75] M. Agueh, S. Ataman, C. Mairal, H. Soude, “Scalable and Robust Wireless JPEG 2000 Images and Video Transmission with Adaptive Bandwidth Estimation”, International Journal on Advances in Telecommunications, vol. 3, no. 1-2, pp. 49-58, 2010. [76] G. Baruffa, P. Micanti, F. Frescura, “Error Protection and Interleaving for Wireless Transmission of JPEG 2000 Images and Video”, IEEE Transactions on Image Processing, vol. 18, no. 2, pp. 346-356, Feb. 2009. [77] M. F. Sabir, R. W. Heath, Jr., A. C. Bovik, “An Unequal Error Protection for Multiple Input Multiple Output Systems”, in Proc. Record of the 36th Asilomar Conf. on Sig., Syst., and Comp., vol. 1, pp. 575-579, Nov. 2002. [78] W. Yu, Z. Safar, K. J. Ray Liu, “Rate Efficient Wireless Image Transmission using MIMO-OFDM”, Technical Report, Institute of Systems Research, University of Maryland, TR 2003-30, August 2003. [79] R. Colda, C. Perrine, J. Cances, R. Vauzelle, T. Palade, “Content-Based Image Unequal Error Protection Strategies for an Open Loop MIMO System”, International Journal of Communications, Network and System Sciences, vol. 5, no. 1, pp. 72-80, 2012. [80] M. Padmaja, K. Prasuna, “Optimized RMSE Power Allocation for Wireless Image Transmission Using binary DPSK Over Rayleigh Fading Channel”, International Journal of Electronics and Computer Science Engineering, vol. 1, no. 2, pp. 572-577, 2012. [81] L. Atzori, “Transmission of JPEG2000 Images over Wireless Channels with Unequal Power Distribution”, IEEE Trans. Cons. Electron., vol. 49, no. 11, pp. 883-888, Nov. 2003. [82] L. Atzori, M. Murroni, V. Popescu, “JPEG2000 Images Transmission over Noisy Wireless Channels with Unequal Power Distribution Wavelet Transmultiplexing”, International Conference on Optimization of Electrical and Electronic Equipment, 2006. [83] A. Bin Sediq, M. El Tarhuni, “MMSE Power Allocation for Image and Video Transmission Over Wireless Channels”, in Proceedings of the 16th IEEE International Symposium on Personal, Indoor and Mobile Radio Communications PIRMC’05, 2005. [84] M. El-Tarhuni, M. Assan, A. Bin Sediq, “A Joint Power Allocation and Adaptive Channel Coding Scheme for Image Transmission over Wireless Channels”, Journal of Computer Networks and Communications (IJCNC), vol. 2, no. 3, May 2010. 150 BIBLIOGRAPHIE [85] V. Lecuire, C. Duran-Faundez, N. Krommenacker, “Energy-efficient image transmission in sensor networks”, International Journal of Sensor Networks, vol. 4, no. 1-2, pp. 37-47, 2008. [86] S. Appadwedula, M. Goel, N. Shanbhag, D. Jones, K. Ramchandran, “Total system energy minimization for wireless image transmission”, The Journal of VLSI Signal Processing, vol. 27, no. 1-2, pp. 99-117, 2004. [87] G. H. Hakonsen, T. A. Ramstad, A. Gjendemsj, “Image Transmission With Adaptive Power and Rate Allocation over Flat Fading Channels Using Joint Source Channel Coding”, Communications in Computer and Information Science, vol. 9, pp. 312-321, Jul. 2008. [88] M. Sabir, R. Heath, H. Sheikh, A. Bovik, “A joint source-channel distortion model for JPEG compressed image”, IEEE Transactions on Image Processing, vol. 15, no. 6, pp. 1349-1364, Feb. 2006. [89] M. Torki and A. Hajshirmohammadi, “Unequal Power Allocation for Transmission of JPEG2000 Images over Wireless Channels”, IEEE Global Telecom. Conference, GLOBCOM, 2009. [90] M. Shayegannia, A. Hajshirmohammadi, S. Muhaidat, M. Torki, “An OFDM Based System for Transmission of JPEG2000 Images Using Unequal Power Allocation”, IEEE Wireless Communications and Networking Conference, WCNC, Apr. 2012. [91] M. Shayegannia, S. Muhaidat, A. Hajshirmohammadi, “Transmission of JPEG2000 Images in an Uplink Cellular Network with UPA and SCFDE: A System Description”, the 8th International Conference on Wireless and Mobile Communications ICWMC 2012, pp. 154-158, Venice, Italy, Jun. 2012. [92] N. Al-Dhahir, ”Single Carrier Frequency Domain Equalization for Space-Time BlockCoded Transmissions over Frequency-Selective Fading Channels”, IEEE Communications Letters , vol. 5, no. 7, pp. 304-306, 2001. [93] M. F. Sabir, A. C. Bovik, R. W. Heath, Jr., “Unequal Power Allocation for JPEG Transmission Over MIMO Systems”, IEEE Transactions on Image Processing, vol. 19, no. 2, pp. 410-421, Feb. 2010. [94] R. Deepa, K. Baskaran, “MIMO Based Efficient JPEG Image Transmission and Reception by Multistage Receivers”, International Journal of Computer Applications, vol. 1, no. 15, pp. 13-23, 2010. [95] R. Deepa, K. Baskaran, “An Adaptive Power Allocation Scheme for Robust Transmission of JPEG Compressed Images Over MIMO-OFDM Systems”, International Journal of Engineering Science and Technology (IJEST), vol. 2, no. 7, pp. 3120-3127, 2010. [96] A. Schertz, C. Weck, “Modulation hiérarchique”, UER – Revue Technique – Sélection 2003, Apr. 2003. 151 BIBLIOGRAPHIE [97] Y. Noh, H. Lee, I. Lee, “Design of Unequal Error Protection for MIMO-OFDM Systems”, in the 61st IEEE Vehicular Technology Conference VTC’05-Spring, vol. 2, pp. 1058-1062, Jun. 2005. [98] Y. Noh, H. Lee, W. Lee, I. Lee, “Design of Unequal Error Protection for MIMO-OFDM Systems with Hierarchical Signal Constellations”, Journal of Communications and Networks, vol. 9, no. 2, pp. 167-176, Jun. 2007. [99] F.-X. Coudoux, P. Corlaix, M. Gazalet, D. Bueche, M. Slachciak, “On the use of hierarchical modulation for robust video transmission over power line medium”, International Symposium on Power Line Communications ISPLC 2007, pp. 471-475, Pise, Italie, Mar. 2007. [100] S. S. Arslan, P. C. Cosman, L. B. Milstein, “Coded Hierarchical Modulation for Wireless Progressive Image Transmission”, IEEE Transactions on Vehicular Technology, vol. 60, no. 9, pp. 4299-4313, Nov. 2011. [101] S. Catreux, V. Erceg, D. Gesbert, R. W. Heath, Jr., “Adaptive Modulation and MIMO Coding for Broadband Wireless Data Networks”, IEEE Communications Magazine, , vol. 40, no. 6, pp. 108-115, Jun. 2002. [102] C.-B. Chae, A. Forenza, R. W. Health, Jr. M. R. Mckay, I. B. Collings, “Adaptive MIMO Transmission Techniques for Broadband Wireless Communications Systems”, IEEE Communications Magazine, vol. 48, no. 5, pp. 112-118, May 2010. [103] M. El-Tarhuni, M. Hassan, A. Bin Sediq, “A Jointly Variable M-QAM and Power Allocation Scheme for Image Transmission”, Journal of Computer Networks and Communications, vol. 2012, Article ID 642649, 2012. [104] S. S. Tan, M. J. Rim, P. C. Cosman, L. B. Milstein, “Adaptive Modulation for OFDMbased Multiple Description Progressive Image Transmission”, IEEE Global Telecommunications Conference GLOBECOM’08, Dec. 2008. [105] S. S. Tan, M. J. Rim, P. C. Cosman, L. B. Milstein, “Variance-Aware Adaptive Modulation for OFDM-Based Multiple Description Progressive Image Transmission”, IEEE International Conference on Communications ICC’10, Cape Town, South Africa, May. 2010. [106] V. K. Goyal, Multiple Description Coding: Compression meets the network, IEEE Signal Processing Magazine, vol. 18, no. 5, pp. 74-93, Sep. 2011. [107] Y. Sun, Z. Xiong, “Progressive Image Transmission Over Space-Time Coded OFDMbased MIMO Systems With Adaptive Modulation”, IEEE Trans. Mobile Comp., vol. 4, no. 8, pp. 1016-1028, Aug. 2006. [108] E. Ohlmer, G. Fettweis, “Link Adaptation in Linearly Precoded Closed-Loop MIMOOFDM Systems with Linear Receivers”, IEEE International Conference on Communications ICC’09, Dresden, Germany, 2009. [109] H. Houas, C. Barras, I. Fijalkow, “Ressources Allocation Optimization For Scalable Multimedia Data Subject To Quality Of Service Constraints”, IEEE Signal Processing Advances in Wireless Communications SPAWC, Cannes, France, 2006. 152 BIBLIOGRAPHIE [110] H. Houas, C. Barras, I. Fijalkow, “Allocation de ressources pour la transmission de données scalables sous contrainte de QoS sur canal OFDM”, GRETSI 2007, Troyes, France, Sep. 2007. [111] H. Houas, C. Barras, I. Fijalkow, “A New Transmission Strategy for Scalable Multimedia Data on OFDM Systems”, the 15th European Signal Processing Conference EUSIPCO’07, Poznan, Poland, Sep. 2007. [112] H. Houas, C. Baras, I. Fijalkow, “Resources allocation for the transmission of scalable images on OFDM systems”, IEEE International Conference on Communications ICC’09, Dresden, Germany, 2009. [113] C. Cozzo, B. Hughes, “Joint channel estimation and data detection in space-time communications”, IEEE Transactions on Communications, vol. 51, no. 8, pp. 12661270, Aug. 2003. [114] M. Dong, T. Long, “Optimal design and placement of pilot symbols for channel estimation”, in Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing ICASSP’11, USA, May 2011. [115] Y. G. Li, “Simplified channel estimation for OFDM systems with multiple transmit antennas”, Transactions on Wireless Communications, vol. 1, no. 1, pp. 67-75, Jan. 2002. [116] J. Letessier, “Performances théoriques de systèmes MIMO pré-égalisés et applications avec un simulateur de propagation 3D”, Thèse de doctorat de l’Université de Bretagne Occidentale, Nov. 2005. [117] L. Collin, O. Berder, P. Rostaing, G. Burel, “Optimal minimum distande-based precoder for MIMO spatial multiplexing systems”, in IEEE Transactions on Signal Processing, vol. 52, no. 3, pp. 617-627, 2004. [118] S. Boyd, L. Vandenberghe, “Convex Optimization”, Cambridge University Press, 2004. [119] P. Rostaing, O. Berder, L. Collin, G. Burel, “Minimum BER Diagonal Precoder for MIMO Digital Transmissions”, Signal Processing, vol. 82, no. 10, pp. 1477-1480, 2002. [120] R. M. Corless, G. H. Gonnet, D. E. G. Hare, D. J. Jeffrey, D. E. Knuth, “On the Lambert W Function”, Advances in Computational Mathematics, vol. 5, pp. 329-359, 1996. [121] Q. Tuong, O. Berder, B. Vrigneau, O; Sentieys, “Minimum distance based precoder for MIMO-OFDM systems using a 16-QAM modulation”, IEEE International Conference on Communications ICC’09, Germany, 2009. [122] B. Vrigneau, J. Letessier, P. Rostaing, L. Collin, G. Burel, “Extension of the MIMO Precoder based on the Minimum Euclidean Distance : a cross-form matrix”, IEEE Signal Processing, vol. 2, no. 2, pp. 135-146, May 2008. 153 BIBLIOGRAPHIE [123] M. Nauge, M.-C. Larabi, C. Fernandez, “Benchmark de métriques de qualité sur bases de données d’images compressées”, dans Codage et Représentation des Signaux Audiovisuels CORESA 2010, Lyon, France, Oct. 2010. [124] Z. Wang, A. C. Bovik, H. R. Sheikh, E. P. Simoncelli, “Image quality assessment: From error visibility to structural similarity”, IEEE Transactions on Image Processing, vol. 13, no. 4, pp. 600-612, Apr. 2004. [125] P. J. Smith, L. M. Garth, M. Shafi, “Performance Analysis of Multiple-Input Multiple Output Singular Value Decomposition Transceivers During Fading and Other Cells Interference”, IET Microwaves, Antennas and Propagation, vol. 1, no. 6, pp. 11111119, 2007. [126] B. Vrigneau, P. Rostaing, L. Collin, K. Yao, “Comparaison du précodeur Max-dmin avec les OSTBC et le précodeur Max-SNR pour les systèmes MIMO”, GRETSI 2005, Louvain-La-Neuve, Belgique, Sep. 2005. [127] P. Ubaidulla, A. Chockalingam, “Relay Precoder Optimization in MIMO-Relay Networks With Imperfect CSI”, in IEEE Transactions on Signal Processing, vol. 59, no. 11, Nov. 2011. [128] Y. Lu, Y. Zhao, F. Kuipers, P. V. Mieghem, “Measurement Study of Multi-party Video Conferencing”, Lecture Notes in Computer Science NETWORKING 2010, vol. 6091, pp. 96-108, 2010. [129] F. De Moor, W. Joseph, I. Ketyko, E. Tanghe, T. Deryckere, L. Martens, L. De Marez, “Linking Users’ Subjective QoE Evaluation to Signal Strength in an IEEE 802.11b/g Wireless LAN Environment”, in EURASIP Journal on Wireless Communications and Networking, volume 2010, article ID 541568, 2010. [130] F. De Simone, M. Naccari, M. Tagliasacchi, F. Dufaux, S. Tubaro, T. Ebrahim, “Subjective Quality Assessment of H.264/AVC Video Streaming with Packet Losses”, EURASIP Journal on Image and Video Processing, (special issue on Quality of Multimedia Experience), vol. 2011. [131] S. Winkler, F. Dufaux, D. Barba, V. Baroncini, “Editorial - Special Issue on Image and Video Quality Assessment”, Signal Processing: Image Communication, vol. 25, no. 7, pp. 467-468, Aug. 2010. [132] P. Marziliano, F. Dufaux, S. Winkler, T. Ebrahimi, “Perceptual Blur and Ringing Metrics: Application to JPEG2000”, Signal Processing: Image Communication, vol. 19, no. 2, pp. 163-172, Feb. 2004. [133] F. De Simone, D. Ticca, F. Dufaux, M. Ansorge and T. Ebrahimi, “A Comparative Study of Color Image Compression Standards using Perceptually-driven Quality Metrics”, in SPIE Proc. Applications of Digital Image Processing XXXI, San Diego, CA, August 2008. [134] F. De Simone, F. Dufaux, T. Ebrahimi, C. Delogu, V. Baroncini, “A Subjective Study of the Influence of Color Information on Visual Quality Assessment of High Resolution Pictures”, in Proc. 2009 International Workshop on Video Processing and Quality Metrics (VPQM 2009), Scottsdale, AZ, Jan. 2009. 154 BIBLIOGRAPHIE [135] F. Marini, “Content Based No-Reference Image Quality Metrics”, Thèse de doctorat de l’Université de Milan, 2011. [136] M. Nauge, M.-C. Larabi, C. Fernandez, “A reduced-reference metric based on the interest points in color images”, in PCS’2010, pp. 610-613, Nagoya, Japan, 2010. [137] “ITU-R recommendation BT.500-12: Methodology for the subjective assessment of the quality of television picture (PEVQ)”, Aug. 2009. [138] A. Zribi, R. Pyndiah, S. Zaibi, F. Guilloud, A. Bouallegue, “Low-Complexity Soft Decoding of Huffman Codes and Iterative Joint/Source Channel Decoding”, in IEEE Transactions on Communications, vol. 60, no. 6, pp. 1669-1679, Jun. 2012. [139] S. Zaibi, A. Zribi, R. Pyndiah, N. Aloui, “Joint source/channel iterative arithmetic decoding with JPEG 2000 image transmission application”, in EURASIP Journal on Advances in Signal Processing 2012, 2012:114. 155 LISTE DE PUBLICATIONS Articles dans des revues internationales à comité de lecture [1] J. Abot, C. Olivier, C. Perrine, Y. Pousset, “A Link Adaptation Scheme Optimized for Wireless JPEG 2000 Transmission over Realistic MIMO Systems”, in Signal Processing: Image Communication, 2012, DOI: 10.1016/j.image.2012.08.003. Communications dans des conférences internationales à comité de lecture [1] J. Abot, Y. Pousset, C. Olivier, C. Perrine, “A Content-based Precoding Solution Designed for Wireless JPEG 2000 Transmission”, in European Signal Processing Conference EUSIPCO 2012, Bucarest, Romania, Aug. 2012. [2] J. Abot, C. Perrine, Y. Pousset, C. Olivier, “An Unequal Power Allocation Designed For Wireless JPEG 2000 Transmission Over MIMO Systems”, in IEEE International Symposium on signal, Image, Video and Communications ISIVC 2012, Valenciennes, France, Jul. 2012. [3] J. Abot, M. Nauge, C. Perrine, M.-C. Larabi, C. Bergeron, Y. Pousset, C. Olivier, “A Robust Content-based JPWL Transmission Over a Realistic MIMO Channel Under Perceptual Constraints”, in IEEE International Conference on Image Processing ICIP 2011, pp. 3241-3244, Belgium, Brussel, Sep. 2011. Communications dans des conférences nationales à comité de lecture [1] J. Abot, M. Nauge, C. Perrine, M.-C. Larabi, C. Bergeron, C. Olivier, Y. Pousset, “Maximisation Perceptuelle de la Qualité de Transmission JPWL via un Canal MIMO Réaliste”, dans Groupement de Recherche en Traitement du Signal et de l’Image GRETSI 2011, Bordeaux, France, Sep. 2011. [2] J. Abot, C. Perrine, C. Olivier, Y. Pousset, “Transmission robuste de vidéo basée ondelette à travers un canal MIMO”, dans Codage et Représentation des Signaux Audiovisuels CORESA 2010, Lyon, France, Oct. 2010. 157 Résumé : Ce travail de thèse présente une stratégie de transmission exploitant la diversité spatiale pour la transmission d’images sur canal sans fil. On propose ainsi une approche originale mettant en correspondance la hiérarchie de la source avec celle des sous-canaux SISO issus de la décomposition d’un canal MIMO. On évalue les performances des précodeurs usuels dans le cadre de cette stratégie via une couche physique réaliste, respectant la norme IEEE802.11n, et associé à un canal de transmission basé sur un modèle de propagation à tracé de rayons 3D. On montre ainsi que les précodeurs usuels sont mal adaptés pour la transmission d’un contenu hiérarchisé. On propose alors un algorithme de précodage allouant successivement la puissance sur les sous-canaux SISO afin de maximiser la qualité des images reçues. Le précodeur proposé permet d’atteindre un TEB cible compte tenu du codage canal, de la modulation et du SNR des sous-canaux SISO. A partir de cet algorithme de précodage, on propose une solution d’adaptation de lien permettant de régler dynamiquement les paramètres de la chaîne en fonction des variations sur le canal de transmission. Cette solution détermine la configuration de codage/transmission maximisant la qualité de l’image en réception. Enfin, on présente une étude sur la prise en compte de contraintes psychovisuelles dans l’appréciation de la qualité des images reçues. On propose ainsi l’intégration d’une métrique à référence réduite basée sur des contraintes psychovisuelles permettant d’assister le décodeur vers la configuration de décodage offrant la meilleure qualité d’expérience. Des tests subjectifs confirment l’intérêt de l’approche proposée. Mot clés : Codage conjoint source-canal, canal MIMO réaliste, précodage MIMO, Wireless JPEG 2000, Qualité de Service, Qualité d’Expérience. Abstract : This thesis presents a transmission strategy for exploiting the spatial diversity for image transmission over wireless channel. We propose an original approach based on the matching between the source hierarchy and the SISO subchannels hierarchy, resulting from the MIMO channel decomposition. We evaluate common precoder performance in the context of this strategy via a realistic physical layer respecting the IEEE802.11n standard and associated with a transmission channel based on a 3D-ray tracer propagation model. It is shown that common precoders are not adapted for the transmission of a hierarchical content. Then, we propose a precoding algorithm which successively allocates power over SISO sub-channels in order to maximize the received images quality. The proposed precoder achieves a target BER according to the channel coding, the modulation and the SISO subchannels SNR. From this precoding algorithm, we propose a link adaptation scheme to dynamically adjust the system parameters depending on the variations of the transmission channel. This solution determines the optimal coding/transmission configuration maximizing the image quality in reception. Finally, we present a study for take into account some psychovisual constraints in the assessment of the received images quality. We propose the insertion of a reduced reference metric based on psychovisual constraints, to assist the decoder in order to determine the decoding configuration providing the highest quality of experience. Subjective tests confirm the interest of the proposed approach. Keywords : Joint Source Channel Coding, realistic MIMO channel, MIMO precoding, Wireless JPEG 2000, Quality of Service, Quality of Experience.