Consulter le texte intégral de la thèse

Transcription

Consulter le texte intégral de la thèse
THESE
Pour l'obtention du grade de
DOCTEUR DE L'UNIVERSITÉ DE POITIERS
UFR des sciences fondamentales et appliquées
XLIM-SIC
(Diplôme National - Arrêté du 7 août 2006)
École doctorale : Sciences et ingénierie pour l'information, mathématiques - S2IM
Secteur de recherche : Traitemement du signal et des images
Présentée par :
Julien Abot
Stratégie de codage conjoint pour la transmission d'images
dans un système MIMO
Directeur(s) de Thèse :
Christian Olivier, Yannis Pousset, Clency Perrine
Soutenue le 03 décembre 2012 devant le jury
Jury :
Président
Ramesh Pyndiah
Professeur - ENST de Bretagne
Rapporteur
François-Xavier Coudoux
Professeur des Universités - Université de Valenciennes et du
Hainaut-Cambrésis
Rapporteur
Frédéric Dufaux
Directeur de recherche - CNRS, Télecom Paris Tech
Membre
Christian Olivier
Professeur des Universités - Université de Poitiers
Membre
Yannis Pousset
Maître de conférences - Université de Poitiers
Membre
Mohamed-Chaker Larabi
Maître de conférences - Université de Poitiers
Membre
Clency Perrine
Maître de conférences - Université de Poitiers
Membre
Cyril Bergeron
Docteur ingénieur - Société Thalès communications
Pour citer cette thèse :
Julien Abot. Stratégie de codage conjoint pour la transmission d'images dans un système MIMO [En ligne]. Thèse
Traitemement du signal et des images . Poitiers : Université de Poitiers, 2012. Disponible sur Internet
<http://theses.univ-poitiers.fr>
THESE
pour l’obtention du Grade de
DOCTEUR DE L’UNIVERSITE DE POITIERS
(Faculté des Sciences Fondamentales et Appliquées)
(Diplôme National - Arrêté du 7 août 2006)
Ecole Doctorale ED 521
: Sciences et ingénierie pour l’information
Secteur de Recherche
: Traitement du signal et des images
Présentée par :
Julien ABOT
STRATEGIE DE CODAGE CONJOINT POUR LA
TRANSMISSION D’IMAGES DANS UN SYSTEME MIMO
Directeur de Thèse : Christian OLIVIER
Co-directeur de Thèse : Clency PERRINE
Co-directeur de Thèse : Yannis POUSSET
Soutenue le 03 Décembre 2012 devant la Commission d’Examen composée de
Ramesh Pyndiah, Professeur, Télecom Bretagne ......................................................... Président du Jury
François-Xavier Coudoux, Professeur, Université de Valenciennes et du Hainaut-Cambrésis ......... Rapporteur
Frédéric Dufaux, Directeur de Recherche CNRS, Télecom Paris Tech ...................................... Rapporteur
Cyril Bergeron, Ingénieur, Thalès Communications ............................................................Examinateur
Mohamed-Chaker Larabi, Maître de Conférences, Université de Poitiers .................................Examinateur
Christian Olivier, Professeur, Université de Poitiers ............................................................Examinateur
Yannis Pousset, Professeur, Université de Poitiers ..............................................................Examinateur
Clency Perrine, Maître de Conférences, Université de Poitiers ...............................................Examinateur
REMERCIEMENTS
Le travail présenté dans ce mémoire est le fruit de 3 années passées au sein de l’équipe
SYSCOM du département Signal Image Communication (SIC) de l’institut XLIM, à
l’Université de Poitiers. A ce titre, je tiens à remercier Madame Christine FernandezMaloigne, directrice du département SIC, pour m’avoir permis d’intégrer le laboratoire ainsi
que l’Agence Nationale de la Recherche qui a financé ces travaux à travers le projet
CAIMAN.
Je tiens à remercier chaleureusement Monsieur Christian Olivier, Professeur à
l’Université de Poitiers, qui a dirigé ces travaux de thèse ainsi que Messieurs Clency Perrine
et Yannis Pousset, respectivement Maître de Conférences et Professeur à l’Université de
Poitiers, pour m’avoir co-encadré au cours de ces trois années.
Je tiens à exprimer ma gratitude à Monsieur François-Xavier Coudoux, Professeur à
l’Université de Valenciennes ainsi que Monsieur Frédéric Dufaux, Directeur de Recherche
CNRS à Télecom Paris Tech, pour avoir accepté de rapporter ce manuscrit.
Je tiens également à remercier Monsieur Ramesh Pyndiah, Professeur à Télecom
Bretagne, Monsieur Cyril Bergeron, Ingénieur chez Thalès Communications et Monsieur
Mohamed-Chaker Larabi, Maître de Conférences à l’Université de Poitiers, pour avoir
accepté de faire partie du Jury.
J’ai une pensée pour tous les membres du projet CAIMAN que j’ai pu côtoyer au
cours des nombreuses réunions de travail. Je remercie à ce titre Monsieur Didier Nicholson,
chef du projet CAIMAN, pour les discussions enrichissantes que l’on a pu avoir.
Je tiens à remercier très sincèrement tous les membres du laboratoire, stagiaires,
thésards, permanents, secrétaires pour leur accueil chaleureux et leur bonne humeur. Je leur
souhaite à tous une bonne continuation dans leurs projets.
Je tiens naturellement à remercier ma famille et mes amis qui m’ont soutenu au cours
des bons, comme des mauvais moments.
Enfin, je ne remercierai jamais assez Flora et Mayko qui m’ont apporté un soutien
sans limite, et qui ont dû me supporter durant ces trois années de travail.
TABLE DES MATIERES
Liste des acronymes et abréviations
v
Annotations
ix
Table des figures
xi
Liste des tableaux
xv
Introduction
1
1 Stratégies de transmission d’images sur canal sans fil
5
1.1
Introduction ................................................................................................................ 6
1.2
La chaîne de communication numérique ................................................................... 6
1.2.1
Le codeur de source ............................................................................................ 7
1.2.2
Le codeur de canal ............................................................................................ 10
1.2.3
Les modulations numériques ............................................................................ 11
1.3
Le canal de transmission sans fil.............................................................................. 12
1.3.1
Phénomènes liés au canal de transmission ....................................................... 12
1.3.2
Modélisation du canal de transmission sans fil ................................................ 15
1.3.2.1 Modèles déterministes.................................................................................. 15
1.3.2.2 Modèles statistiques ..................................................................................... 16
1.3.2.3 Modèle de canal réaliste considéré dans la thèse ......................................... 17
1.4
Notion de diversité ................................................................................................... 19
1.5
Introduction aux systèmes MIMO ........................................................................... 20
1.5.1
Modélisation du canal MIMO .......................................................................... 21
1.5.2
Systèmes MIMO en boucle ouverte ................................................................. 22
1.5.3
Systèmes MIMO en boucle fermée .................................................................. 23
1.5.4
Les récepteurs MIMO....................................................................................... 24
1.5.5
Association MIMO-OFDM .............................................................................. 25
1.6
Etat de l’art sur les stratégies de transmission d’images .......................................... 26
1.6.1
Stratégies de protection inégale contre les erreurs ........................................... 27
1.6.2
Stratégies d’allocation de puissance inégale .................................................... 30
1.6.3
Stratégies de transmission basées sur la modulation ........................................ 33
1.7
Synthèse et conclusion ............................................................................................. 36
2 Performances des précodeurs linéaires pour la transmission d’images JPWL
39
2.1
Introduction .............................................................................................................. 40
2.2
Le précodage linéaire ............................................................................................... 40
2.2.1
Transformation en canal virtuel........................................................................ 40
i
TABLE DES MATIERES
2.2.2
Les précodeurs diagonaux ................................................................................ 42
2.2.3
Les précodeurs non-diagonaux ......................................................................... 46
2.3
Stratégie de transmission d’images sur canal MIMO .............................................. 48
2.3.1
Motivations....................................................................................................... 48
2.3.2
Schéma de transmission.................................................................................... 49
2.3.3
Décodeur JPWL robuste ................................................................................... 50
2.4
Etude des performances des précodeurs linéaires .................................................... 52
2.4.1
Contexte de simulation ..................................................................................... 52
2.4.1.1 Paramétrage de la couche physique ............................................................. 52
2.4.1.2 Paramétrage de la couche application .......................................................... 52
2.4.1.3 Métriques d’évaluation................................................................................. 54
2.4.1.4 Modélisation du canal .................................................................................. 55
2.4.2
Résultats de simulation..................................................................................... 56
2.4.2.1 Résultats sur canal statistique....................................................................... 56
2.4.2.2 Résultats sur canal réaliste ........................................................................... 59
2.5
Synthèse et conclusion ............................................................................................. 64
3 Prise en compte du contenu dans un système MIMO précodé
67
3.1
Introduction .............................................................................................................. 68
3.2
Algorithme de précodage basé sur le contenu.......................................................... 68
3.2.1
Principe............................................................................................................. 68
3.2.2
Modèle d’allocation successive de la puissance............................................... 69
3.2.3
Prise en compte du codage canal dans l’allocation de la puissance ................. 71
3.2.4
Algorithme d’approximation du TEB cible...................................................... 73
3.2.5
Algorithme d’allocation successive de la puissance......................................... 75
3.3
Résultats de simulations ........................................................................................... 77
3.3.1
Résultats sur canal statistique ........................................................................... 77
3.3.2
Résultats sur canal réaliste................................................................................ 79
3.3.2.1 Performances en l’absence de CCE ............................................................. 80
3.3.2.2 Impact du codage canal ................................................................................ 83
3.3.2.3 Impact de la modulation ............................................................................... 83
3.3.2.4 Analyse visuelle ........................................................................................... 85
3.3.3
Impact des erreurs d’estimation sur la CSI....................................................... 88
3.3.3.1 Modèle d’erreur d’estimation ...................................................................... 88
3.3.3.2 Robustesse des précodeurs aux erreurs d’estimation sur la CSI .................. 89
3.4
Synthèse et conclusion ............................................................................................. 91
4 Stratégie d’adaptation de lien pour la transmission d’un contenu JPWL
93
4.1
Introduction .............................................................................................................. 94
4.2
Stratégie de transmission optimisée ......................................................................... 94
4.3
Définition des contraintes......................................................................................... 95
4.3.1
Contrainte de débit............................................................................................ 95
4.3.2
Contrainte sur la QoS ....................................................................................... 96
4.3.3
Contrainte sur la puissance ............................................................................... 96
4.4
Minimisation de la distorsion................................................................................... 96
ii
TABLE DES MATIERES
4.5
Représentation arborescente pour la résolution du problème .................................. 98
4.5.1
Commentaires sur le choix adopté.................................................................... 99
4.5.2
Construction de l’arbre ..................................................................................... 99
4.5.3
Recherche du chemin minimisant la distorsion.............................................. 102
4.6
Résultats de simulations sur canal réaliste ............................................................. 102
4.6.1
Contexte de simulation ................................................................................... 102
4.6.1.1 Définition de la configuration de base ....................................................... 103
4.6.1.2 Définition des paramètres pour la stratégie d’adaptation de lien ............... 104
4.6.2
Apports de la stratégie d’adaptation de lien ................................................... 105
4.6.3
Gestion des ressources.................................................................................... 108
4.6.4
Complexité de la solution ............................................................................... 109
4.6.5
Analyse visuelle.............................................................................................. 111
4.7
Synthèse et conclusion ........................................................................................... 115
5 Analyse du contenu dans l’appréciation de la qualité de l’expérience
117
5.1
Introduction ............................................................................................................ 118
5.2
Problématique......................................................................................................... 119
5.3
Les métriques de qualité......................................................................................... 122
5.4
Solution proposée................................................................................................... 123
5.4.1
La métrique à référence réduite QIP.............................................................. 123
5.4.2
Intégration de QIP dans la stratégie de transmission..................................... 124
5.4.3
Remarques sur l’utilisation de QIP dans le cadre de la stratégie de
transmission................................................................................................... 125
5.5
Résultats de simulation sur canal réaliste............................................................... 126
5.5.1
Analyse objective .......................................................................................... 126
5.5.2
Analyse visuelle............................................................................................. 130
5.6
Validation subjective.............................................................................................. 135
5.6.1
Motivations.................................................................................................... 135
5.6.2
Protocole de test............................................................................................. 135
5.6.2.1 Base d’images ............................................................................................ 135
5.6.2.2 Panel d’observateurs .................................................................................. 136
5.6.2.3 Présentation des images ............................................................................. 136
5.6.3
Analyse des résultats ..................................................................................... 137
5.7
Synthèse et conclusion ........................................................................................... 140
Conclusion et perspectives
141
Bibliographie
145
Liste de publications
157
iii
LISTE DES ACRONYMES ET ABREVIATIONS
AC
ADSL
AIC
ANR
BBAG
BLAST
bpp
BPSK
bVQM
CAIMAN
CBP
CCE
CL
CRC
CSI
CST
DAST
dB
DC
DCT
ddp
DEMUX
DPCM
DSP
DVB-T
DWT
EEP
EPA
EPB
EPH
FSK
GOP
HD
IES
IFFT
iid
Alternative Components
Asymetric Digital Subscriber Line
Advanced Image Coding
Agence Nationale de la Recherche
Bruit Blanc Additif Gaussien
Bells Laboratory Layered Space-Time
bit par pixel
Binary Phase Shift Keying
batch Video Quality Metric
Codage Avancé d’IMAges et Nouveaux services
Content-Based Precoder
Code Correcteur d’Erreurs
Closed Loop
Cyclic Redundancy Code
Channel State Information
Codage Spatio-Temporel
Diagonal Algebraic Space-Time
Decibel
Direct Components
Discrete Cosinus Transform
densité de probabilité
Démultiplexage
Differential Pulse Coding Modulation
Densité Spectrale de Puissance
Digital Video Broadcasting – Terrestrial
Discrete Wavelet Transform
Equal Error Protection
Equal Power Allocation
Error Protection Block
End of Packet Header
Frequency Shift Keying
Group Of Pictures
Haute Définition
Interférence Entre Symboles
Inverse Fast Fourier Transform
indépendent et identiquement distribué
v
LISTE DES ACRONYMES ET ABREVIATIONS
JPEG
JPWL
JSCC
LAR
LOS
LSB
LST
LTE
MAQ
MBER
MCS
MDC
MIMO
MISO
ML
MMSE
MSB
MUX
NLOS
OFDM
OG
OL
OSI
OSM
PAM
PAPR
PDA
PSK
PSNR
QIP
QoE
QoS
RCPC
RI
ROI
RS
RSB
RSBI
Rx-CSI
SCFDE
SIC
SIMO
SISO
SNR
vi
Joint Photographic Expert Group
JPEG Wireless
Joint Source Channel Coding
Ligne A Retard
Line Of Sight
Least Significant Bit
Layered Space-Time
Long Term Evolution
Modulation d’Amplitude en Quadrature
Minimum Bit Error Rate
Modulation and Coding Scheme
Multiple Description Coding
Multiple Input Multiple Output
Multiple Input Single Output
Maximum Likelihood
Minimum Mean Square Error
Most Significant Bit
Multiplexage
Non Line Of Sight
Orthogonal Frequency Division Multiplexing
Optique Géométrique
Open Loop
Open System Interconnection
Orthogonalized Spatial Multiplexing
Pulse Amplitude Modulation
Peak to Average Power Ratio
Personal Digital Assistant
Phase Shift Keying
Peak Signal to Noise Ratio
Quality by Interest Points
Quality of Experience
Quality of Service
Rate-Compatible Punctured Convolutional
Réponse Impulsionnelle
Region of Interest
Reed-Solomon
Rapport Signal sur Bruit
Rapport Signal sur Bruit plus Interférence
CSI disponible en réception
Single Carrier Frequency Domain Equalization
Successive Interference Cancelation
Single Input Multiple Output
Single Input Single Output
Signal to Noise Ratio
LISTE DES ACRONYMES ET ABREVIATIONS
SOP
SPIHT
SSIM
STBC
STTC
SVC
SVD
SVH
TAST
TDL
TEB
TNT
TUD
Tx-CSI
UEP
UPA
US
VLC
WF
WSS
XLIM-SIC
ZF
Start Of Packet
Set Partitioning In Hierarchical Trees
Structural Similarity
Space-Time Block Code
Space-Time Treillis Code
Scalable Video Coding
Singular Value Decomposition
Système Visuel Humain
Threaded Algebraic Space-Time
Tap Delay Line
Taux d’Erreur Binaire
Télévision Numérique Terrestre
Théorie Uniforme de la Diffraction
CSI disponible à l’émission
Unequal Error Protection
Unequal Power Allocation
Uncorrelated Scattering
Variable Length Coding
Water-Filling
Wide Sense Stationarity
Département Signal Image Communication de l’institut XLIM
Zero Forcing
vii
ANNOTATIONS
nT
nR
λ
E[.]
Nombre d’antennes à l’émission
Nombre d’antennes à la réception
Longueur d’onde
Espérance mathématique
.
Norme euclidienne
.
Partie entière
.*
erfc(.)
diag(.)
W0(.)
I0(.)
δ
H
F
G
Hv
Ib
M
N
K
t
Ts
P0
b
dmin
σ
Transposé conjugué
Fonction d’erreur complémentaire
Matrice définie par sa diagonale
Fonction de Lambert d’index 0
Fonction de Bessel modifiée de 1ère espèce d’ordre 0
Impulsion de Dirac
Lagrangien
Ensemble des symboles complexes d’une constellation
Matrice de canal
Matrice de précodage
Matrice de décodage
Matrice de canal virtuel
Matrice identité de taille b
Ordre de modulation correspondant au nombre d’états d’une constellation
Nombre de blocs d’information en sortie d’un CCE
Nombre de blocs d’information en entrée d’un CCE
Capacité de correction d’un code RS(N,K)
Temps symbole
Puissance moyenne totale transmise sur les nT antennes
Nombre de sous-canaux SISO disponibles
Distance euclidienne minimale de la constellation de réception
Gain total du canal MIMO
σ i2
RSB sur le sous-canal i
fi 2
Coefficient de précodage sur le sous-canal i
Peb
PRS,i
TEBC,i
Bi
Pr
Probabilité d’erreur binaire avant décodage canal
Probabilité d’erreur binaire après décodage RS sur le sous-canal i
TEB cible avant décodage canal sur le sous-canal i
TEB cible après décodage canal sur le sous-canal i
Puissance résiduelle
ix
ANNOTATIONS
RS
Smax
βS
βC
L
x
Débit de la source en bpp
Nombre de symboles OFDM utilisables par sous-canal
Nombre de bits alloués au codage de la source
Nombre de bits alloués au codage canal
Nombre de sous-canaux SISO utilisés par la stratégie d’adaptation de lien
TABLE DES FIGURES
1.1
1.2
1.3
1.4
Synoptique d'une chaîne de communication numérique .................................................. 6
Synoptique d’un codeur de source appliqué à l’image .................................................... 7
Principe de fonctionnement du codeur JPEG 2000 ......................................................... 9
Répartition des symboles dans le plan complexe pour les constellations MAQ-4,
MAQ-16 et MAQ-64 ..................................................................................................... 12
1.5 Influence des évanouissements sur le signal transmis [18] ........................................... 13
1.6 Illustration du phénomène de trajets multiples [19] ...................................................... 14
1.7 Synoptique du simulateur de canal à tracé de rayons 3D [28] ....................................... 17
1.8 Schéma de transmission MIMO à nT × nR antennes ...................................................... 21
1.9 Exemple d’architecture LST .......................................................................................... 22
1.10 Exemple de code STBC : code d’Alamouti ................................................................... 23
1.11 Schéma d’un modulateur OFDM ................................................................................... 26
1.12 Constellation d’une modulation MAQ-16 hiérarchique ................................................ 33
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
2.10
2.11
2.12
2.13
2.14
2.15
Schéma-bloc d’un canal MIMO précodé en canal virtuel ............................................. 41
Schéma-bloc d’un précodeur diagonal .......................................................................... 43
Schéma-bloc d’un précodeur non-diagonal ................................................................... 46
Correspondance entre la source et le canal dans la stratégie de transmission ............... 49
Schéma de la stratégie de transmission d’image JPWL ................................................ 50
Implémentation du décodeur JPWL robuste .................................................................. 51
Images transmises dans le cadre des simulations : (a) « Caps » et (b) « Monarch » ..... 53
Répartition des couches de qualité JPWL et des données EPB sur les sous-canaux
SISO................................................................................................................................ 53
(a) Topologie de l’environnement de transmission et (b) évolution du gain du
canal MIMO ................................................................................................................... 55
Courbe de TEB global des différentes stratégies de précodage ..................................... 56
Evolution du PSNR et du score SSIM avec différentes configurations de codage
canal sur un canal statistique pour l’image « Caps » ..................................................... 57
Evolution du PSNR et du score SSIM avec différentes configurations de codage
canal sur un canal statistique pour l’image « Monarch » .............................................. 58
Evolution du TEB par sous-canal pour les différentes stratégies de précodage ............ 59
Evolution du PSNR et du score SSIM avec différentes configurations de codage
canal sur un canal réaliste pour l’image « Caps » .......................................................... 60
Evolution du PSNR et du score SSIM avec différentes configurations de codage
canal sur un canal réaliste pour l’image « Monarch » ................................................... 61
xi
TABLE DES FIGURES
3.1
3.2
3.3
3.4
3.5
3.6
3.7
3.8
3.9
3.10
3.11
3.12
3.13
3.14
3.15
4.1
4.2
4.3
Synoptique de la stratégie UPA ..................................................................................... 69
Evolution des coefficients de précodage en fonction du RSB, de l’ordre de
modulation et du TEB cible ........................................................................................... 70
Performances des codes RS implémentés dans la norme JPWL ................................... 71
Variation du paramètre TEBC,i pour différentes valeurs de Bi et pour différentes
capacités de correction ti ................................................................................................ 73
Algorithme d’approximation du TEB cible ................................................................... 74
Algorithme d’allocation successive de la puissance ...................................................... 76
Courbe de TEB global des différentes stratégies de précodage ..................................... 78
Evolution du TEB par sous-canal pour les différentes stratégies de précodage ............ 79
Evolution du PSNR et du score SSIM avec différentes configurations de codage
canal sur un canal réaliste pour l’image « Caps » .......................................................... 80
Evolution du PSNR et du score SSIM avec différentes configurations de codage
canal sur un canal réaliste pour l’image « Monarch » ................................................... 81
Evolution du PSNR et du score SSIM de l’image « Caps » sur le canal réaliste
avec une modulation MAQ-16 ...................................................................................... 84
Evolution du PSNR et du score SSIM de l’image « Monarch » sur le canal réaliste
avec une modulation MAQ-16 ...................................................................................... 85
Comparaison visuelle entre les résultats fournis par les précodeurs pour l’image
« Caps » dans de mauvaises conditions de transmission (zone 1, indice 251) et
sans CCE sur les données utiles ..................................................................................... 86
Comparaison visuelle entre les résultats fournis par les précodeurs pour l’image
« Monarch » dans des conditions de transmission moyennes (zone 4, indice 2259)
avec un code RS(37,32) sur les données utiles .............................................................. 87
Impact des erreurs d’estimation sur la CSI en termes de PSNR et de score SSIM
pour l’image « Caps » .................................................................................................... 90
Synoptique de la stratégie d’adaptation de lien ............................................................. 95
Exemple de représentation en arbre pour 2 sous-canaux SISO ................................... 100
Résultats de simulation (PSNR et score SSIM) pour l’image « Caps » avec la
configuration de base .................................................................................................... 106
4.4 Apport de la stratégie d’adaptation de lien (PSNR et score SSIM) pour l’image
« Caps » ........................................................................................................................ 106
4.5 Résultats de simulation (PSNR et score SSIM) pour l’image « Monarch » avec la
configuration de base .................................................................................................... 107
4.6 Apport de la stratégie d’adaptation de lien (PSNR et score SSIM) pour l’image
« Monarch » .................................................................................................................. 107
4.7 Variation du débit source des images JPWL fournie par l’optimisation conjointe
de la stratégie d’adaptation de lien ............................................................................... 108
4.8 Utilisation des ordres de modulation et des sous-canaux en fonction de la position
sur la trajectoire du récepteur........................................................................................ 109
4.9 Evolution du nombre de configurations évaluées dans l’arbre .................................... 110
4.10 Comparaison visuelle entre les résultats fournis par le précodeur CBP et par la
stratégie d’adaptation de lien pour l’image « Caps » et pour différentes conditions
de transmission ............................................................................................................. 112
xii
TABLE DES FIGURES
4.11 Comparaison visuelle entre les résultats fournis par le précodeur CBP et par la
stratégie d’adaptation de lien pour l’image « Monarch » et pour différentes
conditions de transmission............................................................................................ 113
4.12 Présence de distorsions au décodage ........................................................................... 114
5.1
5.2
5.3
5.4
5.5
5.6
5.7
5.8
5.9
5.10
5.11
5.12
5.13
5.14
5.15
5.16
5.17
5.18
5.19
Décodage sous-optimal de l’image « Caps1615 » ......................................................... 119
Cas de décodage sous-optimal en termes de PSNR pour l’image « Caps » ................ 120
Cas de décodage sous-optimal en termes de score SSIM pour l’image « Caps » ....... 120
Organigramme de la métrique à référence réduite QIP ................................................ 123
Stratégie de transmission intégrant QIP pour un cas de figure « extrême » à trois
couches de qualité ........................................................................................................ 124
Distorsions typiques de JPWL ..................................................................................... 125
Comparaison des performances de la stratégie d’adaptation de lien avec ou sans
stratégie de décodage pour l’image « Caps » .............................................................. 127
Comparaison des performances de la stratégie d’adaptation de lien avec ou sans
stratégie de décodage pour l’image « Monarch » ........................................................ 127
Impact de la stratégie de décodage basée QIP pour l’image « Caps » ........................ 128
Impact de la stratégie de décodage basée QIP pour l’image « Monarch » .................. 129
Analyse visuelle de l’impact de la stratégie de décodage pour « Caps1567 » ............... 131
Analyse visuelle de l’impact de la stratégie de décodage pour « Caps886 » ................. 132
Analyse visuelle de l’impact de la stratégie de décodage pour « Monarch780 » .......... 133
Analyse visuelle de l’impact de la stratégie de décodage pour « Monarch1012» .......... 134
Base d’images utilisée : (a) Caps, (b) House et (c) Monarch ...................................... 135
Interface développée pour le test subjectif .................................................................. 137
Proportion de préférence des observateurs pour l’ensemble de la base d’images........ 138
Détail des scores moyens pour toutes les images et tous les observateurs .................. 138
Détail des scores moyens par image pour tous les observateurs ................................. 139
xiii
LISTE DES TABLEAUX
2.1
2.2
2.3
2.4
2.5
3.1
3.2
3.3
3.4
3.5
3.6
3.7
3.8
4.1
4.2
4.3
4.4
4.5
4.6
4.7
4.8
5.1
5.2
5.3
5.4
Distorsion des images tests pour un codage de 0,25bpp par couche de qualité avec
ou sans codage canal, en termes de PSNR (dB) et de score SSIM ................................ 54
Performances moyennes pour l’image « Caps » sans codage canal ............................... 62
Performances moyennes pour l’image « Caps » avec code RS(37,32) .......................... 62
Performances moyennes pour l’image « Monarch » sans codage canal......................... 62
Performances moyennes pour l’image « Monarch » avec code RS(37,32) ................... 62
Approximation du TEB cible pour les codes de la norme JPWL avec Bi = 10-9 ............ 73
Performances moyennes pour l’image « Caps » sans codage canal .............................. 82
Performances moyennes pour l’image « Caps » avec code RS(37,32) ......................... 82
Performances moyennes pour l’image « Monarch » sans codage canal ........................ 82
Performances moyennes pour l’image « Monarch » avec code RS(37,32) ................... 82
Performances moyennes pour l’image « Caps » avec code RS(37,32) et
modulation MAQ-16....................................................................................................... 84
Performances moyennes pour l’image « Monarch » avec code RS(37,32) et
modulation MAQ-16....................................................................................................... 85
Impact de l’erreur d’estimation sur la CSI en termes de PSNR moyen (en dB)
pour l’image « Caps » avec un code RS(37,32) ............................................................. 90
Programme d’initialisation pour la création de l’arbre ............................................... 100
Fonction récursive permettant la création de l’arbre répertoriant les configurations
de codage/transmission ................................................................................................. 101
Définition des paramètres de la configuration de base ................................................. 103
Distorsion (PSNR en dB et SSIM) des images tests pour un codage de 0,125bpp
par couche de qualité avec code RS(37,32) sur les données utiles............................... 103
Définition des paramètres de la stratégie d’adaptation de lien ..................................... 104
Performances moyennes pour l’image « Caps »........................................................... 106
Performances moyennes pour l’image « Monarch » .................................................... 107
Nombre moyen de configurations évaluées par l’arbre en fonction des conditions
de transmission ............................................................................................................. 110
Analyse des cas de décodage sous-optimal pour les images « Caps » et
« Monarch » ................................................................................................................. 121
Performances moyennes en fonction des conditions de transmission ......................... 128
Statistiques sur l’impact de la stratégie de décodage pour l’image « Caps » .............. 128
Statistiques sur l’impact de la stratégie de décodage pour l’image « Monarch » ........ 129
xv
INTRODUCTION
Avec le développement des appareils photographiques numériques, des smartphones
permettant de prendre des photos puis de les diffuser, de l’Internet et des médias, nous vivons
actuellement une ère où l’image tient une place fondamentale dans notre quotidien. Dans le
monde contemporain, ces images jouent, entre autres, un rôle d’information par le biais des
médias, de lien social (échanges personnels, réseaux sociaux, etc.) ou de support technique
comme dans le cadre de l’imagerie médicale ou des technologies liées à la surveillance (par
exemple aérienne, satellite, météorologique, vidéosurveillance), etc. Si l’on se focalise
uniquement sur l’aspect technique et non sur leur finalité, les images numériques sont
destinées à être stockées et/ou diffusées.
Le stockage des images numériques est un problème connu et traité depuis longtemps.
En effet, les images numériques constituent un média très lourd nécessitant beaucoup
d’espace mémoire pour être stockées dans leur format original. De la même manière, la
diffusion des images pose des problèmes vis-à-vis des ressources spectrales disponibles qui
sont, par nature, limitées. Pour faire face à cette problématique, une norme de compression
pour les images numériques a été mise au point via un comité d’experts en 1992, à savoir le
standard JPEG1. Le principe général de la compression consiste à supprimer les informations
non-perceptibles par les sens humain (la vision dans le cadre de l’image), afin de diminuer la
taille des données. Le standard JPEG a connu un succès très important. Il est d’ailleurs encore
utilisé. Toutefois, avec l’évolution des technologies, les algorithmes de compression ont dû
constamment s’adapter afin d’intégrer les contraintes ou les services liés aux applications
modernes. Le standard JPEG a ainsi évolué en 2002 vers le standard JPEG 2000, initialement
développé pour les applications multimédias de l’époque qui recouvraient entre autres la
photographie numérique, le cinéma numérique, l’imagerie médicale, l’Internet et la
transmission d’images sur canal sans fil (par le biais du codeur JPEG 2000 Wireless ou
JPWL).
Dans l’optique de moderniser son codeur, le comité JPEG a lancé en 2008 un appel à
projet en vue de créer le standard AIC2. Comme pour JPEG 2000 à son époque, l’idée est
d’intégrer de nouvelles fonctionnalités en lien avec l’évolution des technologies et des
pratiques. De cet appel à projet est né le projet ANR CAIMAN3 (Codage Avancée d’IMAges
et Nouveaux services) dans lequel s’inscrit cette thèse. L’objectif global de ce projet est
d’intégrer conjointement des services liés à la sécurité (tatouage) et à la robustesse pour la
transmission, sans sacrifier l’efficacité de la compression (étude de nouvelles transformées
fréquentielles) et la qualité perçue par l’utilisateur final (contraintes psychovisuelles). Les
travaux développés au cours de cette thèse, effectuée au département Signal Image
1
Joint Photographic Experts Group
Advanced Image Coding
3
Projet CAIMAN ANR-08-TO-002
2
1
INTRODUCTION
Communication (SIC) de l’institut XLIM à l’Université de Poitiers, se focalisent sur la
robustesse des images lors de la transmission sur canaux sans fil.
Le développement important des télécommunications auquel nous avons pu assister au
cours de ces dernières années a permis de s’affranchir de bien des difficultés liées à la
transmission. En outre, il est devenu possible de multiplier de manière exponentielle le
nombre d’utilisateurs de téléphone mobile, de permettre la transmission d’informations aussi
diverses que la voix, le texte ou l’image, et cela, avec une qualité de service (QoS4)
relativement fiable. Toutefois, de nouveaux défis technologiques se posent dans le domaine
des télécommunications qui doit s’adapter à de nouvelles contraintes. En effet, les
informations à transmettre deviennent toujours plus volumineuses avec, par exemple,
l’émergence de la Haute Définition (HD). Par ailleurs, les applications requérant un traitement
en temps réel sont également plus nombreuses. De plus, les supports de réception tendent vers
plus d’hétérogénéité, ce qui pose le problème de la gestion de la mémoire, de la résolution ou
de l’énergie qu’il faut considérer aussi bien pour un téléphone mobile que pour ordinateur
portable ou un PDA5. Concernant ces aspects, la notion de scalabilité semble être une réponse
appropriée et est devenue un enjeu majeur à intégrer dans les standards de compression (à
l’image du standard vidéo H.264 SVC6). Ces contraintes propres à la source (efficacité de
compression, scalabilité, etc.), s’additionnent à celles apportées par le canal de transmission.
Il faut ainsi s’affranchir du problème de multitrajets que l’on retrouve typiquement dans les
environnements urbains et suburbains, et qui est responsable du phénomène de sélectivité
fréquentiel. Il faut également pouvoir assurer la transmission dans un contexte de mobilité
(voiture, train) entraînant de l’effet Doppler. Pour résumer, il devient impératif d’assurer une
qualité de service sur des canaux soumis à de fortes variations spatio-temporelles.
Un des principes fondamentaux utilisé en télécommunication consiste à tirer profit de
la diversité offerte par le canal de transmission afin de lutter contre les dégradations apportées
par le canal sur le signal émis. En effet, au cours d’une transmission le canal est soumis à des
variations. Ces dernières peuvent tout d’abord être temporelles car le canal de transmission
n’est pas stationnaire dans le temps, en particulier dans un environnement urbain soumis à un
mouvement permanent (voitures, piétons, etc). Si le canal n’est pas stationnaire en temps, il
n’est également pas stationnaire en fréquence. Les environnements riches en multitrajets
conduisent au phénomène de retard de propagation entraînant la superposition d’ondes en
réception. Ces ondes vont être constructives ou destructives, conduisant ainsi à des plages de
fréquences favorables ou inexploitables. Ainsi, dans un schéma de télécommunication
classique constitué d’une antenne émettrice et d’une antenne réceptrice (SISO pour Single
Input Single Output), la diversité temporelle sera exploitée par une répétition du signal à
émettre espacée du temps de cohérence du canal (temps au-delà duquel les propriétés du canal
sont considérées changeantes). Toutefois cette technique induit un retard dû à la
retransmission et une baisse importante du débit utile. L’impact des variations temporelles du
canal peut également être minimisé par un entrelacement des données. La diversité
fréquentielle est généralement traitée par des modulations multi-porteuses. Ces modulations
permettent de considérer la transmission du signal en bande large sur plusieurs canaux à
bande étroite, permettant ainsi de minimiser l’effet des évanouissements fréquentiels.
Bien que ces techniques aient fait leurs preuves, elles restent limitées et ne peuvent
assurer une qualité de service garantie face aux contraintes susmentionnées. On peut alors
faire appel aux Code Correcteur d’Erreurs (CCE) mais leur utilisation abusive se fait au
détriment du débit utile. Dans le cadre du projet CAIMAN, la solution avancée pour pallier
4
Quality of Service
Personal Digital Assistant
6
Scalable Video Coding
5
2
INTRODUCTION
les difficultés liées à la transmission consiste à multiplier les techniques de diversité afin d’en
tirer parti. On fait en particulier appel à la technologie MIMO7 qui consiste à multiplier le
nombre d’antennes à l’émission et à la réception afin d’ajouter de la diversité spatiale. L’enjeu
de cette thèse consiste donc à proposer des solutions efficaces permettant d’assurer la qualité
de services pour la transmission d’images numériques dans des conditions de transmission
difficiles et via des systèmes MIMO. Pour ce faire, nous mettons en relation les particularités
liées au codage de l’image avec les spécificités du canal MIMO dans l’hypothèse de la
connaissance de l’état du canal (CSI pour Channel State Information) du côté de l’émetteur
(MIMO en boucle fermée). Cette connaissance permet, en particulier, de mettre en place des
stratégies de précodage qui agissent comme une pré-égalisation via l’optimisation d’un
critère.
Ce document est structuré en cinq chapitres :
Le premier chapitre a pour but d’introduire les notions de base pour la compréhension
du manuscrit. Nous présentons tout d’abord la chaîne de communication numérique à travers
les différents blocs qui la constitue. Puis nous étudions les spécificités du canal de
transmission sans fil, ainsi que les différentes méthodes pour le modéliser. Il s’en suit une
introduction aux systèmes MIMO avec la présentation du modèle en bande de base. Nous
terminons ce chapitre par une étude bibliographique des stratégies de transmission d’images.
Cette étude repose sur une classification des stratégies autour de trois points, à savoir, le
codage canal, l’allocation de la puissance et enfin l’usage de la modulation.
Le deuxième chapitre présente la stratégie de transmission mise en œuvre dans ces
travaux pour la transmission d’images codées en couches de qualité via le codeur JPWL.
Cette stratégie est basée sur l’usage des précodeurs MIMO et la correspondance entre les
hiérarchies de la source et du canal. Nous présentons donc le principe du précodage linéaire
qui repose sur une transformation du canal MIMO en canaux SISO virtuels. Ce chapitre décrit
également les précodeurs diagonaux et non-diagonaux qui sont utilisés dans le cadre de nos
travaux. Nous évaluons les performances de la stratégie de transmission avec les différents
précodeurs MIMO, sur un canal statistique ainsi que sur un canal réaliste modélisé via un
simulateur 3D à tracé de rayons.
Nous proposons, dans le troisième chapitre, une solution de précodage prenant en
compte la sensibilité du contenu aux erreurs de transmission. Les coefficients de précodage
sont déterminés en fonction des conditions du canal de transmission, du codage canal, de la
modulation et d’un TEB8 cible lié à la sensibilité du contenu. Après avoir détaillé le
fonctionnement de l’algorithme, nous évaluons ses performances sur le canal statistique et sur
le canal réaliste, en le comparant aux précodeurs de la littérature. Nous étudions en outre
l’impact du codage canal, de la modulation et des erreurs d’estimation sur la CSI.
Afin de rendre le schéma proposé adaptatif aux variations du canal de transmission, ,
nous détaillons, dans le quatrième chapitre, une stratégie d’adaptation de lien basée sur le
précodage développé dans le chapitre trois. Le but consiste à faire varier les paramètres liés au
codage canal, à la modulation et au codage source, afin de fournir un jeu de paramètres
optimaux pour minimiser la distorsion (au sens de l’erreur quadratique) des images reçues.
Après avoir formulé le problème d’optimisation et les contraintes associées, nous proposons
une méthode permettant d’évaluer les différentes configurations de codage/transmission. La
configuration minimisant l’erreur quadratique moyenne est alors sélectionnée pour la
7
8
Multiple Input Multiple Output
Taux d’Erreur Binaire
3
INTRODUCTION
transmission d’une image. Nous évaluons l’apport en termes de PSNR9 et de score SSIM10, lié
à cette stratégie ainsi que la gestion des ressources.
Le cinquième chapitre est une ouverture vers la notion de qualité d’expérience
(QoE ). Le problème formulé par la stratégie d’adaptation de lien est effectivement optimal
au sens de la QoS. Toutefois on démontre dans ce chapitre, qu’il ne l’est pas nécessairement
au sens de la qualité perçue par l’utilisateur. Nous proposons alors d’intégrer une métrique à
référence réduite basée sur des contraintes psychovisuelles afin d’évaluer les différentes
configurations de décodage qui se présentent en réception. L’intérêt de cette approche est
ensuite corroboré via une campagne de tests subjectifs sur un panel d’observateurs.
11
Enfin, nous terminons ce manuscrit par une conclusion et quelques perspectives.
9
Peak Signal to Noise Ratio
Structural Similarity
11
Quality of Experience
10
4
CHAPITRE 1
STRATEGIES DE TRANSMISSION D’IMAGES
SUR CANAL SANS FIL
Sommaire
1.1
Introduction
6
1.2
La chaîne de communication numérique
1.2.1
Le codeur de source
1.2.2
Le codeur de canal
1.2.3
Les modulations numériques
6
7
10
11
1.3
Le canal de transmission sans fil
1.3.1
Phénomènes liés au canal de transmission sans fil
1.3.2
Modélisation du canal de transmission sans fil
12
12
15
1.3.2.1
1.3.2.2
1.3.2.3
1.4
Modèles déterministes
Modèles statistiques
Modèle de canal réaliste considéré dans la thèse
Notion de diversité
15
16
17
19
1.5
Introduction aux systèmes MIMO
1.5.1
Modélisation du canal MIMO
1.5.2
Systèmes MIMO en boucle ouverte
1.5.3
Systèmes MIMO en boucle fermée
1.5.4
Les récepteurs MIMO
1.5.5
Association MIMO-OFDM
20
21
22
23
24
25
1.6
Etat de l’art sur les stratégies de transmission d’images
1.6.1
Stratégies de protection inégale contre les erreurs
1.6.2
Stratégies d’allocation de puissance inégale
1.6.3
Stratégies de transmission basées sur la modulation
26
27
30
33
1.7
Synthèse et conclusion
36
5
CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL
1.1 Introduction
Notre étude traite de la mise en œuvre d’une stratégie permettant la transmission
d’images sur un canal sans fil à travers un système MIMO. L’intérêt d’une stratégie de
transmission réside dans sa capacité à gérer efficacement les ressources disponibles au regard
des objectifs fixés compte tenu de l’application visée. Dans le cadre de notre étude, nous nous
intéressons à la robustesse des transmissions d’images sur des canaux sans fil dans des
environnements de transmission réalistes, propices aux erreurs. Dans ce contexte, nous
disposons de deux possibilités afin d’améliorer la robustesse de la communication.
Premièrement, nous tirons parti de la diversité offerte par le canal de transmission. Cette
diversité est principalement d’ordre temporel, fréquentiel et spatial. Deuxièmement, nous
tirons également parti des blocs constituant la chaîne de communication numérique en
utilisant conjointement les différents paramètres qui la compose. Ce type de stratégie est
communément appelé codage conjoint source/canal (JSCC12) dans la littérature. Dans la suite
de ce manuscrit, nous mettrons en œuvre des stratégies reposant sur ces deux principes.
Ce chapitre présente les notions de base permettant la bonne compréhension de la suite
du document. Au regard de notre problématique, nous aborderons d’une part, les différentes
composantes d’une chaîne de communication numérique, les propriétés des canaux de
transmission sans fil ainsi qu’une introduction aux systèmes MIMO. D’autre part, nous
présentons un état de l’art non exhaustif sur les stratégies de transmission d’images sur canal
sans fil.
1.2 La chaîne de communication numérique
L’objectif d’une chaîne de communication numérique est de transmettre un message
(appelé source) jusqu’à un destinataire. Le synoptique ci-dessous résume les différents blocs
composant une chaîne de transmission numérique :
Source
Codeur de
source
Codeur de
canal
Modulateur
Canal de
transmission
Message
Décodeur de
source
Décodeur de
canal
Démodulateur
Figure 1.1. Synoptique d'une chaîne de communication numérique
La source peut être de type analogique ou numérique. Dans le cas d’une source
analogique, cette dernière doit subir les étapes d’échantillonnage, de quantification et de
codage binaire afin d’être traduite en source numérique. Cette section résume brièvement les
12
6
Joint Source Channel Coding
CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL
différentes étapes de la chaîne de communication numérique. Des informations
complémentaires sont disponibles dans [1] et [2].
1.2.1 Le codeur de source
Un codeur de source a pour but de compresser l’information issue d’une image, d’un
son ou plus généralement d’un signal. Cette compression devient possible par une
décorrélation maximale (suppression de la redondance) des données constituant la source.
Une fois les données décorrélées, il devient aisé de supprimer certaines informations jugées
non destructrices du point de vue des sens humain. On va par exemple pouvoir supprimer les
hautes fréquences d’un son de manière à le compresser sans dommage pour l’écoute après
reconstruction. L’intérêt de cette opération est d’économiser les ressources mémoire pour
répondre à des problématiques de stockage, ou bien de limiter le besoin en ressources
physiques lors de la transmission sur un support de transmission. Dans le cadre de notre
étude, la source considérée est une image. Le codeur de source se présente généralement selon
le schéma suivant :
Domaine spatial : pixels
Domaine fréquentiel : coefficients fréquentiels
Image originale
Transformation
fréquentielle
Quantification des
coefficients
Codage à longueur fixe
ou variable
Flux binaire
compressé
(stockage,
transmission)
Figure 1.2. Synoptique d’un codeur de source appliqué à l’image
Transformée fréquentielle
Au sein d’une chaîne de codage d’image ou de vidéo, on trouve toujours une phase de
transformation fréquentielle. Cette phase a pour but de passer du domaine spatial, caractérisé
par les pixels, au domaine fréquentiel caractérisé par des coefficients fréquentiels. L’intérêt
d’utiliser une transformée fréquentielle tient dans sa capacité à décorréler l’information
présente dans l’image tout en assurant sa reconstruction. Ainsi, on constate qu’une grande
partie de l’information utile est concentrée dans un faible pourcentage du domaine spectral
(ou fréquentiel). Dans le cadre de la compression d’image, on utilise usuellement la
transformée en cosinus discrète (DCT13) [3] et la transformée en ondelettes (DWT14) [4]. On
distingue les transformées irréversibles conduisant à un codage avec pertes, des transformées
réversibles qui permettent un codage sans perte de l’information. Les transformées
irréversibles sont utiles lorsque l’on est contraint à un codage sans erreur, notamment pour les
applications médicales.
13
14
Discrete Cosinus Transform
Discrete Wavelet Transform
7
CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL
Quantification des coefficients
Par la suite, on trouve une étape de quantification [1]. Le but de cette dernière est
d’associer les coefficients fréquentiels à des classes (uniformes ou non-uniformes). Un
coefficient fréquentiel voit alors sa valeur modifiée et prend ainsi la valeur du représentant de
la classe. Cette étape est indispensable car il n’est pas possible de coder toutes les valeurs
représentées par les coefficients fréquentiels.
Codage à longueur fixe ou variable
La dernière étape consiste à coder les coefficients quantifiés. Si le codage est à
longueur fixe, les coefficients sont codés sur un nombre de bits défini et identique pour tous.
Le taux de compression dépend donc uniquement du nombre de coefficients à coder. Le
codage peut également être à longueur variable (VLC15) [5]. C’est le cas des codages
entropiques dont le code de Huffman [6] est un exemple célèbre, ou bien des codes
arithmétiques [7]. Ce type de codage exploite la statistique d’apparition des coefficients
quantifiés en attribuant un nombre faible de bits aux éléments les plus redondants et au
contraire, un nombre élevé de bits aux éléments les plus rares. Dans ce cas, le taux de
compression est plus important que dans le cas d’un codage à longueur fixe mais le flux
devient plus sensible aux erreurs.
Quelques normes de compression d’images
Nous présentons ci-dessous les principales normes de compression d’images
développées par le comité JPEG. Ce comité a été crée initialement pour concevoir une norme
internationale de compression d’image fixe :
• Codeur JPEG : Afin de concevoir un outil commun de travail pour les industriels et
la communauté scientifique, le groupe JPEG a standardisé en 1992 le codeur JPEG [8] qui est
certainement à ce jour, le codeur d’image le plus utilisé. Son fonctionnement repose
schématiquement sur un découpage de l’image en bloc de taille 8×8 pixels. On applique une
DCT sur chacun des blocs, puis les coefficients sont quantifiés de manière uniforme. Enfin un
balayage en zig-zag sur les coefficients quantifiés permet d’optimiser le codage entropique.
Le principal avantage du codeur JPEG réside dans son extrême simplicité. Toutefois, des
artefacts liés à la compression empêchent d’atteindre des taux de compression élevés. De
plus, en l’absence de stratégie de transmission, un flux binaire compressé par le codeur JPEG
se montre très sensible aux erreurs de transmission.
• Codeur JPEG 2000 : Devant la nécessité de moderniser son codeur, le comité JPEG a
lancé le projet JPEG 2000 [9] en 1997. L’objectif était alors de proposer une méthode de
compression innovante intégrant diverses fonctionnalités et objectifs en relation avec le
développement des applications multimédias de l’époque. Les thématiques visées par le
standard JPEG 2000 recouvrent, entre autres, la photographie numérique, le cinéma
numérique, l’internet, l’imagerie médicale, la transmission d’images sur canal sans fil. La
principale évolution par rapport au codeur JPEG concerne l’implémentation de la transformée
en ondelettes. Cette transformée offre la possibilité d’un codage avec pertes (ondelettes 9/7 de
Daubechies) ou sans perte (ondelettes 5/3 de Le Gall). Ce codeur permet également de faire
de la scalabilité en qualité ou en résolution et du codage par régions d’intérêt (ROI16). On
retiendra en outre, la possibilité de coder une image en plusieurs couches de qualité
15
16
8
Variable Length Coding
Region Of Interest
CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL
correspondant à des portions complémentaires de plans de bits. La figure 1.3 reprend le
principe de fonctionnement du codeur JPEG 2000.
Figure 1.3. Principe de fonctionnement du codeur JPEG 2000
Une première phase de prétraitement permet un sous-échantillonnage des composantes
couleurs et un découpage de l’image en zones (appelées tuiles) codées indépendamment les
unes des autres. Ce découpage permet un traitement moins complexe pour les images de
grandes tailles. Par la suite, une DWT est appliquée sur chacune des tuiles puis les
coefficients d’ondelette subissent une quantification scalaire uniforme avec zone morte.
Enfin, un codage arithmétique adaptatif, réalisé au moyen d’un codage par plan de bits
associé à un codeur arithmétique, est appliqué aux symboles issus de la quantification.
Le codeur JPEG 2000 présente la particularité d’intégrer des outils de robustesse aux
erreurs de transmission. L’idée est principalement de compartimenter les mots de code ou de
réduire leur longueur afin d’éviter la propagation des erreurs ou de limiter leur impact. Ainsi,
la norme prévoit des marqueurs de segment, une terminaison à chaque passe de codage, des
marqueurs de resynchronisation. Bien que ces outils limitent l’impact des erreurs de
transmission, ils s’avèrent insuffisants pour assurer la robustesse des transmissions d’images
dans des environnements de transmission difficiles.
• Codeur JPEG 2000 Wireless ou JPWL : Comme on vient de le signaler, les outils
de robustesse définis par le schéma de compression de base du codeur JPEG 2000 ne
permettent pas d’assurer la transmission d’un flux JPEG 2000 sur des canaux de transmission
soumis à d’importantes perturbations. Ces outils permettent uniquement de localiser ou
masquer les erreurs puis de resynchroniser le décodeur. De plus, ces outils ne s’appliquent pas
aux données d’entête qui sont les données les plus fragiles du flux JPEG 2000. Pour répondre
à ces problématiques et permettre une exploitation du codeur JPEG 2000 pour les applications
multimédias sans fil, le comité JPEG a défini l’extension JPWL (JPEG 2000 – Part 11) [10]
9
CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL
[11] [12] dédiée à l’intégration d’outils spécifiques pour la transmission d’images sur canaux
bruités. Ainsi, il a été défini trois nouvelles fonctionnalités qui sont :
- l’intégration de Codes Correcteurs d’Erreurs pour la protection des données avec
une protection accrue des données d’entête (stratégie UEP17) ;
- l’intégration d’un outil de description du degré de sensibilité aux erreurs des
différentes parties du codestream ;
- l’intégration d’un outil permettant la localisation des erreurs résiduelles dans le
codestream.
Ces nouvelles fonctionnalités peuvent être avantageusement employées afin de mettre
en place des schémas de protection intelligents tels que des stratégies UEP. Dans ce type de
schéma, les données les plus sensibles se voient attribuer une redondance plus importante
offrant une meilleure robustesse aux erreurs. Au regard de l’état de l’art, le codeur JPWL est
le seul standard de compression intégrant des outils spécifiques pour les transmissions
d’images sur canal sans fil. A ce titre, nous utiliserons ce codeur dans le cadre de nos
simulations.
• Codeur JPEG XR : Le défaut principal de JPEG 2000 tient dans sa complexité qui a
limité son développement auprès du grand public. Pour répondre à ce problème, le comité
JPEG a adopté le standard JPEG XR (pour eXtended Range) [13] en 2007. JPEG XR présente
de bonnes performances de compression pour une complexité et pour une utilisation mémoire
faible, tant au niveau du codeur que du décodeur. Il utilise pour cela une transformée
n’effectuant que des calculs sur des entiers, sans opération en virgule flottante, ce qui limite la
complexité tout en restant réversible. Il permet la gestion de format d’image de grandes
tailles et de différents types. Il permet également de réaliser une compression sans perte des
données. Initialement développé par la société Microsoft sous le nom de Windows Media
Photo puis de HD Photo, JPEG XR est prévu principalement pour des applications
photographiques de type « grand public », là où JPEG 2000 n’a pas su se positionner.
1.2.2 Le codeur de canal
Le codage de canal [14] a pour objectif de protéger l’information compressée issue du
codeur de source, des perturbations du canal de transmission. En effet, le codage de source
permet un gain en compression mais rend le flux compressé très sensible aux erreurs. Une
erreur dans le flux binaire compressé peut être à l’origine d’une désynchronisation en
réception. La protection de l’information est réalisée par le biais de CCE. Leur rôle est
d’introduire, de manière parfaitement contrôlée, de la redondance dans la séquence
compressée. Cette redondance permet par la suite de détecter, voire de corriger certaines
erreurs de transmission. Un CCE est défini par son rendement R. Pour un bloc d’information
en entrée de taille K, le CCE fournit un bloc codé en sortie de taille N avec K < N. Le
rendement du CCE se définit alors par la relation :
R=
K
N
(1.1)
Plus la valeur de R est petite et plus la redondance introduite est importante, augmentant de la
même manière la capacité de correction du CCE.
17
Unequal Error Protection
10
CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL
On distingue deux familles de CCE, à savoir les codes en blocs linéaires [14] et les
codes convolutifs [15]. Les codes en blocs linéaires fournissent un bloc d'information codé
dépendant uniquement du bloc courant en entrée. De la même manière, les codes convolutifs
prennent en compte le bloc courant à coder, mais également les blocs codés précédemment.
Par conséquent, les codes convolutifs introduisent un effet mémoire. En 1993, Berrou et al.
ont présenté le principe des Turbo-codes [16], qui consiste à utiliser deux codeurs convolutifs
récursifs fonctionnant en tandem. Ce type de codage canal permet d’approcher la limite
théorique d’entropie formulée par Shannon [2].
1.2.3 Les modulations numériques
Le rôle de la modulation est d’adapter le signal au support physique de transmission.
Ainsi, le modulateur sert d’interface avec le canal de transmission. Une modulation
numérique a pour objet de faire varier un paramètre d’une onde porteuse en fonction du signal
à transmettre (signal modulant). Le paramètre considéré caractérise le type de modulation mis
en œuvre. On peut ainsi faire varier l’amplitude (PAM18), la phase (PSK19) ou bien la
fréquence (FSK20) de l’onde porteuse.
Dans le cadre de nos travaux, nous utiliserons la Modulation d’Amplitude en
Quadrature (MAQ) qui consiste à moduler l’onde porteuse de manière combinée en amplitude
et en phase. Ce type de modulation est très utilisée dans le domaine des communications
numériques tel que la téléphonie mobile ou la Télévision Numérique Terrestre (TNT). Nous
ne considérons comme contrainte que la puissance moyenne des symboles disponibles, qui
doit être unitaire :
[ ] = M1 ∑ s
E si
M
2
i =1
2
i
=1
avec
si ϵ
(1.2)
où E[.] est l’espérance mathématique ; M représente le nombre de symboles de la
constellation ou l’ordre de modulation ; si est un symbole et est l’ensemble complexe des
symboles disponibles.
L’ensemble des symboles complexes forme la constellation MAQ dont les points sont
répartis uniformément dans le plan complexe (fig. 1.4). La distance séparant deux points de la
constellation correspond à 2 β M avec βM défini par [17] :
βM =
3
2( M − 1)
avec
M = 2 n pour n = 2, 3, 4, …
(1.3)
Il est à noter que du fait de la contrainte sur la puissance moyenne (1.2), l’aire des
différents carrés de la figure 1.4 est la même.
18
Pulse Amplitude Modulation
Phase Shift Keying
20
Frequency Shift Keying
19
11
CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL
Partie imaginaire
M = 64
2 βM
M = 16
M=4
Partie réelle
Figure 1.4. Répartition des symboles dans le plan complexe pour les constellations MAQ-4,
MAQ-16 et MAQ-64
1.3 Le canal de transmission sans fil
La propagation sur un canal sans fil d’un signal entre un émetteur et un récepteur est
largement tributaire des caractéristiques du milieu de propagation ainsi que du système
d’émission/réception (les antennes). Dans le cas d’un canal de transmission sans fil, les ondes
électromagnétiques acheminent l’information de l’émetteur vers le récepteur en subissant des
perturbations. Ces perturbations doivent être prises en compte dans l’élaboration d’une
stratégie de transmission. Cette section fait l’inventaire des phénomènes liés au canal de
transmission sans fil ainsi que les modèles les plus fréquemment employés pour caractériser
ce type de canal.
1.3.1 Phénomènes liés au canal de transmission
Le bruit radioélectrique
Le bruit radioélectrique est un phénomène indissociable des transmissions sans fil.
Lors d’une transmission, des signaux peuvent se superposer au signal émis perturbant ainsi le
décodage au niveau de la réception. On qualifie ces signaux de bruit de transmission car ils ne
sont porteurs d’aucune information utile. L’origine du bruit radioélectrique peut être très
diverse. Néanmoins, les principales sources de bruit radioélectrique ont pour origine le bruit
thermique des composants de la chaîne (dû à l’activité des électrons dans les semiconducteurs), le rayonnement cosmique et les interférences liées aux diverses activités
humaines. Dans une communication, le bruit se caractérise par sa puissance. On utilise alors
le Rapport Signal sur Bruit (RSB ou SNR21) qui décrit le rapport entre la puissance du signal
utile et la puissance du bruit. Le RSB est le paramètre de référence utilisé dans la littérature
scientifique pour évaluer l’état d’un canal de transmission. Le modèle le plus couramment
employé (et le plus simpliste) pour modéliser le bruit radioélectrique est le Bruit Blanc
21
Signal to Noise Ratio
12
CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL
Additif Gaussien (BBAG). On représente ainsi le bruit par une variable aléatoire X de type
gaussienne :
PX ( x) =
−
1
2πσ
2
e
( x −υ )2
2σ 2
(1.4)
où PX(x) est la densité de probabilité (ddp) liée à la variable aléatoire X ; υ représente la
moyenne et σ2 représente la variance.
Les atténuations du canal de transmission
Le canal de transmission sans fil a pour effet d’atténuer la puissance du signal émis. Il
existe plusieurs types d’atténuations (ou évanouissements) qui dépendent de la topologie de
l’environnement de transmission. Ainsi, plusieurs éléments sont à prendre en compte comme
la distance de transmission ou les bâtiments et les obstacles qui génèrent de nombreux échos.
La figure 1.5 résume les différentes atténuations pouvant perturber le signal émis.
Figure 1.5. Influence des évanouissements sur le signal transmis [18]
Les atténuations dépendent de la longueur d’onde λ du champ radioélectrique. Celle-ci
correspond à la distance parcourue par l’onde électromagnétique pour retrouver une amplitude
strictement identique. Elle s’exprime en mètre et se définit ainsi :
c
λ=
(1.5)
f
où c est la célérité environ égale à 3.108 m.s-1 et f est la fréquence de l’onde exprimée en Hz.
Nous distinguons trois types d’évanouissement :
• L’évanouissement à grande échelle : ce type d’évanouissement dépend
principalement de la distance entre l’émetteur et le récepteur. Il caractérise ainsi l’atténuation
moyenne de la puissance du signal émis. Ce type d’évanouissement apparaît typiquement sur
des distances de l’ordre de la centaine de longueur d’onde.
13
CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL
• L’évanouissement à moyenne échelle : principalement dû à l’effet de masquage du
signal lié aux bâtiments ou aux obstacles, l’évanouissement à moyenne échelle fait varier la
puissance du signal émis sur des distances de l’ordre de la dizaine de longueur d’onde.
• L’évanouissement à petite échelle : ce type d’évanouissement se présente sous forme
de fluctuations du signal sur des distances de l’ordre de la longueur d’onde. Leur origine est
liée au phénomène de trajets multiples.
Le phénomène de multi-trajets
Le phénomène de trajets multiples apparaît lorsque l’onde transmise entre en
interaction avec des diffuseurs (bâtiments, obstacles, véhicules, etc.) qui sont situés sur sa
trajectoire. En réception, le signal reçu est alors composé d’une superposition des signaux
provenant de différentes directions. On distingue trois types d’interactions à savoir : la
réflexion, la diffraction ou la dispersion (fig. 1.6). La réflexion apparaît à l’interface de deux
milieux et lorsque l’obstacle est grand devant la longueur d’onde du signal. La diffraction
intervient lorsque l’onde entre en interaction avec une arrête ou la pointe d’un obstacle. Enfin
la dispersion apparaît lorsque l’onde interagit avec un grand nombre d’objet dont la taille est
de l’ordre de la longueur d’onde ou inférieure.
A: trajet direct
B: réflexion
C: diffraction
D: dispersion
Figure 1.6. Illustration du phénomène de trajets multiples [19]
On matérialise le phénomène de multi-trajets par la Réponse Impulsionnelle (RI) du
canal de transmission. Le phénomène de multi-trajets implique l’apparition de répliques de
l’impulsion retardées par rapport au trajet direct ou au trajet principal. La combinaison de
toutes les répliques constitue la RI du canal de transmission. La RI est définie par [17] :
N
h(t ,τ ) = ∑ ai (t )δ (τ − τ i (t ))
(1.6)
i =1
où δ est l’impulsion de Dirac ; N est le nombre de trajets ; ai (t ) et τi sont respectivement le
gain complexe et le retard de propagation associés au trajet i.
14
CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL
L’effet Doppler
Un environnement de transmission est rarement totalement figé. La mobilité de
l’émetteur et/ou du récepteur ainsi que la mobilité des éléments composant l’environnement
de transmission (véhicules, piétons, etc.) sont à l’origine d’un décalage de fréquence appelé
effet Doppler. Cet effet dépend de la vitesse de déplacement et de la fréquence porteuse. Il
provoque un décalage fréquentiel de toutes les ondes composant le signal. D’un point de vue
fréquentiel, ce décalage se traduit par une expansion du spectre du signal. D’un point de vue
temporelle, cette expansion se traduit par une variation de la RI en fonction du temps [20].
1.3.2 Modélisation du canal de transmission sans fil
Il existe deux grandes familles de modèle permettant de prédire le comportement des
canaux de transmission radiomobiles. Ainsi, les modèles dits stochastiques ou statistiques ont
pour but de décrire les paramètres et les variations du canal par des variables aléatoires alors
que les modèles déterministes sont basés sur la description fine d’un environnement
particulier. Dans cette section, nous ne nous intéresserons qu’aux modèles utilisés dans le
cadre de nos travaux bien qu’il en existe de nombreux dans la littérature (voir par exemple
[17] et [20]). Ces modèles ont été choisis car ils sont très utilisés et régulièrement considérés
comme des modèles de référence.
1.3.2.1 Modèles déterministes
Les modèles déterministes ont pour objectif de déterminer la puissance reçue compte
tenu des caractéristiques du canal de transmission. Les modèles les plus connus pour
caractériser les variations à grande échelle sont le modèle en espace libre [21], le modèle à
deux rayons [21] ou le modèle à exposant [22]. Ces modèles présentent l’avantage d’être
simples mais ils sont souvent insuffisants pour modéliser fidèlement le comportement du
canal radiomobile. Pour modéliser de manière fine les interactions électromagnétiques sur un
environnement de transmission donné, on utilise les modèles à rayons. Ces modèles entrent
dans la famille des méthodes asymptotiques développées pour répondre à des problèmes
d’électromagnétiques de grandes envergures tels que la simulation de propagation d’ondes
électromagnétiques en milieu réel [23]. Ces méthodes sont basées sur l’Optique Géométrique
(OG) et la Théorie Uniforme de la Diffraction (TUD), où l’onde électromagnétique est
assimilée à des rayons. Cette approche est largement adoptée pour la conception de logiciels
de simulation du canal de transmission qui nécessitent, à leur tour, des méthodes pour
identifier les trajets se propageant entre un émetteur et un récepteur. Deux modèles découlent
directement de ces méthodes :
• Modèle à lancer de rayons : le principe de la méthode à lancer de rayons consiste
dans un premier temps à inonder l’environnement de rayons partant de l’émetteur. Suivant le
parcours de chaque rayon, l’algorithme détermine les différentes interactions
électromagnétiques entre les rayons et les obstacles constituant l’environnement étudié.
L’algorithme considère la géométrie et les propriétés électriques des matériaux rencontrés, et
seuls les trajets passant à proximité du récepteur sont retenus pour le calcul de la puissance
reçue. La précision des résultats obtenus par la méthode à lancer de rayons dépend du nombre
de rayons à lancer et du pas angulaire choisi pour couvrir l’environnement 3D. De plus, le
nombre de rayons qui sont exploités dépend du pas angulaire considéré.
15
CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL
• Modèle à tracé de rayons : Le modèle à tracé de rayons [24], détermine sans aucune
approximation les rayons qui peuvent se propager d’un émetteur vers un récepteur.
L’opération de recherche des rayons qui existent entre le couple émetteur-récepteur s’effectue
par la méthode des images ou celle du pliage [25]. L’atténuation de chacun des trajets reçus
est alors déterminée par la somme de l’atténuation causée par l’interaction de l’onde avec les
obstacles en prenant en compte les propriétés électriques des matériaux et l’atténuation liée à
la partie de propagation de l’onde en espace libre calculée par la loi de Friis (modèle en
espace libre). Le tracé de rayons est plus précis que le lancer de rayons, puisqu’il calcule les
trajets de manière déterministe entre un émetteur et un récepteur. Cependant, contrairement au
modèle à lancer de rayons, il est nécessaire de recourir à une simulation pour chaque
configuration d’émetteur-récepteur.
1.3.2.2 Modèles statistiques
Bien que généralement moins précis que les modèles déterministes, les modèles de
canaux issus de loi stochastique permettent de caractériser de manière simple le
comportement du canal de transmission sur de larges zones. De plus, ils présentent l’avantage
de n’utiliser que de faibles capacités mémoire, et permettent d’effectuer des simulations plus
rapidement qu’avec les modèles déterministes à rayons. Nous présentons ici, les deux
modèles statistiques que nous employons dans le cadre de nos travaux.
Le modèle de Rayleigh
La distribution de Rayleigh permet de modéliser les variations à petite échelle de
l’amplitude du signal reçu. Si le signal reçu Y à valeur yi est composé d’un nombre important
de trajets de faible amplitude y i et d’ordre de grandeur comparable, et que la phase de
chacun des trajets est uniformément répartie sur l’intervalle [-π ; π], on peut assimiler la
densité de probabilité des trajets reçus (somme des variables yi) à une variable aléatoire
gaussienne (théorème central limite). Les valeurs d’amplitude et de phase représentent alors
les réalisations de deux variables aléatoires gaussiennes indépendantes. Ces conditions se
vérifient souvent dans le cadre de transmission en non-visibilité directe (cas NLOS22) dans un
environnement de transmission riche en multi-trajets. Pour de telles configurations,
l’amplitude Z du signal reçu Y est décrite par la ddp de Rayleigh [20] :
PZ ( z ) =
z
σ2
e
 z2
−
 2σ 2





(1.7)
où 2σ2 représente la puissance moyenne efficace du signal reçu.
Le modèle de Rice
Le modèle de Rice permet de modéliser les évanouissements à petite échelle lorsqu’il
existe un trajet prédominant (par exemple le trajet direct : cas LOS23) entre l’émetteur et le
22
23
Non Line Of Sight
Line Of Sight
16
CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL
récepteur. En effet, en cas de prépondérance d’un trajet, les statistiques de l’amplitude et de la
phase ne correspondent plus au modèle de Rayleigh. On peut alors montrer que dans de telles
circonstances, la ddp de l’amplitude Z du signal suit la distribution de Rice [20] :
PZ ( z ) =
2 z ( K + 1)
z2
e
2

 − K − ( K +1) z

2
z






K ( K + 1) 
I 0  2 z

z2


(1.8)
où I0(x) est la fonction de Bessel modifiée de 1ère espèce d’ordre 0 ; z 2 = 2σ 2 + A 2 est la
A2
.
valeur efficace de z considérant A l’amplitude du trajet direct et K =
2σ 2
Il existe d’autres modèles statistiques décrits dans la littérature tels que les modèles de
Nakagami [20] ou log-normale Shadowing [17], …
1.3.2.3 Modèle de canal réaliste considéré dans la thèse
Dans le cadre de cette thèse, nous mettons en œuvre un canal de transmission réaliste.
Nous utilisons un modèle de propagation déterministe basé sur la méthode à tracé de rayons
utilisé dans [19] et [26]. Ce modèle de propagation a été développé au département SIC de
l’institut XLIM de l’Université de Poitiers [27] [28]. Cet outil prend en entrée
l’environnement de simulation 3D, les positions de l’émetteur et du récepteur dans
l’environnement, la fréquence de la porteuse et le nombre d’interactions électromagnétiques
maximum à prendre en compte par le simulateur. En sortie, il fournit la RI complexe du
couple émetteur-récepteur. Cet outil intègre toutes les spécificités (géométriques et
électriques) liées à l’environnement, et modélise toutes les variations à petite, moyenne et
grande échelle d’un canal radiomobile. Le synoptique du simulateur est illustré par la figure
1.7 :
Entrées
Tracé de rayons 3D
Sorties
- Données géographiques
- Propriétés électriques des matériaux
- Positions de l’émetteur et du récepteur
- Type d’antenne : polarisation et directivité
- Fréquence porteuse
- Nombre d’interactions électromagnétiques
- Trajet direct
- Trajets réfléchis
- Trajets diffractés
- Trajets transmis
- Trajets combinant plusieurs
interactions
- Visualisation des rayons (2D/3D)
- Puissance reçue
- Zone de couverture
- Réponse impulsionnelle
- Angle d’arrivée et de départ des trajets
Interactions
- Optique géométrique (OG)
- Théorie de la diffraction (TUD)
Figure 1.7. Synoptique du simulateur de canal à tracé de rayons 3D [28]
La RI calculée par le simulateur fournit l’information sur la phase, l’amplitude et le
retard de chaque trajet existant entre l’émetteur et le récepteur. Par la suite, pour la chaîne de
communication numérique, nous générons les coefficients caractérisant le canal radiomobile
17
CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL
en utilisant une méthode couramment utilisée en pratique appelée méthode du filtre TDL24
[20]. Ci-dessous, nous décrivons succinctement les étapes permettant de générer les
coefficients suivant cette méthode.
Pré-traitement
Pour être utilisables dans nos simulations, les RI subissent une phase de pré-traitement
qui consiste à supprimer les trajets non-significatifs, ordonner les trajets suivant leur temps
d’arrivée puis échantillonner ces trajets par rapport au temps symbole (Ts) considéré. Pour
tous les trajets arrivés dans un intervalle [iTs ; (i+1)Ts], nous ne considérons qu’un seul trajet
correspondant à la somme de tous les trajets significatifs de l’intervalle. Dans nos travaux,
nous avons implémenté la couche physique correspondant au standard IEEE802.11n [29], qui
est une norme récente pour les transmissions sans fil intégrant la technologie MIMO. Ce
standard définit les valeurs de toute une série de paramètres pris en compte dans la phase de
pré-traitement des RI tels que la sensibilité du récepteur (détection des trajets significatifs) ou
la bande passante (définition du temps symbole).
Sélectivité fréquentielle
On modélise la sélectivité fréquentielle du canal de transmission par une Ligne à
Retard (LAR) [20]. Dans ce modèle, les coefficients qui multiplient chaque trajet varient en
fonction du temps. Cette caractéristique dépend de certaines hypothèses sur le canal de
transmission telles que la stationnarité au sens large (WSS25) et la non-corrélation des
éléments dispersifs de l’environnement (US26) [30].
Le simulateur 3D permet d’obtenir des RI modélisant de manière réaliste les
évanouissements à moyenne et grande échelle. Toutefois, pour modéliser de manière réaliste
les évanouissements à petite échelle, il faudrait lancer un nombre de simulations bien trop
élevé afin d’obtenir une grande quantité de coefficients pour chaque configuration du canal.
Ainsi, pour des raisons de temps de calcul prohibitif, nous faisons appel aux modèles
statistiques moins complexes de Rayleigh et de Rice. Pour chacun des groupes de trajets
réduits par la phase d’échantillonnage, on génère indépendamment le nombre de coefficients
souhaités suivant la distribution statistique de Rice pour les cas LOS et Rayleigh pour les cas
NLOS.
Sélectivité temporelle
La mobilité entre l’émetteur et le récepteur est source de sélectivité temporelle liée à
l’effet Doppler (voir §1.3.1). Une fois que tous les coefficients du canal ont été générés, on
prend en compte la sélectivité temporelle par l’intermédiaire de la Densité Spectrale de
Puissance (DSP) de Jakes [20]. Ce modèle de spectre Doppler n’est valide que sous certaines
hypothèses que l’on considère vérifiées dans le cadre de nos simulations :
- L’antenne d’émission est omnidirectionnelle ;
- Les angles d’arrivée des trajets sont uniformément distribués sur l’intervalle [-π ; π] ;
- La propagation de l’onde s’effectue dans le plan horizontal.
24
Tap Delay Line
Wide Sense Stationarity
26
Uncorrelated Scattering
25
18
CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL
La DSP S(f) de Jakes se définit ainsi :

2σ 2

 f

 π f Dmax 1 − 
 fD
S( f ) = 
 max



0




pour
f ≤ f Dmax
(1.9)
pour
f > f Dmax
où f Dmax est le décalage Doppler maximum qui dépend de la vitesse de déplacement v de
l’émetteur et/ou du récepteur, de la célérité c et de la fréquence fc de l’onde porteuse :
f Dmax =
v
fc
c
(1.10)
Une fois que les coefficients associés aux variations rapides du canal ont été générés
(Rice et Rayleigh), puis filtrés selon le spectre de Jakes, ils sont multipliés par les coefficients
complexes relatifs aux différents trajets déterminés par le simulateur de propagation. Ces
différentes opérations nous permettent de générer les RI d’un canal MIMO ergodique
directement utilisables dans nos simulations de transmission telle que la décrit l’équation
(1.6).
1.4 Notion de diversité
Pour combattre les évanouissements inhérents au canal de transmission radiomobile,
les systèmes de communication numérique tirent parti de la diversité. L’exploitation
intelligente de la diversité permet des gains importants en termes de robustesse (diminution
du TEB) et permet notamment d’augmenter la capacité et la couverture des systèmes radios.
On distingue principalement quatre types de diversité [31].
Diversité temporelle
Le canal radiomobile évolue au cours du temps en subissant des évanouissements
temporels. On définie alors un temps de cohérence Tc au cours duquel le canal est considéré
comme étant stationnaire. La diversité temporelle peut être utilisée en répétant l’information à
des intervalles plus grands que le temps de cohérence du canal. On peut également exploiter
la diversité temporelle par des techniques telles que l’entrelacement ou l’introduction de
redondance par l’intermédiaire de CCE.
Diversité fréquentielle
La sélectivité en fréquence provient du phénomène de multi-trajets qui fait interagir
entre elles des ondes constructives ou destructives à cause du phénomène de retard et de
combinaison des répliques. On introduit alors la notion de bande de cohérence Bc
correspondant à la bande passante pour laquelle le canal est considéré comme stationnaire. On
exploite la diversité fréquentielle en émettant le même signal ou des versions redondantes sur
différentes fréquences porteuses écartées d’au moins la bande de cohérence du canal. Il existe
plusieurs techniques exploitant la diversité fréquentielle telles que les modulations multi19
CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL
porteuses (dont l’OFDM27 est un exemple) [32], les techniques utilisant le saut de fréquence
[33] ou encore l’étalement de spectre [34].
Diversité de polarisation
On parle de diversité de polarisation [35] lorsqu’un même signal est émis et reçu sur
des ondes polarisées de manière orthogonale et dont les caractéristiques de propagation sont
indépendantes.
Diversité spatiale
On parle de diversité spatiale lorsque l’on multiplie le nombre d’antennes à l’émission
et/ou à la réception. Chaque antenne réceptrice va recevoir la somme des signaux émis sur les
différentes antennes émettrices. L’exploitation efficace de la diversité spatiale passe par une
disposition judicieuse des antennes permettant d’obtenir une décorrélation des différentes
trajectoires conduisant à l’obtention de différents échos des signaux émis. On introduit ainsi la
notion de distance de cohérence Dc en-dessous de laquelle les signaux émis et/ou reçus sont
fortement corrélés. On comprend aisément que si les antennes sont disposées de manière à
fournir le même écho sur chaque antenne réceptrice (forte corrélation entre les trajectoires), le
système MIMO n’apporte aucun avantage. Cependant, on peut montrer que pour des antennes
omnidirectionnelles, une distance entre les antennes de 0,4λ suffit à décorréler suffisamment
les trajectoires afin d’exploiter la diversité spatiale [36]. On diminue ainsi la probabilité qu’un
évanouissement apparaisse en même temps, ou sur la même bande de fréquence pour les
différentes trajectoires. La diversité spatiale est un bon moyen d’augmenter la capacité des
systèmes. On rappelle que la capacité est une mesure de la quantité maximale d’information
qui peut être transmise sur un canal puis reçue avec une probabilité d’erreur négligeable.
Les différentes techniques permettant d’exploiter la diversité peuvent
avantageusement être combinées afin d’augmenter significativement la robustesse des
transmissions, généralement au prix d’une complexité accrue. On peut par exemple citer les
systèmes MIMO-OFDM qui allient efficacement l’exploitation de la diversité spatiale et de la
diversité fréquentielle.
1.5 Introduction aux systèmes MIMO
Au cours des dernières années, le développement massif des télécommunications a
posé des problèmes techniques liés à l’évolution des pratiques des usagers (téléphones
mobiles, smartphones, tablettes, etc.). En effet, le nombre d’usagers a augmenté de manière
rapide autour du développement de nouveaux services exigeants en ressources. Face à la
limite physique posée par l’exploitation de la bande passante des canaux radiomobile, la
communauté scientifique et industrielle s’est largement tournée vers les systèmes multiantennaires (ou système MIMO) afin d’apporter des solutions efficaces aux problèmes
précités. Les travaux de Telatar [37] et Foschini [38] des laboratoires Bell, ont montré que la
capacité des systèmes multi-antennaires augmentait linéairement avec le nombre d’antennes
émettrices, permettant ainsi de dépasser largement la limite théorique de Shannon [2]. Depuis
ces travaux, plusieurs architectures ont été proposées pour les systèmes MIMO permettant
27
Orthogonal Frequency Division Multiplexing
20
CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL
d’améliorer la robustesse et/ou le débit de la transmission. Les développements modernes des
techniques MIMO ont permis à ces techniques d’être intégrées dans les standards de
télécommunication tels que les normes Wifi (IEEE802.11n) [29], Wimax (IEEE802.16e) [39]
ou Long Term Evolution (LTE) [40]. Dans cette section, nous présentons les éléments de base
permettant de caractériser une transmission MIMO. Nous présentons également une
classification des architectures MIMO basée sur la connaissance ou non de l’état du canal
MIMO du côté de l’émetteur.
1.5.1 Modélisation du canal MIMO
Dans le cadre de nos travaux, nous nous limitons à l’utilisation d’un modèle monoutilisateur dans un canal bande étroite. Nous considérons également la synchronisation et
l’échantillonnage comme étant parfaits.
Considérons un système MIMO avec nT antennes émettrices et nR antennes réceptrices
tel qu’il est représenté sur la figure 1.8 :
h 11
h 21
1
Données
à émettre
Codage et
modulation
2
h 1nT
1
h nR 1
2
Démodulation
et décodage
Données
reçues
h nR nT
nR
nT
Figure 1.8. Schéma de transmission MIMO à nT × nR antennes
La transmission d’un signal entre l’antenne émettrice i et l’antenne réceptrice j est
caractérisée par le gain complexe hji. En réception, chaque antenne reçoit la somme des
symboles transmis simultanément par les antennes émettrices. Le symbole reçu yj sur
l’antenne j s’écrit :
nT
y j = ∑ h ji si + n j
(1.11)
i =1
où si est le symbole transmis par l’antenne émettrice i et nj correspond à un échantillon de
bruit perturbant le signal. Le problème peut être représenté sous forme matricielle :
y = Hs + n
(1.12)
où s représente le vecteur de symbole transmis avec la contrainte E[s*s] = P0 (la puissance
totale transmise) ; y représente le vecteur de symbole reçus ; n représente le vecteur de bruit
en réception et H la matrice de canal contenant les gains complexes caractérisant la
transmission entre les différents couples d’antennes :
21
CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL
 h11

H =
 hn 1
 R
h1nT 


hnR nT 
(1.13)
Les éléments de la matrice de canal H peuvent être de nature stochastique et ainsi
modélisés par les distributions présentées dans le paragraphe 1.3.2.2. Dans la suite de l’étude,
nous considérerons le modèle de canal réaliste défini dans le paragraphe 1.3.2.3 ainsi qu’un
modèle de canal statistique que nous modélisons grâce à la distribution de Rayleigh qui
définit les éléments complexes de H comme étant des variables aléatoires indépendantes et
identiquement distribuées (iid) de loi gaussienne de moyenne nulle et de variance unitaire.
L’estimation de la matrice de canal, que l’on appelle également CSI, est
particulièrement importante car sa connaissance va permettre d’optimiser de manière
significative la reconstruction du signal. En effet, si l’on connaît de manière précise l’impact
du canal sur les symboles transmis, on peut tirer parti de cette information afin de décoder
plus précisément les symboles reçus. De la même manière, la connaissance de cette
information avant l’émission des symboles peut s’avérer particulièrement intéressante. La
connaissance de la matrice de canal est obtenue par l’utilisation de séquence pilote et/ou
d’apprentissage [29]. L’obtention de la CSI permet donc de considérer deux familles de
techniques MIMO suivant que l’on connaît la CSI à l’émission ou à la réception.
1.5.2 Systèmes MIMO en boucle ouverte
On désigne par systèmes MIMO en boucle ouverte (OL-MIMO28), les systèmes
considérant uniquement la CSI du côté du récepteur (Rx-CSI). Cette famille de systèmes
MIMO peut être décomposée en trois sous-familles.
Multiplexage spatial
L’architecture originale proposée par Foschini dans [38] visait à augmenter de manière
significative la capacité des systèmes par le multiplexage spatial des symboles à émettre. Ces
systèmes sont désignés par l’appellation LST29 (fig. 1.9) dont l’architecture BLAST30 [38] est
un exemple connu.
{s 2 , s 1 }
{s 4 , s 3 }
Figure 1.9. Exemple d’architecture LST
Dans ce type de système, la capacité croît linéairement avec le nombre d’antennes
émettrices alors que le TEB décroît exponentiellement dans l’hypothèse d’un décodage
28
Open Loop MIMO
Layered Space-Time
30
Bells Laboratory Layered Space-Time
29
22
CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL
optimal. L’avantage majeur des architectures LST tient dans le fait que le nombre d’antennes,
l’efficacité spectrale de la modulation ou l’entrelaceur employé peuvent être facilement
ajustés car les différentes voies sont indépendantes.
Diversité
Plus tard, des études ont cherché à exploiter la diversité en introduisant le Codage
Spatio-Temporel (CST) [41]. L’idée était d’exploiter conjointement toutes les voies du
système MIMO afin d’augmenter la robustesse de la transmission. On a d’abord distingué les
CST en treillis (STTC31) développés par Tarokh et al. [42], puis les CST en blocs (STBC32)
[43] dont le code d’Alamouti est un exemple célèbre (fig. 1.10). Le principe des STBC
consiste à découper le vecteur de symboles à émettre en blocs de symboles, lesquels vont
subir un multiplexage à la fois spatial et temporel.
{ − s 2* , s1}
{ s1* , s2}
Figure 1.10. Exemple de code STBC : code d’Alamouti
Le schéma proposé par Alamouti se limitait initialement aux systèmes MIMO (2 × 2)
avant d’être généralisé par la suite par Tarokh et al. dans [44]. Ce type de codes permet un
gain important en termes de robustesse mais ne permet pas d’augmentation du débit par
rapport à une transmission SISO classique.
Compromis entre diversité et multiplexage
De nouvelles formes de code ont été proposées dans la littérature permettant
d’atteindre un compromis idéal entre gain de diversité et multiplexage. Nous pouvons citer
entre autres, les codes spatio-temporel algébriques diagonaux (DAST33) [45] et par couches
(TAST34) [46], ou les codes construits à partir d’algèbres de division tels que le Golden code
[47]. Pour plus d’informations, le lecteur peut se référer à [48].
1.5.3 Systèmes MIMO en boucle fermée
Les systèmes MIMO en boucle fermée (CL-MIMO35) disposent d’une voie de retour
entre le récepteur et l’émetteur. Il est ainsi possible d’utiliser la connaissance du canal à
l’émission (Tx-CSI) afin d’optimiser la transmission par une prise en compte anticipée du
canal. Cette opération est réalisée par des algorithmes appelés précodeurs dont le rôle est
d’exploiter au mieux la connaissance de la CSI afin d’optimiser conjointement l’émetteur et le
31
Space-Time Treillis Code
Space-Time Block Code
33
Diagonal Algebraic Space-Time
34
Threaded Algebraic Space-Time
35
Closed Loop MIMO
32
23
CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL
récepteur d’un système de communication. Les précodeurs présentent plusieurs avantages par
rapport aux systèmes OL-MIMO qui prennent en compte uniquement la CSI en réception :
- Ils exploitent mieux la diversité spatiale en comparaison des CST [18] ;
- Ils offrent la possibilité d’améliorer soit la robustesse (diversité), soit le débit
(multiplexage) ou bien un compromis entre le débit et la robustesse ;
- Ils permettent de décomposer le canal MIMO en plusieurs sous-canaux SISO
indépendants et parallèles.
Dans la littérature, nous distinguons différents types de précodage :
•
Précodage linéaire : la majorité des précodeurs de la littérature sont linéaires. Du côté
de l’émetteur, la CSI est utilisée pour répartir la puissance afin d’optimiser un critère
donné (capacité, RSB, erreur quadratique, etc.). En réception, un décodeur linéaire
réalise le décodage des échantillons reçus. L’optimisation mise en œuvre conduit à la
diagonalisation du canal (matrice H). On distingue les précodeurs diagonaux [49] [50]
qui présentent une matrice de précodage diagonale, des précodeurs non-diagonaux
[18] [50] qui ne présentent pas cette caractéristique.
•
Précodage OSM36 : La technique OSM [51] a récemment été introduite pour les
systèmes MIMO à boucle fermée. Le principe de la technique OSM est d’associer un
codage des symboles à une orthogonalisation par rotation. Une technique de
précodage basée sur un système OSM a été proposée dans [52] introduisant ainsi le
précodeur P-OSM qui optimise la distance euclidienne minimale de la constellation.
Diverses études ont montré que la connaissance de la CSI du côté de l’émetteur permet
d’augmenter efficacement la fiabilité de la transmission [18] [49] [50]. De plus, l’intégration
d’un précodeur dans la chaîne de transmission permet la mise en œuvre de stratégie
d’allocation de puissance inégale (UPA37). Par comparaison, en l’absence de CSI du côté de
l’émetteur, la répartition optimale de la puissance pour un système OL-MIMO est la
répartition uniforme [53]. Ainsi, nous baserons notre étude sur une architecture MIMO en
boucle fermée intégrant des précodeurs linéaires.
1.5.4 Les récepteurs MIMO
Suite à la transmission des signaux à travers le canal radioélectrique, les antennes
réceptrices récupèrent les différentes contributions formées par l’ensemble des signaux émis.
Il est alors nécessaire de mettre en œuvre une technique permettant de séparer ces
contributions afin de reconstituer les symboles transmis. Il existe beaucoup de récepteurs
MIMO dont les plus courants sont [18] [49] [50] :
- Forçage à Zéro (ZF38) : ce récepteur cherche à annuler les contributions des
émetteurs interférant. Il est relativement peu performant car il repose sur une
inversion de la matrice H pour supprimer l’Interférence Entre Symboles (IES) ce
qui peut dégrader les performances par une augmentation du bruit ;
- Erreur Quadratique Moyenne Minimale (MMSE39) : il diminue l’influence du
bruit mais il ne sépare pas parfaitement les différentes contributions ;
36
Orthogonalized Spatial Multiplexing
Unequal Power Allocation
38
Zero Forcing
39
Minimum Mean Square Error
37
24
CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL
- Annulation Successive d’Interférence (SIC40) : développé originalement pour le
système V-BLAST, ce récepteur décode d’abord l’information du signal le plus
fort, puis il retranche sa contribution aux autres signaux reçus, jusqu’au décodage
complet des symboles transmis. Cette technique est performante mais elle est
sensible aux propagations d’erreur de décision.
- Maximum de Vraisemblance (ML41) : ce récepteur présente les meilleures
performances en termes de TEB au prix d’une complexité accrue.
Dans le cadre de nos travaux, nous n’utiliserons que le récepteur ML compte tenu de
ses performances. En supposant un bruit gaussien et un canal H parfaitement connu à la
réception, le récepteur ML fournit la séquence de symboles estimés ŝ telle que :
ŝ = argmin || y – Hs ||2
s
(1.14)
Cette solution est optimale dans l’hypothèse de l’équiprobabilité des vecteurs ŝ.
Malgré tout, la complexité de décodage d’un récepteur ML croît exponentiellement avec le
nombre d’antennes émettrices. En considérant une constellation de modulation de taille M, le
récepteur doit calculer M nT vecteurs possibles ce qui peut devenir prohibitif dans le cadre de
constellation de grande dimension. Toutefois, dans le contexte d’un système MIMO précodé,
l’indépendance des sous-canaux SISO permet de limiter significativement la complexité du
récepteur ML. En notant b le nombre de sous-canaux SISO utilisés dans le cadre de la
transmission, la complexité du récepteur ML se limite à b×M.
1.5.5 Association MIMO-OFDM
La contrainte majeure des systèmes multi-antennaires réside dans la nécessité
d’utiliser les systèmes dans une bande de fréquence relativement étroite. Effectivement, les
systèmes MIMO ne fonctionnent que dans des environnements riches en diversité tels que les
environnements propices au multi-trajet. Afin d’éviter les IES, le temps symbole doit
nécessairement être largement supérieure au plus long des retards, réduisant ainsi la bande
passante utilisable. Il existe néanmoins une solution simple et efficace qui permet d’élargir la
bande passante du canal MIMO tout en conservant l’hypothèse de bande étroite [54]. Cette
solution consiste à associer un système MIMO à une modulation multi-porteuse.
L’OFDM [55] est une modulation multi-porteuse permettant de combattre
efficacement la sélectivité fréquentielle. Le principe consiste à diviser la bande passante du
canal de transmission en N sous-bandes indépendantes. Les symboles du signal à émettre sont
alors multiplexés sur les N sous-porteuses relatives aux N sous-bandes fréquentielles.
L’espacement entre les sous-porteuses est défini par rapport au temps symbole TS assurant
ainsi l’orthogonalité entre les sous-porteuses. Les N symboles sont transmis simultanément en
formant ainsi un symbole OFDM. Les symboles OFDM subissent d’abord une transformée de
Fourier discrète inverse (IFFT42) autour d’une fréquence porteuse f0 puis sont transmis sur le
canal. En réception, le signal subit les transformations inverses aboutissant à la reconstruction
des vecteurs de symboles émis.
40
Successive Interference Cancelation
Maximum Likelihood
42
Inverse Fast Fourier Transform
41
25
CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL
IFFT
e 2 jπ f 0 t
s0
e 2 jπ ( f0 +1 TS )t
Eléments
binaires
Modulation
MAQ-M
s0,s1,…,sN-1
Multiplexage
s1
∑
e
Signal
modulé

N −1 
t
2 jπ  f 0 +
TS 

sN-1
Figure 1.11. Schéma d’un modulateur OFDM
L’association MIMO-OFDM permet donc d’augmenter la bande passante du système
MIMO (bande large) en gardant l’hypothèse bande étroite caractérisant ainsi le canal par des
coefficients complexes. Finalement, le canal MIMO-OFDM large bande est modélisé par un
vecteur de N matrices H de taille (nT × nR), chaque matrice correspondant à la réponse du
canal pour la fréquence de la nième sous-porteuse avec n = 1,…,N. L’efficacité des systèmes
MIMO-OFDM a largement été démontrée et a fait l’objet de plusieurs standardisations [29]
[39] [40].
1.6 Etat de l’art sur les stratégies de transmission d’images
Avec le développement récent des communications sans fil, les transmissions de type
multimédia (image, vidéo, voix, données) se sont multipliées. Ainsi, de plus en plus
d’utilisateurs doivent se partager les ressources radio, qui sont par nature limitées. L’objectif
est alors de concevoir des stratégies de transmission permettant de gérer efficacement les
ressources compte tenu des contraintes des systèmes telles que la limitation de la bande
passante due au contexte multi-utilisateurs/multi-services, l’autonomie limitée des terminaux
mobiles, les contraintes de temps réels, etc.
L’objectif des stratégies de transmission est de régler au mieux les paramètres
constitutifs des différents blocs composant la chaîne de communication numérique. Dans ses
travaux sur la capacité [2], Shannon a montré que le codage de source nécessite uniquement la
connaissance de l’information sur le canal pour atteindre les performances de transmission
optimales. Ainsi, dès lors que l’information est transmise à un débit inférieur à la capacité du
canal, il y a très peu, voire aucune erreur introduite par ce dernier. Par conséquent, le
théorème de séparation énoncé par Shannon implique que l’on peut atteindre les performances
optimales en minimisant la distorsion de la source indépendamment du codage de canal.
Cependant, le théorème de séparation est valide uniquement sous certaines hypothèses qui se
vérifient rarement en pratique. Parmi ces hypothèses, nous pouvons citer les séquences
d’information qui doivent être ergodiques et de longueur infinie (conditions asymptotiques)
ce qui est contradictoire avec les stratégies de codage et de transmission adoptées par les
26
CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL
standards récents [9] [10] [29] [39] [40] qui traitent l’information par blocs de taille
relativement faible. On suppose également une connaissance parfaite de la capacité du canal
au niveau du codeur de source ce qui est difficile à envisager compte tenu de la nature
variable et imprévisible du canal radiomobile. De plus, le théorème de séparation n’est plus
valable si une contrainte de délai existe. Toutes ces contraintes ont orienté les travaux de
recherche vers de nouvelles stratégies de transmission basées sur l’optimisation conjointe du
compromis débit/distorsion par le codage de la source et le codage de canal, appelé stratégie
de codage conjoint source-canal.
L’optimalité dans les stratégies de transmission est une notion très dépendante des
systèmes mis en place ainsi que du contexte d’utilisation. On relève néanmoins trois facteurs
récurrents dans les problèmes d’optimisation. On trouve tout d’abord l’objectif du problème
d’optimisation. Dans le cadre de la transmission d’image, l’objectif consiste la plupart du
temps à maximiser la qualité de l’image reçue, ce qui revient à minimiser la distorsion.
L’objectif du problème d’optimisation est souvent « subjectif ». On rencontre alors
régulièrement le terme de qualité de service (QoS) pour caractériser le fait que l’objectif est
atteint de manière satisfaisante ou non. Afin de s’assurer que l’objectif est atteint, on intègre
un ou plusieurs critères « objectifs » servant de mesure justificative à la notion de QoS. Pour
la transmission d’image, le critère le plus courant est l’erreur quadratique moyenne, souvent
traduit en PSNR. On peut également trouver le TEB. Une fois que l’objectif et le critère sont
identifiés, il reste à définir la ou les contraintes que le système doit respecter. Les contraintes
sont généralement des ressources quantifiables et limitées (temps, puissance, débit, etc.). De
ce fait, les contraintes dépendent fortement du système considéré et des paramètres qu’il met
en jeu.
Dans cette section, nous présentons un état de l’art non-exhaustif des stratégies de
transmission d’images permettant de garantir une qualité de service.
1.6.1 Stratégies de protection inégale contre les erreurs
Les stratégies de protection inégale contre les erreurs, plus communément appelées
stratégies UEP, ont pour objectif principal d’exploiter la hiérarchisation des données issues du
codeur de source. Les données principales peuvent se voir attribuer un code correcteur de
rendement faible alors que les données relativement moins importantes se voient attribuer un
CCE de rendement important. Dans [56] et [57], cette stratégie a été appliquée pour la
transmission d’une image JPEG. Les auteurs exploitent le codage basé DCT du standard
JPEG afin de créer deux partitions contenant respectivement les coefficients AC43 (hautes
fréquences) et DC44 (basses fréquences). Des turbo-codes de rendements différents sont
appliqués sur les partitions conduisant à améliorer le TEB et le PSNR des images reçues en
comparaison d’un schéma de protection égale (stratégie EEP45) présentant une redondance
globale identique.
Il existe une plus forte hiérarchisation des données issues du codeur JPEG 2000. On
distingue en particulier une sensibilité importante de l’entête principale et de l’entête de tuile
(qui contiennent des informations spécifiques sur l’image et les paramètres de codage) en
comparaison des données dites utiles (correspondant aux coefficients fréquentiels) [58]. Cette
hiérarchisation des données a été exploitée dans divers travaux. Par exemple, les auteurs de
[59] ont proposé la mise en œuvre d’une protection particulière des entêtes JPEG 2000 par le
43
Alternative Components
Direct Components
45
Equal Error Protection
44
27
CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL
biais de métadonnées embarquées dans le flux. Les résultats montrent que la protection des
entêtes par des codes Reed-Solomon (RS) de rendement approprié permet une augmentation
significative du pourcentage de décodage des images sur des canaux fortement bruités. Les
auteurs proposent également une stratégie UEP sur les couches de qualité JPEG 2000. Ainsi,
on constate un gain significatif en termes de PSNR en faveur de l’UEP en comparaison de
l’EEP pour des TEB inférieurs à 4.10-2. On retrouve exactement la même philosophie dans
[60-63] qui font partie des travaux ayant aboutit à l’élaboration du standard JPWL. Ce
standard présente la particularité d’intégrer des outils permettant une mise en œuvre simple et
immédiate de stratégie UEP par le biais de codes CRC46 ou Reed-Solomon. Une analyse de la
robustesse à la transmission sur canal sans fil des standards JPEG, JPEG 2000 et JPWL est
fournie dans [64]. Les conclusions de cette analyse mettent en avant la supériorité de JPWL,
qui inclut une protection UEP prédéfinie sur les données d’entête, pour les transmissions sur
canal sans fil. Les auteurs relèvent toutefois que la protection des données utiles par des codes
CRC n’est pas intéressante en l’absence d’une stratégie de retransmission efficace. Ils
confirment également que les codes Reed-Solomon (notés RS(N,K), voir §1.2.2) fournissent
une forte protection mais que la robustesse issue des codes RS avec une capacité de correction
supérieure au code RS(64,32) ne justifie pas le coût vis-à-vis de l’augmentation de la bande
passante.
Les stratégies UEP ont prouvé depuis longtemps leur intérêt pour la transmission
d’images [65] [66] ou de vidéos [67] [68]. Toutefois, les stratégies UEP posent le problème
de l’allocation optimale du débit. Ainsi, l’objectif d’une stratégie UEP conjointe entre la
source et le canal est de trouver les débits à allouer au codeur de source et au codeur de canal
permettant d’atteindre les meilleures performances de transmission, sous la contrainte de la
bande passante.
Dans leurs travaux [69] [70] [71], Thomos et al. ont développé une stratégie UEP
optimale au sens du compromis débit/distorsion pour la transmission d’images sur canaux
sans fil sujets aux erreurs de transmission. Dans [69], les auteurs proposent un schéma UEP
pour un codeur basé ondelettes dont les sous-bandes sont codées en blocs par plans de bit. Les
données sont protégées grâce à des codes RCPC47-CRC. Dans [70], les auteurs proposent un
schéma UEP pour un codeur SPIHT48 [72] utilisant des turbo-codes et des codes RS. Une
détection CRC permet de vérifier l’intégrité de l’information et permet d’extraire directement
les données pour le décodage source si aucune erreur n’est détectée. On économise ainsi la
complexité liée au turbo-décodage en comparaison du schéma RCPC-CRC qui opère un
décodage canal des données reçues sans erreur. Dans [69] et [70], l’optimisation est réalisée
sous une contrainte de débit cible. Comme les paquets sont indépendants les uns des autres,
les auteurs exploitent l’hypothèse que la réduction de la distorsion associée au décodage d’un
paquet est cumulative. Ainsi l’allocation optimale entre la source et le canal est vue comme
un problème de maximisation de la réduction de la distorsion attaché au décodage d’un paquet
de données. La distorsion est alors exprimée en fonction de la probabilité de décodage d’un
paquet en fonction des paquets précédents, qui dépend du code canal utilisé. Finalement dans
[71], les auteurs appliquent la stratégie d’allocation optimale du codage canal développée
dans [70] en l’appliquant au codeur JPEG 2000 qui fonctionne sur le schéma du codeur utilisé
dans [69]. Les résultats montrent une amélioration du PSNR par rapport à d’autres schémas
UEP de la littérature. Toutefois cette solution conduit à une recherche exhaustive entre les
différents rendements de codes ce qui augmente exponentiellement la complexité de
l’algorithme.
46
Cyclic Redundancy Code
Rate-Compatible Punctured Convoltional
48
Set Partitioning In Hierarchical Trees
47
28
CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL
Dans [73] et [74], Agueh et al. ont proposé un schéma d’allocation de débit à
appliquer aux codes Reed-Solomon pour la protection des paquets ou des couches de qualité
d’un flux JPWL. Leur modèle est basé sur la maximisation d’un critère prenant en compte la
réduction de la distorsion associé au décodage correct d’une unité (paquet ou couche de
qualité) ainsi que le coût en octets associé à l’unité protégée par un code RS de rendement
donné. Cette optimisation repose sur une contrainte de bande passante disponible. Les
résultats montrent un gain en termes de PSNR et une amélioration du pourcentage de
décodage réussi pour des canaux présentant un faible RSB, en comparaison d’un schéma
EEP. Plus récemment, Agueh et al. ont complété leur stratégie de transmission [75] en
incluant un outil d’estimation de la bande passante afin d’adapter dynamiquement leur
stratégie UEP aux variations sur le canal.
Les auteurs de [76] proposent une approche similaire pour l’allocation d’un schéma
UEP pour la transmission d’image JPEG 2000. Deux classes de bits sont considérées, à savoir
les données d’entête et les données utiles. Le modèle propose un schéma UEP basé sur la
minimisation de l’erreur quadratique exprimée en fonction de la probabilité d’erreur sur les
paquets. Les auteurs font ainsi un lien entre l’erreur quadratique et le rendement des codes RS
afin de formuler un problème d’optimisation qu’ils résolvent par une recherche dichotomique.
Bien que l’approche soit sensiblement la même que pour [69] [70] [71] [73] [74] [75], ce
modèle permet de maximiser le PSNR en réception sous une contrainte de TEB cible donné,
ce qui apporte une souplesse supplémentaire au schéma proposé.
Les systèmes MIMO-OFDM présentent une architecture favorable pour la mise en
place de stratégie UEP. Dans [77], les auteurs présentent un schéma UEP pour un système
MIMO. La protection est réalisée dans le domaine spatial (via des codes spatio-temporels) et
dans le domaine temporel (via des codes convolutionnels poinçonnés). L’idée est d’assigner
un niveau de protection différent aux données utiles en fonction de leur importance, en
exploitant la redondance présente dans les deux domaines. Un haut niveau de protection peut
être assigné dans un domaine et un plus faible niveau dans l’autre domaine. La stratégie
consiste à obtenir un bon compromis entre efficacité de transmission et fiabilité. Pour jouer
sur la diversité spatiale, les auteurs utilisent trois codes en blocs différents à savoir du
multiplexage spatial de type BLAST, le code d’Alamouti et une combinaison de ces deux
techniques. Un simple récepteur ZF est utilisé afin de simplifier le décodage pour les trois
schémas de diversité spatiale. La stratégie proposée assigne un meilleur gain de codage et de
la diversité temporelle aux bits les plus importants alors que les bits les moins importants
utilisent plutôt la diversité spatiale avec un gain de codage inférieure. Les résultats montrent
que l’utilisation d’une diversité spatiale partielle (ou inégale) présente des résultats proches
d’un schéma utilisant complètement la diversité spatiale (perte d’environ 1dB49 sur le TEB).
Cependant, les auteurs montrent un gain de l’ordre de 25% sur le temps de calcul et une
amélioration significative du PSNR en comparaison d’un schéma sans diversité spatial.
Dans [78], les auteurs proposent un schéma UEP pour la transmission d’une image
JPEG 2000 sur un système MIMO-OFDM intégrant des codes STTC variables. Une image
JPEG 2000 est décomposée en couches de qualité protégées par des codes RS. Un
entrelacement est effectué au sein de chaque couche de qualité pour limiter l’impact des
erreurs par paquets. Puis, les couches sont à nouveau protégées par un code STTC. Un bloc
conjoint de contrôle de débit permet de déterminer le nombre de couche de qualité ainsi que le
rendement des différents codes à appliquer. L’optimisation est réalisée de telle sorte que la
réduction de la distorsion soit maximisée sous la contrainte que le débit nécessaire soit
inférieur au débit disponible.
49
Décibel
29
CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL
Enfin, les travaux présentés dans [79], proposent d’évaluer différentes stratégies UEP
sur un système MIMO pour la transmission d’images JPWL. La diversité spatiale est utilisée
par le biais de codes STBC (Alamouti, DAST et Golden code) alors que les données source
sont protégées par les codes RS du standard JPWL. Les meilleurs résultats sont fournis par la
combinaison de code STBC à faible gain de codage (Alamouti) avec des codes RS à forte
capacité de correction ou inversement, par l’utilisation de code STBC présentant un fort gain
de codage (Golden codes) avec des codes RS de rendement important. Toutefois, les auteurs
remarquent qu’aucun schéma n’est en mesure de surpasser les autres pour un état quelconque
du canal, ce qui implique de mettre en place des stratégies adaptatives afin de garantir la
meilleure qualité de service face aux fluctuations du support de transmission.
Finalement, les stratégies UEP étudiées montrent qu’il est indispensable de prendre en
compte la hiérarchisation des données issues du codeur de source. On constate en effet,
qu’une protection accrue des données les plus importantes pour la reconstruction de l’image
est essentielle, afin de pouvoir exploiter les images pour des canaux présentant de faibles
RSB. On retiendra également que la notion d’importance des données est souvent mise en
correspondance avec l’erreur quadratique moyenne. Ainsi les problèmes de minimisation de
la distorsion sous contrainte de débit se fait souvent au sens de l’erreur quadratique moyenne.
Les systèmes MIMO présentent par ailleurs, des architectures intéressantes pour la mise en
place de stratégies UEP. Toutefois aucune architecture MIMO ne surpasse les autres pour tous
les états du canal, ce qui suggère d’intégrer de l’adaptabilité dans les stratégies de
transmission d’image.
1.6.2 Stratégies d’allocation de puissance inégale
L’idée de base dans les stratégies de transmission d’image ayant pour objectif
d’améliorer la robustesse aux erreurs est d’exploiter la hiérarchie entre les données en sortie
du codeur source. Dans le cadre des stratégies UEP, les données les plus importantes sont
protégées par des CCE avec une capacité de correction importante au détriment des données
les moins importantes. On constate ainsi une robustesse globale accrue en comparaison d’un
schéma EEP pour un débit équivalent. Ce principe peut également être décliné du point de
vue de la puissance. Effectivement, les systèmes de communication sans fil sont généralement
des systèmes contraints au niveau de la puissance d’émission. Ainsi, une gestion intelligente
de la puissance au regard du contenu transmis peut s’avérer bénéfique pour améliorer la
qualité de service. Divers travaux ont donc été menés ces dernières années afin d’optimiser
conjointement l’allocation de la puissance en fonction de la source. Tout comme pour les
stratégies UEP, l’idée de base est d’allouer une plus grande puissance aux données les plus
importantes pour minimiser la distorsion (généralement au sens de l’erreur quadratique
moyenne) au détriment des données les moins importantes tout en respectant la contrainte sur
la puissance totale d’émission [80].
Dans [81] et [82], Atzori et al. présentent une méthode pour la transmission d’images
JPEG 2000 comprenant une allocation inégale de la puissance entre les différents paquets en
fonction de leur contribution sur la qualité de l’image reconstruite. Dans ce schéma, le flux
JPEG 2000 est divisé en groupes de paquets transmis à travers différents sous-canaux avec un
débit et une puissance adaptés. Les résultats montrent un gain en termes de PSNR d’environ
30
CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL
4dB pour de faibles RSB sur un canal BBAG et un canal à évanouissement de Rayleigh, en
comparaison d’un schéma d’allocation égale de puissance (EPA50).
Dans [83], les auteurs proposent un algorithme qui alloue la puissance sur les bits en
fonction de leur importance sur la qualité de l’image reconstruite en termes d’erreur
quadratique moyenne. Ils montrent que l’algorithme proposé est en mesure de fournir un gain
de 3 à 4dB sur le RSB pour la transmission d’image à travers un canal à évanouissement de
Rayleigh sans aucune incidence sur la bande passante. Toutefois, ce schéma est à l’origine
d’une augmentation du PAPR51. Afin de limiter ce problème, ils proposent dans [84] un
algorithme qui adapte conjointement l’allocation de la puissance et le codage canal afin
d’améliorer la qualité des images transmises sans augmentation significative du PAPR. Ce
schéma exploite la hiérarchie entre les données représentant l’image. Un algorithme itératif
est développé pour trouver la combinaison optimale entre le codage canal et la puissance à
utiliser pour la transmission de chaque bit. L’optimalité du schéma est assurée au sens de
l’erreur quadratique moyenne sous contraintes de puissance et de débit. Les résultats de
simulations confirment que les bits les plus importants devraient toujours être protégés et
transmis avec plus de puissance que les bits de moindre importance qui peuvent être transmis
sans protection et avec moins de puissance. Les résultats montrent également que l’approche
conjointe permet un gain de 3dB en comparaison d’une configuration comprenant uniquement
du codage canal ou uniquement de l’allocation de puissance.
Dans [85], les auteurs proposent deux schémas pour la transmission d’images sur des
réseaux de capteurs sans fil. Les schémas proposés optimisent la gestion de la puissance pour
des réseaux de capteurs en boucle ouverte ou fermée. Les auteurs avancent que les deux
schémas permettent d’économiser de l’énergie car ils exploitent la transformée en ondelettes
de telle sorte que les images sont décomposées en de multiples niveaux de résolution avec
différentes priorités. Cette notion de priorité permet de rejeter certains paquets au niveau des
nœuds intermédiaires en fonction du niveau de charge de leur batterie. Cela permet d’obtenir
un compromis entre qualité de la transmission et gestion de l’autonomie des nœuds du réseau.
Une stratégie pour minimiser l’énergie d’un système sans fil pour la transmission
d’image en environnement indoor est également proposée dans [86]. Dans cette étude, le
système exploite la variabilité de l’information présente dans l’image et les multi-trajets du
canal sans fil. Les auteurs caractérisent la variabilité de l’information dans l’image par une
courbe de débit/distorsion alors que la variabilité du canal sans fil est caractérisée par sa
réponse impulsionnelle. Dans l’approche proposée, les auteurs utilisent un algorithme
dynamique qui permet de fournir la configuration de puissance optimale en fonction de
contraintes sur le TEB en réception.
Une méthode d’allocation conjointe de la puissance et du codage source est également
proposée dans [87] pour la transmission d’images à travers des canaux à évanouissement de
Rayleigh. Dans ce papier, le codage de la source est basé sur l’état du canal ce qui confère de
la robustesse au schéma global.
Dans [88] Sabir et al. proposent un modèle statistique pour estimer la distorsion liée à
la transmission d’une image JPEG. Le modèle proposé inclus les différentes composantes
d’un codeur entropique avec perte. En outre, il prend en compte les techniques de
compression telles que le codage d’Huffman, une modulation par impulsions et codage
différentiel (DPCM52 en anglais), et un codage à longueur variable. Les auteurs avancent que
le modèle proposé peut être utilisé dans la conception de stratégie de transmission JSCC
50
Equal Power Allocation
Peak to Average Power Ratio
52
Differential Pulse Coding Modulation
51
31
CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL
indépendamment de l’image transmise et sans avoir besoin de répéter la procédure
d’optimisation pour des conditions variables sur le canal de transmission. Cela est possible du
fait que le modèle est calibré en déterminant la distorsion moyenne pour un ensemble
d’images. Les auteurs présentent ainsi un schéma UPA pour la transmission d’images à
travers un canal à évanouissements de Rayleigh comme une application de leur modèle. Dans
ce schéma, l’image est divisée en plusieurs couches de qualité transmises avec une puissance
inégale respectant la contrainte sur la puissance totale pour chaque symbole émis. Les
résultats montrent un gain en termes de PSNR de l’ordre de 5 à 6dB pour de faibles RSB en
comparaison d’un schéma EPA. Cet écart important traduit en réalité, la possibilité
d’exploiter des images pour de faible RSB, là où ce n’est pas possible avec un schéma EPA.
Dans [89], les auteurs proposent un schéma UPA pour la transmission d’images JPEG
2000. Ce schéma est basé sur la minimisation de la distorsion au sens de l’erreur quadratique
moyenne. Ainsi, la puissance est allouée aux bits en fonction de leur contribution sur la
qualité de l’image reconstruite. Les auteurs présentent une étude intéressante en comparant
leur schéma avec des techniques UEP connues de la littérature dont celle développée par
Thomos et al. [71]. Les auteurs montrent ainsi une amélioration significative du PSNR
(jusqu’à 4dB de gain) ainsi qu’une moindre complexité de leur algorithme. Plus récemment,
les auteurs de [89] ont combiné leur modèle UPA pour la transmission d’images JPEG 2000
avec une modulation OFDM [90] ainsi que dans un schéma de transmission au sein d’un
réseau cellulaire [91]. Dans ce réseau la station de base utilise une modulation OFDM pour
les liaisons descendantes et les terminaux utilisent la technique SCFDE53 [92] pour les
liaisons montantes. Les auteurs justifient l’emploi de cette technique par une complexité
comparable à l’OFDM mais sans les inconvénients de l’OFDM (augmentation du PAPR et
grande sensibilité aux décalages en fréquence des sous-porteuses). Ce schéma est appliqué
pour différentes configurations de transmission (SISO, MISO54, SIMO55 et MIMO) avec
utilisation de codes STBC (Alamouti). Les résultats de simulations montrent une meilleure
qualité d’image pour la combinaison UPA et OFDM. Ces résultats prouvent également
l’intérêt d’utiliser un système multi-antennaire pour améliorer la qualité des images reçues.
Effectivement, les systèmes MIMO sont parfaitement adaptés à la conception de
stratégie UPA. Ainsi dans [93], Sabir et al. reprennent le modèle de distorsion présenté dans
[88] afin de proposer un schéma UPA pour la transmission d’images JPEG à travers un
système MIMO. Dans ce schéma, l’image est divisée en plusieurs couches de qualité qui sont
transmises simultanément par un multiplexage spatial sur les antennes. La répartition de la
puissance sur les antennes respecte une contrainte sur la puissance totale pour chaque
symbole transmis. Dans le cadre de ce schéma, les auteurs ont modifié le modèle de distorsion
présenté dans [88] afin de réaliser une optimisation adaptée à chaque image transmise plutôt
qu’une optimisation calibrée sur un ensemble d’images. Les auteurs notent une amélioration
significative de la qualité des images reçues en comparaison d’un schéma EPA qu’ils
attribuent au fait de considérer les statistiques liées à la source dans la conception du
processus d’optimisation et cela, sans incidence sur les ressources nécessaires.
Dans [94] et [95], Deepa et al. considèrent un problème similaire à celui traité dans
[93]. Ainsi, ils proposent un schéma ayant pour objectif la transmission efficace d’images
JPEG à travers un système MIMO utilisant du multiplexage spatial afin d’améliorer la
fiabilité et le débit de la transmission. Dans ce schéma, l’image est également divisée en
couches de qualité. L’antenne d’émission présentant le plus haut RSBI56 est sélectionnée pour
53
Single Carrier Frequency Domain Equalization
Multiple Input Single Output
55
Single Input Multiple Output
56
Rapport Signal sur Bruit plus Interférence
54
32
CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL
transmettre les couches les plus importantes. Puis l’antenne émettrice présentant le second
plus grand RSBI est sélectionnée et ainsi de suite jusqu’à l’allocation de toutes les données
composant l’image. La transmission est alors effectuée en utilisant un schéma UPA sur les
différentes antennes. Ces études viennent confirmer une fois de plus l’intérêt de l’UPA par
rapport à l’EPA afin d’améliorer la qualité de service pour la transmission d’images sur canal
sans fil.
Finalement, nous constatons que l’exploitation de la hiérarchisation des données par
une allocation inégale de la puissance permet d’augmenter significativement la qualité des
images reçues, en comparaison des schémas d’allocation égale. A l’image des stratégies UEP,
le critère de qualité est souvent lié à l’erreur quadratique moyenne. Le gain en qualité s’avère
généralement plus important que pour les stratégies UEP, et pour une complexité moindre.
Par ailleurs, les systèmes MIMO présentent un intérêt majeur pour ce type de stratégie. De par
leur architecture, il est aisé de faire varier la puissance d’émission des antennes pour
transmettre les différentes composantes hiérarchiques d’une image, augmentant ainsi la
qualité globale des images reçues dans des conditions défavorables. Néanmoins, on constate
que les stratégies UPA sont relativement peu utilisées conjointement avec des stratégies UEP.
Elles peuvent malgré tout parfaitement s’accorder entre elles, généralement au prix d’une
augmentation de la complexité du processus d’allocation des ressources.
1.6.3 Stratégies de transmission basées sur la modulation
Les stratégies de codage conjoint consistent à faire varier intelligemment certains
paramètres de la chaîne de communication. Divers travaux de la littérature ont donc cherché à
tirer parti de l’étape de modulation afin d’améliorer les performances des stratégies de
transmission. Parmi ces techniques nous pouvons citer en particulier les stratégies basées sur
l’utilisation de modulations adaptatives et de modulations hiérarchiques.
Priorité haute
Priorité basse
d2
d1
Figure 1.12. Constellation d’une modulation MAQ-16 hiérarchique
La différence entre une modulation classique et une modulation hiérarchique [96]
réside en l’interprétation des différents états de la modulation. Si l’on prend par exemple le
cas d’une modulation hiérarchique basée sur une MAQ-16 (fig. 1.12), l’emplacement du
symbole dans le quadrant est considéré comme une information spécifique. L’autre
information spécifique utilisée en modulation hiérarchique est le numéro du quadrant dans
33
CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL
lequel se trouve le symbole (1, 2, 3 ou 4). Ainsi, il est possible de considérer deux flux de
données indépendants transmis par le biais d’une seule constellation. Théoriquement, il s’agit
toujours d’une MAQ-16 (dans l’exemple considéré en fig. 1.12), mais sur le plan de
l’interprétation hiérarchique, cette modulation est considérée comme la combinaison de deux
MAQ-4. En contrôlant la distance entre d1 et d2 (fig. 1.12), on peut changer le niveau de
protection relatif des deux flux de bits offrant une flexibilité supplémentaire pour la mise au
point de stratégie de transmission. Les modulations hiérarchiques sont utilisées en particulier
pour la diffusion de la télévision numérique terrestre (norme DVB-T57). Cette stratégie a
également été utilisée dans divers travaux afin de fournir une protection inégale pour la
transmission de données multimédia sur canal sans fil. Par exemple, dans [97] et [98], Noh et
al. mettent en œuvre un schéma UEP basé sur l’utilisation de modulations hiérarchiques pour
un système MIMO-OFDM. Le flux de données issu d’un codeur source est divisé en deux
niveaux de priorité transmis par le biais d’une modulation hiérarchique. Ce type de stratégie
est également appliqué dans [99] pour des transmissions robustes de vidéo en temps réel.
Dans [100], les auteurs appliquent cette stratégie pour la transmission d’images. Dans ce
schéma, la stratégie de protection inégale est fournie à deux niveaux. Le premier correspond à
l’allocation des bits suivant leur priorité sur un des deux canaux de modulation hiérarchique
présentant une sensibilité différente aux erreurs de transmission. Le deuxième niveau de
protection est assuré par un schéma UEP classique utilisant des codes RCPC-CRC à
rendement variable. Dans le système proposé, les paramètres liés à la modulation hiérarchique
et les rendements de codage canal sont fournis via un algorithme minimisant la distorsion au
sens de l’erreur quadratique moyenne. Les auteurs montrent ainsi que la combinaison de
méthodes UEP basées sur des CCE et des modulations hiérarchiques permet d’améliorer la
fiabilité et la flexibilité des stratégies de transmission d’images.
Une autre manière d’inclure la modulation dans une stratégie de transmission consiste
à faire varier l’ordre de la modulation afin que celui-ci s’adapte au mieux aux conditions sur
le canal de transmission. Cette stratégie, appelée modulation adaptative, est une des
optimisations de base dans les stratégies d’adaptation de lien [101] [102] qui consistent à
adapter dynamiquement les paramètres de la chaîne de communication pour faire face aux
variations sur le canal de transmission. Par exemple dans [103], les auteurs étendent le travail
présenté dans [83] pour optimiser conjointement l’ordre de modulation avec l’allocation de la
puissance, pour la transmission d’images non-compressées. L’optimisation est réalisée dans le
but de maximiser le PSNR des images reçues. L’image sous format numérique est traduite en
signal binaire où chaque échantillon est codé sur N bits. Dans un premier temps, les données
sont démultiplexées en N sous-flux parallèles où chaque sous-flux contient les bits
d’importance équivalente. Ainsi les MSB58 sont regroupés ensemble puis les suivants,
jusqu’aux LSB59. Ensuite chaque sous-flux est transmis avec un ordre de modulation et un
niveau de puissance respectifs, calculés à partir d’un algorithme exhaustif minimisant la
distorsion. Les résultats de simulation sur canal BBAG et sur canal à évanouissements
montrent des gains de l’ordre de 10 à 20dB en termes de PSNR en comparaison d’une
stratégie EPA avec modulation fixe. Néanmoins ce résultat impressionnant peut être relativisé
car il s’applique à des images brutes (sans compression) sur lesquels les erreurs de
transmission ont un impact très important en termes d’erreur quadratique, et donc de PSNR.
De plus, la configuration utilisée pour se comparer met en œuvre une MAQ-16 qui est
relativement sensible pour des configurations de transmission défavorables.
57
Digital Video Broadcasting-Terrestrial
Most Significant Bit
59
Least Significant Bit
58
34
CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL
Les auteurs de [104] et [105] proposent d’intégrer une modulation adaptative pour la
transmission d’une image ayant subie un codage par description multiple (MDC60) [106]. Le
codage MDC consiste à coder une source en N flux corrélés transmis sur N canaux
indépendants. Chaque flux peut être décodé indépendamment des autres offrant ainsi un
niveau de qualité donné qui peut être amélioré par le décodage complémentaire d’autres
descripteurs. Ce type de codage est exploité dans [104] et [105] afin de transmettre une image
sur un canal OFDM décomposé N sous-canaux. Les auteurs proposent alors deux schémas
adaptatifs comprenant modulation adaptative avec EPA et modulation adaptative avec UPA.
Un algorithme est proposé pour allouer conjointement la puissance et la taille des
constellations dans le but de maximiser le débit utile après décodage RS. Les simulations
permettent de comparer ces deux stratégies avec un schéma EPA et une modulation fixe. Les
résultats montrent que l’allocation conjointe de la puissance et de la modulation permet des
gains significatifs en termes de PSNR et de taux de perte de paquets pour des canaux
présentant des RSB relativement faibles. Toutefois, lorsque le canal présente un RSB
important, le gain atteint par l’UPA et la modulation adaptative est relativement faible par
rapport à la stratégie EPA avec modulation adaptative. Ces résultats suggèrent que la
modulation adaptative est l’élément principal permettant de gagner en qualité lorsque le canal
présente un RSB élevé.
Une stratégie de codage conjoint pour la transmission d’images à travers un système
MIMO-OFDM incluant des codes STBC et des modulations adaptatives est proposée dans
[107]. L’expression du TEB en réception de ce schéma est présentée. Elle permet par la suite
d’introduire un algorithme de recherche de la configuration optimale de l’UEP et de la taille
des constellations sous une contrainte de puissance totale. Ce schéma a pour objectif de
maximiser la qualité de l’image en réception au sens du PSNR. Les résultats de simulation
confirment l’intérêt de l’approche proposée.
Dans [108], les auteurs proposent un schéma d’adaptation de lien dans un système
MIMO-OFDM en boucle fermée. Dans cet article, les auteurs proposent une solution pour
résoudre le problème de la connaissance parfaite de la CSI à l’émission qui peut consommer
trop de bande passante. Ils proposent ainsi un algorithme qui permet aux récepteurs de
sélectionner une matrice de précodage au sein d’un dictionnaire ainsi qu’un schéma de
modulation et de codage (MCS61). Le récepteur renvoie ensuite la configuration optimale à
l’émetteur, limitant ainsi l’impact en termes de bande passante. Le choix d’une configuration
s’appuie sur la mesure de l’information mutuelle entre les entrées du canal discret et la sortie
d’un récepteur MIMO linéaire, qui est calculée à partir du RSBI. Cette information permet
d’évaluer les performances des différentes configurations disponibles afin de sélectionner
conjointement le nombre de couches multiplexées, les matrices de précodage et les schémas
MCS. Bien que cette stratégie ne soit pas appliquée à la transmission d’images, cette
adaptation de lien sur canal MIMO-OFDM en boucle fermée pourrait parfaitement convenir
pour la transmission d’images codées en couches de qualité.
Enfin, nous terminons cet état de l’art par la stratégie d’adaptation de lien proposée
dans [109] [110] [111] et [112]. Dans ces travaux, Houas et al. proposent une stratégie
d’allocation de ressources pour la transmission de données multimédias scalables sur un canal
OFDM. Dans ce schéma, le canal OFDM est divisé en N classes permettant de transmettre les
flux composant la source scalable hiérarchisée en N classes d’importance décroissante ayant
une influence inégale sur la qualité perçue en réception. Une première contrainte sur la QoS
se traduit par des TEB cibles par classe. D’un point de vue système, une contrainte sur le
60
61
Multiple Description Coding
Modulation and Coding Scheme
35
CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL
débit symbole maximal est également prise en compte. Un problème d’optimisation est alors
posé pour déterminer le nombre de classes à transmettre, les rendements de CCE appliqués à
chaque classe, et les modulations allouées à chaque porteuse OFDM. Le choix de ces
paramètres doit maximiser la quantité de données source transmise et prend en compte le RSB
des sous-porteuses OFDM. Concernant l’allocation des ordres de modulation, l’algorithme
proposé permet de convertir un canal OFDM sélectif en fréquence en canal OFDM équivalent
le moins sélectif en fréquence possible. Diverses applications telles que la transmission de
parole [109] [110] [111] ou la transmission d’images JPEG 2000 [112] montrent les bonnes
performances de ce schéma et l’intérêt de prendre en compte conjointement la pluralité des
paramètres composant la chaîne de communication.
L’intégration d’une stratégie de modulation adaptative est le meilleur moyen de
s’adapter aux conditions fluctuantes sur le canal de transmission. En effet, l’augmentation de
l’efficacité spectrale en relation avec l’état du canal, permet d’atteindre les gains les plus
importants parmi les stratégies étudiées. Là où les stratégies UPA et UEP permettent
essentiellement d’améliorer la QoS pour des canaux présentant de faibles RSB, la modulation
adaptative est en mesure d’améliorer la QoS pour de hautes valeurs de RSB. Ainsi, la
combinaison de stratégie UEP et/ou UPA avec des modulations adaptatives apparaît comme
un moyen efficace de garantir la QoS pour n’importe quel état du canal de transmission.
1.7 Synthèse et conclusion
Dans ce premier chapitre, nous avons introduit le contexte de ce travail à savoir la
transmission d’images sur canal sans fil. Pour cela, nous avons présenté succinctement les
différents blocs constitutifs de la chaîne de communication numérique tels que le codage
source, le codage canal et la modulation. Par la suite, nous avons évoqué les propriétés
spécifiques du canal de transmission radiomobile caractérisé par le phénomène de
multitrajets, la mobilité et le bruit de transmission. Les difficultés présentes sur le canal de
transmission peuvent être surmontées grâce à différentes techniques qui tirent parti de la
diversité du canal de transmission telles que l’usage de codes correcteur d’erreur, de
modulations multi-porteuses ou de systèmes multi-antennaires. A ce titre, les systèmes MIMO
apparaissent comme une technique incontournable permettant d’augmenter significativement
la capacité des transmissions sur canal sans fil. Nous avons ensuite présenté un état de l’art
sur les stratégies de transmission d’images pour des canaux sans fil qui illustre l’utilisation de
ces techniques pour garantir une meilleure qualité d’image en réception (que nous définissons
comme la QoS). De manière générale, ces stratégies sont basées sur la hiérarchisation des
données en sortie du codeur source. Cette hiérarchie est exploitée en attribuant une meilleure
protection aux données les plus importantes (meilleur CCE, plus de puissance, modulation
plus robuste) au détriment des données les moins importantes. Cette notion d’importance est,
dans la majeure partie des travaux, exprimée en termes de distorsion qui correspond à l’erreur
quadratique moyenne entre l’image originale et l’image reçue. L’allocation des ressources est
alors réalisée par le biais d’un problème d’optimisation ayant pour objectif de minimiser la
distorsion sous contraintes de puissance, de bande passante, de temps de transmission, etc.
Cet état de l’art permet de dégager quelques remarques à propos de ces stratégies. Les auteurs
ont démontré l’intérêt d’allouer les ressources de manière inégale (UEP, UPA et modulation
adaptative) par rapport aux stratégies plus classiques (EEP, EPA, modulation fixe). On
retiendra en particulier que les stratégies UEP sont efficaces pour améliorer la qualité des
images en réception mais que les stratégies UPA peuvent permettre un gain encore plus
36
CHAPITRE 1. STRATEGIES DE TRANSMISSION D’IMAGES SUR CANAL SANS FIL
important pour une complexité inférieure. On notera également que la modulation adaptative
est la stratégie la plus efficace lorsque le canal de transmission est caractérisé par un RSB
élevé. Les systèmes MIMO ou MIMO-OFDM permettent d’améliorer significativement les
performances et présentent une architecture particulièrement intéressante pour les stratégies
de protection inégale grâce au multiplexage spatiale des données d’importance différente et de
l’allocation des ressources propres à chaque couche. Toutefois, bien que différents travaux
proposent l’optimisation de plusieurs paramètres, la complexité croissante des problèmes
d’optimisation ainsi que leur résolution limite le nombre de contribution proposant un schéma
global et optimal pour l’allocation des ressources sur tous les blocs de la chaîne de
transmission.
Partant de ces constatations, nous proposons dans le second chapitre, une stratégie
pour la transmission d’image à travers un canal MIMO en boucle fermée incluant des
précodeurs. L’architecture proposée dans le cadre de cette stratégie est une première étape en
vue de régler conjointement l’ensemble des paramètres des différents blocs (codage source,
codage canal, modulation, précodage) de la chaîne de communication permettant de
maximiser la qualité des images en réception.
37
CHAPITRE 2
PERFORMANCES DES PRECODEURS LINEAIRES
POUR LA TRANSMISSION D’IMAGES JPWL
Sommaire
2.1
Introduction
40
2.2
Le précodage linéaire
2.2.1 Transformation en canal virtuel
2.2.2 Les précodeurs diagonaux
2.2.3 Les précodeurs non-diagonaux
40
40
42
46
2.3
Stratégie de transmission d’images sur canal MIMO
2.3.1 Motivations
2.3.2 Schéma de transmission
2.3.3 Décodeur JPWL robuste
48
48
49
50
2.4
Etude des performances des précodeurs linéaires
2.4.1 Contexte de simulation
52
52
2.4.1.1
2.4.1.2
2.4.1.3
2.4.1.4
2.4.2
Paramétrage de la couche physique
Paramétrage de la couche application
Métriques d’évaluation
Modélisation du canal
Résultats de simulation
2.4.2.1 Résultats sur canal statistique
2.4.2.2 Résultats sur canal réaliste
2.5
Synthèse et conclusion
52
52
54
55
56
56
59
64
39
CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES
JPWL
2.1 Introduction
Les stratégies de transmission conjointes reposent sur la mise en correspondance d’un
jeu de paramètres réglés conjointement afin d’atteindre un objectif donné. Dans ce deuxième
chapitre, nous allons introduire le schéma de transmission qui va nous servir de base pour la
mise en œuvre d’une stratégie globale d’adaptation de lien. Nous rappelons que le contexte de
transmission dans lequel s’inscrit ce travail concerne les environnements de propagation
sujets aux erreurs de transmission. Ces environnements sont caractérisés par les phénomènes
de multi-trajets, de mobilité et de bruit radioélectrique. Afin de combattre ces phénomènes,
nous exploitons la diversité du canal de transmission en mettant en œuvre un schéma MIMOOFDM en boucle fermée. Nous formulons l’hypothèse de disposer d’un retour d’information
sur l’état du canal de transmission, nous fournissant ainsi la CSI au niveau de l’émetteur.
Cette connaissance nous permet d’effectuer diverses opérations qui sont détaillées dans ce
chapitre.
Dans les sections qui vont suivre, nous introduirons le concept de précodage MIMO à
travers la transformation du canal MIMO en canaux virtuels équivalents. A partir de cette
représentation, nous présenterons différents précodeurs de la littérature qui permettent de
fournir des stratégies UPA suivant différents critères. Nous détaillerons ensuite la stratégie de
transmission mise en œuvre pour la transmission d’une image JPWL. Enfin, nous évaluerons
les performances des précodeurs dans le cadre de cette stratégie de transmission sur des
canaux statistique et réaliste.
2.2 Le précodage linéaire
Les systèmes MIMO offrent de nombreux avantages grâce à leur architecture
spécifique. La connaissance de l’état du canal du côté de l’émetteur (Tx-CSI) permet
d’accroître encore les performances en termes de débit, de robustesse et plus globalement de
qualité de service. Il existe plusieurs schémas dans la littérature permettant d’estimer la CSI
avec une bonne précision [113-115]. En pratique, la CSI est estimée par le biais de symboles
pilotes ou de séquences d’apprentissage. Cette connaissance permet la mise en œuvre des
techniques de précodage agissant comme une pré-égalisation avant l’émission. Le précodage
repose sur deux opérations, à savoir la décomposition du canal MIMO en sous-canaux SISO
indépendants et hiérarchisés, ainsi que l’optimisation d’un critère pour l’allocation de la
puissance sur les différents sous-canaux.
2.2.1 Transformation en canal virtuel
On considère un canal MIMO à bande étroite avec précodage comprenant nT antennes
à l’émission et nR antennes à la réception noté (nT × nR). Un système MIMO (nT × nR) peut
être représenté comme un ensemble de b sous-canaux SISO indépendants tel que
b ≤ min(nT , n R ) . Le vecteur y de symboles reçus en réception s’écrit :
y = GHFs + Gn
(2.1)
avec s, le vecteur de symboles transmis de taille b × 1 ; y, le vecteur de symboles reçus de
taille b × 1 ; H, la matrice de canal de taille nT × nR contenant les coefficients complexes
caractérisant les différents couples d’antennes du système MIMO ; F, la matrice de précodage
40
CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES
JPWL
de taille nT × b ; G, la matrice de décodage de taille b × nR et n le vecteur de bruit additif
centré de dimension nR × 1.
On suppose que les symboles sont iid, et que les symboles et le bruit additif sont
totalement décorrélés. Nous considérons donc :
E[ss*] = Ib
E[nn*] = R
E[sn*] = 0
(2.2)
avec Ib la matrice identité de taille b × b et R la matrice de corrélation du bruit.
Soit P0, la puissance totale disponible à l’émission. Nous devons respecter la
contrainte sur la puissance telle que :
trace(FF*) = P0
(2.3)
On utilise la décomposition proposée dans [49] [50] [116] [117] qui s’appuie sur trois
étapes successives :
1. Blanchiment du bruit : le bruit subit un traitement afin de le rendre iid avec une
variance unitaire ;
2. Diagonalisation du canal : la matrice de canal H subit une décomposition en
valeur singulière (SVD62) ;
3. Réduction de dimension : la matrice de canal virtuel est réduite à une taille b × b ,
correspondant au nombre de sous-canaux virtuels et décorrélés.
Ces différentes étapes sont basées sur des opérations matricielles. Afin d’aboutir à la
diagonalisation du canal, on décompose les matrices de précodage et de décodage sous la
forme d’un produit de deux matrices :
F = FvFd
et
G = GdGv
(2.4)
Les matrices d’indice v servent à blanchir le bruit et diagonaliser le canal. Elles sont
directement issues de l’opération de SVD sur la matrice H qui permet d’obtenir le canal
virtuel diagonal Hv. Les matrices avec l’indice d servent à optimiser le système suivant un
critère donné. Nous pouvons voir le schéma-bloc de la décomposition d’un canal MIMO avec
précodage sur la figure 2.1 :
Tx-CSI
Rx-CSI
F
s
b flux de données
Fd
Optimisation
n
Fv
H
+
G
Gv
Gd
y
Canal virtuel Hv = GvHFv
Figure 2.1. Schéma-bloc canal MIMO précodé en canal virtuel
62
Singular Value Decomposition
41
CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES
JPWL
Après transformation en canal virtuel, le système MIMO simplifié s’écrit :
y = GdHvFds + Gdnv
(2.5)
avec Hv le canal virtuel défini tel que Hv = GvHFv ; nv le bruit virtuel défini tel que nv = Gvn
de matrice de corrélation Rv = Ib. La matrice de précodage Fd est soumise à la contrainte
trace(FdFd*) = P0 sur la puissance d’émission (éq. 2.3).
La matrice de canal Hv est issue de la décomposition en valeur singulière de la matrice
de canal H. Hv est donc une matrice diagonale de taille b × b dont les éléments sont positifs et
rangés par ordre décroissant :
Hv = diag (σ i )i =1
b
(2.6)
Les valeurs σ i2 avec i = 1,…,b correspondent au RSB des sous-canaux SISO. Le gain total σ
du canal MIMO est défini par la relation suivante :
σ =
b
∑σ
i =1
2
i
(2.7)
Le précodage linéaire est donc réalisé par le biais de la matrice de précodage Fd et de
la matrice de décodage Gd. On peut distinguer deux types de précodeurs en fonction de la
diagonalité ou de la non-diagonalité de ces matrices. On parlera alors de précodeurs
diagonaux ou non-diagonaux. La représentation en b sous-canaux indépendants présente
l’avantage de simplifier efficacement une détection par ML même pour un grand nombre de
valeurs de b ainsi que pour des constellations importantes. Il a d’ailleurs été démontré dans
[117] que dans le cadre d’un décodage ML, la matrice de décodage Gd n’a aucune
d’influence. Ses coefficients peuvent donc être pris égaux à 1 (Gd = Ib).
2.2.2 Les précodeurs diagonaux
Les précodeurs diagonaux présentent des matrices Fd et Gd diagonales telles que
b
b
Fd = diag ( f i )i =1 et Gd = diag ( g i )i =1 . Les symboles reçus sur chaque sous-canal sont définis
tels que :
yi = g iσ i f i si + g i nvi
pour i = 1, …, b
(2.8)
avec gi = 1 dans le cadre d’un décodage ML. La figure 2.2 illustre le fonctionnement d’un
précodeur diagonal où les symboles sont multiplexés (MUX sur la figure 2.2) sur les souscanaux virtuels.
42
CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES
JPWL
Fd
Hv
nv
f1
σ1
n v1
ML
s1
s
×
M
U
X
+
×
D
E
M
U
X
n vb
σb
fb
ŝ1
y1
ML
sb
+
×
×
Allocation
de la
puissance
Gain du
canal
s^
ŝb
yb
Bruit
virtuel
Figure 2.2. Schéma-bloc d’un précodeur diagonal
Les précodeurs diagonaux présentent l’avantage de réduire significativement la
complexité du décodage ML de Mb à b × M avec M le nombre de points composant la
constellation de la modulation. Les différents précodeurs diagonaux se distinguent par le
critère optimisé via la matrice Fd. Nous présentons ci-dessous quelques uns des principaux
précodeurs de la littérature qui seront utilisés dans le cadre de ces travaux.
Maximisation de la capacité : Water-Filling
Le précodeur Water-Filling (WF) [54] permet de maximiser la capacité. Dans le cadre
d’un canal diagonalisé, la capacité C s’exprime par la relation suivante :
(
b
C = ∑ log 2 1 + f i 2σ i2
i =1
)
(2.9)
Les coefficients f i 2 de la matrice de précodage diagonale Fd représentent la solution d’un
problème d’optimisation par la méthode de Lagrange [118] sous contrainte que la puissance
d’émission soit égale à P0. La solution de ce problème fournit les coefficients f i 2 tels que :
f i2 =
 1
Ψ −  2
σi
0



si Ψ >
1
σ i2
pour i = 1, …, b
(2.10)
sinon
où Ψ est un seuil dépendant du canal virtuel, et défini par :
Ψ=
P0 + γ Ψ
bΨ
avec
bΨ
1
i =1
σ i2
γΨ =∑
(2.11)
où le nombre de voies bΨ conservées est égal à :
43
CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES
JPWL
bΨ =
P0 + γ Ψ
Ψ
(2.12)
On constate qu’une propriété du précodeur WF est la possibilité de sacrifier des voies
(b ≥ bΨ ) , que le précodeur considère trop défavorable, pour permettre ainsi de concentrer la
puissance sur un nombre réduit de voies. On remarque également qu’à fort RSB ( σ i2 >> 1), le
précodeur WF répartit équitablement la puissance entre les différents sous-canaux fournissant
ainsi une stratégie EPA.
Minimisation de l’erreur quadratique moyenne : MMSE
Une autre solution classique dans les télécommunications consiste à minimiser l’erreur
quadratique moyenne. Le précodeur MMSE [54] réalise cette opération grâce à une méthode
robuste et de faible complexité. Le critère à minimiser correspond à E[||y - s||2] et peut
s’écrire :
b
∑ E  (g σ
i
i =1
i
2
f i − 1)s i + g i nvi 

(2.13)
L’optimisation du précodeur définit les coefficients de la matrice Fd tels que :
1 
1
 Ψ −
σi 
σi
fi =
2
0



si Ψ >
1
σi
pour i = 1, …, b
(2.14)
sinon
En notant bΨ l’entier tel que σi > 1/Ψ pour i = 1,…, bΨ et σi ≤ 1/Ψ pour i = bΨ + 1,…,b , nous
obtenons :
Ψ=
P0 + γ Ψ
βΨ
bΨ
avec
βΨ = ∑
i =1
1
σi
(2.15)
et γ Ψ définit dans l’équation (2.11).
Comme pour le précodeur WF, le précodeur MMSE peut sacrifier des voies qu’il juge
trop défavorable. Toutefois, à l’inverse du WF, la puissance est inversement proportionnelle à
σi. Ainsi, pour des valeurs de RSB élevés, le précodeur MMSE alloue toujours plus de
puissance aux voies défavorisées.
Minimisation du taux d’erreur binaire : MBER
Dans [119], Rostaing et al. ont proposé un précodeur diagonal minimisant le TEB noté
MBER63. Ce précodeur suppose l’hypothèse que le bruit n est blanc additif gaussien et que
par conséquent le bruit virtuel nv est lui aussi gaussien. On peut alors exprimer la probabilité
d’erreur binaire théorique Peb sur le sous-canal i par la relation [17] :
63
Minimum Bit Error Rate
44
CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES
JPWL
(
Peb,i = α M erfc β M f i 2σ i2
)
(2.16)
avec αM et βM des constantes dépendant de la modulation et erfc est la fonction d’erreur
complémentaire gaussienne définie par :
erfc(x )
2
∫
π
x
0
e −t dt
2
(2.17)
Dans le cadre d’une modulation MAQ-M, on a :
αM =
1 
2 
1 −

log 2 M 
M 
βM =
et
3
2(M − 1)
(2.18)
Le précodeur cherche à minimiser le TEB par une optimisation Lagrangienne s’écrivant :
D
TEB =
αM
b
b
∑ erfc
i =1
(
)

b




β M f iσ i + µ   ∑ f i 2  − P0 
  i =1
(2.19)
où est le multiplicateur de Lagrange. La solution de ce problème d’optimisation fournit les
coefficients de la matrice Fd qui minimise le TEB :
fi2 =
 2σ i4α M2 β M2

W
0
2
2
2 β M σ i2
 µ πb



1
(2.20)
où W0(.) représente la fonction de Lambert d’index 0 [120]. Une optimisation est nécessaire
afin de déterminer la valeur du paramètre
permettant de respecter la contrainte de
b
2
puissance ∑i =1 f i = P0 .
La complexité de cette solution peut être considérablement amoindrie par une
approximation de la fonction de Lambert d’index 0 tel que :
W0 ( x ) ≈ ln ( x ) − ln (ln ( x ))
pour x >> 1
(2.21)
En utilisant cette approximation dans l’équation 2.20, on obtient directement la solution
simplifiée :
f i2 =
où :
(
)
a i 1 − ∑ k Ak + Ai ∑k a k
∑
k
(2.22)
ak
Ai = a i (ln (bi ) − ln (ln (bi )))
ai =
1
β M σ i2
et
bi =
(2.23)
2σ i4α M2 β M2
πb 2
(2.24)
45
CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES
JPWL
La solution simplifiée n’est plus valable pour de faibles valeurs de RSB.
Effectivement, le terme ln(bi) peut être négatif, rendant ainsi le calcul du terme Ai impossible.
Dans ce cas de figure, les sous-canaux concernés sont considérés comme trop défavorables et
sont donc négligés ( f i 2 = 0 ), à l’image des précodeurs WF et MMSE.
2.2.3 Les précodeurs non-diagonaux
Les précodeurs non-diagonaux ne présentent pas de matrice de précodage diagonale
( )
b
(Fd ≠ diag f i 2
i =1
). La figure 2.3 illustre le fonctionnement de ces précodeurs.
s1
s
M
U
X
Hv
nv
σ1
n v1
×
+
ML
y1
ŝ1
D
E
M
U
X
Fd
sb
Solution
nondiagonale
σb
n vb
×
+
Gain du
canal
yb
s^
ŝb
Bruit
virtuel
Figure 2.3. Schéma bloc d’un précodeur non-diagonal
La structure des précodeurs non-diagonaux ne leur permet pas de réduire la complexité
du décodage ML qui est alors égale à Mb. La non-diagonalité fournit néanmoins un degré de
liberté supplémentaire au précodeur qui peut alors modifier les géométries des constellations
de réception. Dans cette section, nous présentons deux précodeurs qui illustrent ce principe.
Maximisation de la distance minimale de la constellation de réception : Max-dmin
La distance euclidienne minimale a un rôle déterminant lorsque le récepteur est basé
sur le ML. Ce récepteur agit directement sur la probabilité d’erreur. Or, plus deux points de la
constellation de réception sont proches et plus la probabilité de commettre une erreur au
décodage augmente. Partant de cette constatation, le précodeur Max-dmin [117] calcule les
coefficients de la matrice Fd permettant de maximiser la distance minimale de la constellation
de réception notée dmin telle que :
dmin(Fd) =
min
( sk , sl )∈ , sk ≠ sl
||HvFd(sk - sl)||
(2.25)
où représente l’ensemble des symboles complexes de la constellation. Les coefficients de la
matrice Fd doivent maximiser dmin. Le problème s’écrit :
Fd = arg max {dmin(Fd)}
Fd
46
avec
trace(FdFd*) = P0
(2.26)
CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES
JPWL
La résolution de ce problème prend en compte divers paramètres tels que le canal
virtuel Hv, la modulation et le nombre de voies b. Toutefois, les solutions trouvées sont
proposées pour b = 2 voies avec des modulations BPSK64, MAQ-4 et MAQ-16 [117] [121].
La solution est indépendante du RSB et ne dépend que d’un paramètre unique γ défini par la
suite. La solution proposée dans [117] est obtenue grâce à un changement de variable entre les
deux valeurs propres du canal notées σ1 et σ2. Il s’agit d’un changement de coordonnées
cartésiennes en coordonnées polaires. Les deux nouvelles variables sont :

σ2

σ 1 = ρ cos γ
 γ = arctan
σ1
⇔

sin
=
σ
ρ
γ
2
2

ρ = σ + σ 2
1
2


(2.27)
Le canal virtuel peut alors s’écrire :
0 
σ
 cos γ
Hv =  1


=
ρ
0 σ 
 0
2

0 

sin γ 
(2.28)
où ρ ϵ ℜ + agit comme un gain sur toute la chaîne et γ (π/4 ≥ γ > 0) est un angle caractéristique
du canal Hv et permet de savoir si tous les sous-canaux sont équilibrés ou non. Effectivement,
une valeur de γ proche de 0 implique que la voie 1 est fortement privilégiée, tandis qu’une
valeur proche de π/4 signifie que les deux voies sont équivalentes. De plus, cette notation fait
apparaître ρ comme un facteur d’échelle de la distance minimale et n’intervient en rien dans
l’optimisation (2.26). L’optimisation ne dépend alors que du paramètre γ permettant une
simplification notable dans la détermination de la solution. Nous donnons à titre d’exemple la
matrice de précodage Fd pour une modulation MAQ-4 correspondant à deux formes de
précodeurs :
Si 0 ≤ γ ≤ γ0
Si γ0 < γ ≤
π
4
alors
alors
π
3 − 3 j 12 
e

6

0

Fd = Fd1 =
 3+ 3

P0 
6

0

Fd = Fd2 =
π

j 
0  1 e 4 
P0  cosυ/


π
j 
sin υ/ 
2  0
4 
−
1
e


(2.29)
(2.30)
où

2 −1
 υ/ = arctan
tan γ


γ = arctan 3 3 − 2 6 + 2 2 − 3 ≈ 17,28°
 0
3 3 − 2 6 +1
64
(2.31)
Binary Phase Shift Keying
47
CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES
JPWL
Le précodeur Max-dmin prend la matrice la matrice Fd qui favorise une seule voie pour
des valeurs de γ inférieure à 17,28° (éq. 2.31). Le précodeur choisit alors de mélanger les deux
symboles et de les transmettre uniquement sur la meilleure voie. Ce cas de figure se présente
lorsque l’écart entre les deux valeurs propres est grand. Dans le cas contraire, i.e. pour des
valeurs de γ supérieures à 17,28°, le précodeur Max-dmin utilise les deux voies à travers la
matrice de précodage Fd2 pour transmettre les deux symboles. La solution pour la MAQ-16,
détaillée dans [121], conduit à 4 formes différentes de précodeurs.
Extension du précodeur Max-dmin : le précodeur E-dmin
L’inconvénient majeur du précodeur Max-dmin tient dans sa complexité de décodage
par ML qui croît exponentiellement avec le nombre de voies considérées : Mb. La
généralisation de cette solution pour un système MIMO, comprenant plus de deux antennes à
l’émission et à la réception, a été proposée dans [122]. Bien que non-optimale, cette solution
permet d’obtenir un bon compromis entre les performances en termes de TEB et une
complexité modérée pour le décodage ML. Cette solution, appelée E-dmin, s’applique sur un
canal MIMO comprenant b voies, avec b = min(nT, nR) ≥ 4 et b un nombre pair. Les
différentes étapes de la solution E-dmin sont résumées ci-dessous :
1.
Décomposition du canal MIMO en b > 2 sous-canaux SISO parallèles et
indépendants par la transformation en canal virtuel (§ 2.2.1) ;
2. Séparation du système MIMO en b/2 sous-systèmes MIMO virtuels comprenant
deux voies de données chacun, notés sous-systèmes MIMO χ i avec i = 1,…, b/2 ;
3.
Application du précodeur Max-dmin sur chacun des sous-systèmes MIMO χ i ;
4.
Répartition de la puissance totale P0 sur les différents sous-systèmes MIMO en
affectant à chacun d’eux une puissance ϒi qui maximise dmin sous la contrainte
∑
b/2
i =1
ϒi² = P0 .
2.3 Stratégie de transmission d’images sur canal MIMO
2.3.1 Motivations
Dans le cadre nos travaux, nous utilisons le codeur JPWL car celui-ci intègre des
outils de robustesse ayant fait leurs preuves afin d’améliorer la robustesse contre les erreurs
de transmission [64]. Ce codeur a, de plus, été désigné comme codeur de référence dans le
cadre du projet ANR CAIMAN dans lequel s’inscrivent ces travaux. En outre, ce codeur
intègre une forte hiérarchisation de son flux de données comme la majorité des standards
multimédias récents. Cette hiérarchisation permet en particulier d’atteindre un haut degré de
scalabilité. La transmission d’un flux hiérarchisé peut naturellement être exploitée, dans le
cadre d’une transmission MIMO, par un schéma en boucle fermée intégrant une
diagonalisation du canal ainsi que du précodage. La transmission sur un canal radiomobile
conduit à considérer certains facteurs permettant d’optimiser le codage de la source. Par
exemple, il n’est pas optimal de coder de manière très fine la source si la transmission s’avère
impossible ou fortement contrainte. La connaissance du canal de transmission et de
l’application liée au codage de source peut notamment amener à considérer une configuration
de transmission optimale en rapport avec les capacités offerte par le canal. Ainsi une forte
48
CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES
JPWL
interaction au sein de la chaîne de transmission doit être requise. Le but est d’atteindre une
qualité de services garantie. Il est donc nécessaire de prendre en compte l’impact sur le
compromis débit/distorsion des différents paramètres de la chaîne de transmission.
L’architecture proposée consiste à considérer un schéma de transmission qui réunisse
les différents aspects adaptatifs caractérisant les principales stratégies de l’état de l’art (UEP,
UPA et modulation adaptative). Cette stratégie doit s’articuler autour d’une architecture
MIMO pour s’affranchir des difficultés liées aux environnements riches en multi-trajets. Pour
la mise en place d’une stratégie UPA flexible, on considère disposer de la CSI à l’émission, ce
qui permet de diagonaliser le canal MIMO. La stratégie UPA est alors réalisée par
l’intégration de précodeurs qui doivent permettre d’évaluer la pertinence de différents critères
pour la transmission d’image. La diagonalisation du canal permet de hiérarchiser les souscanaux SISO, ce qui assure la mise en place d’un schéma offrant à la fois scalabilité,
robustesse et adaptabilité grâce à la modularité de certains paramètres.
2.3.2 Schéma de transmission
L’idée de base sous-tendant le schéma de transmission proposé consiste à fournir une
robustesse naturelle à la source sans aucun ajout de redondance et uniquement par la prise en
compte des caractéristiques du contenu en adéquation avec les caractéristiques du canal. La
figure 2.4 illustre ce principe :
COUCHE APPLICATION
Décomposition de la source en
couches de qualité hiérarchisées
COUCHE PHYSIQUE
Décomposition du canal MIMO en
b sous-canaux SISO hiérarchisés
RSB1 = f12σ 12
Qualité de base
Couche d’amélioration 1
Couche d’amélioration b
Précodage
MIMO
Correspondance
source-canal
RSB2 = f 22σ 22
RSBb = f b2σ b2
Figure 2.4. Correspondance entre la source et le canal dans la stratégie de transmission
Du côté de la couche application, l’image est décomposée en b couches de qualité
classées par ordre d’importance décroissante. Du côté de la couche physique, le canal est
décomposé en b sous-canaux SISO classés dans l’ordre décroissant des RSB. L’idée première
de cette stratégie de transmission consiste à allouer les couches de qualité de la source sur les
sous-canaux SISO en respectant la correspondance en termes de hiérarchie. Le précodeur
MIMO agit alors comme un lien entre la source et le canal en allouant la puissance sur les
sous-canaux pour la transmission des différentes couches de qualité via l’optimisation d’un
49
CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES
JPWL
critère propre au précodeur. La figure 2.5 replace cette stratégie de transmission dans le
schéma-bloc global illustrant la chaîne de communication mise en place.
Codage
source en
couches de
qualité
hiérarchisées
Multiplexage S/P
Codage JPWL
Codage
canal
(codes RS)
Entrelaceur
Mod. MAQ-M
Entrelaceur
Mod. MAQ-M
Entrelaceur
Mod. MAQ-M
Mod. OFDM
Précodeur
MIMO
(WF, MMSE,
MBER, E-dmin)
Mod. OFDM
Mod. OFDM
Tx-CSI
Rx-CSI
Canal MIMO
Décodage
source
Décodage
canal
Démultiplexage P/S
Décodage JPWL robuste
Désentrelaceur
Démod. MAQ-M
Désentrelaceur
Démod. MAQ-M
Désentrelaceur
Démod. MAQ-M
Démod. OFDM
Décodeur à
Maximum de
Vraisemblance
Démod. OFDM
Démod. OFDM
Figure 2.5. Schéma de la stratégie de transmission d’image JPWL
Le codage source et le codage canal sont assurés par le codeur JPWL. Les couches de
qualité sont alors multiplexées sur les b voies du système, puis elles sont entrelacées avant
d’être modulées via une modulation MAQ. Un précodeur MIMO vient allouer la puissance
sur les différents sous-canaux par optimisation d’un critère. On applique ensuite une
modulation OFDM avant émission sur le canal MIMO. En réception, on trouve les opérations
duales incluant en particulier un décodage par Maximum de Vraisemblance. En fin de chaîne,
un décodeur JPWL robuste applique le décodage canal puis le décodage source.
L’architecture de cette transmission permet d’appliquer facilement une stratégie UPA,
apportant ainsi de la robustesse au schéma sans redondance. On remarquera également que la
décomposition du canal MIMO est idéale pour la mise en place de stratégie UEP ainsi que
l’intégration de modulation adaptative, du fait de l’indépendance de chaque sous-canal SISO.
2.3.3 Décodeur JPWL robuste
L’objectif de la stratégie proposée consiste à assurer la QoS dans des conditions de
transmission difficiles. Malgré le fait que JPWL soit plus robuste que le codeur/décodeur
JPEG 2000 classique, il arrive néanmoins que ce décodeur soit victime de boucle sans fin
lorsque les erreurs sont trop nombreuses ou mal positionnées comme c’est le cas pour de très
50
CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES
JPWL
faibles valeurs de RSB. Pour remédier à ce problème, on utilise une version robuste du
décodeur JPWL fournit par Thalès Communications dans le cadre du projet ANR CAIMAN.
Codestream JPWL
d’entrée
Analyse et indexation du
codestream en P paquets
Décodage des
marqueurs EPB
i=0
i≥P
non
oui
Décodage du ième
paquet
Détection des
erreurs résiduelles
oui
non
Stockage de l’image
partiellement décodée
Affichage de l’image
partiellement ou
totalement décodée
i++
Figure 2.6. Implémentation du décodeur JPWL robuste
Afin d’être robuste au phénomène de boucle sans fin pouvant caractériser le décodeur
JPWL classique, le décodage est réalisé de manière itérative. Les premières opérations
consistent à analyser le codestream composé de P paquets. Après avoir décodé les marqueurs
EPB65 qui contiennent diverses informations sur les protections ainsi que la redondance
allouée aux diverses portions du codestream [10], le décodage de l’image est effectué paquet
par paquet. Après avoir décodé un paquet, l’image partiellement décodée est stockée puis on
effectue le décodage du paquet suivant jusqu’à atteindre le dernier paquet ou bien qu’une
erreur résiduelle sur un marqueur soit détectée dans le paquet en cours de décodage. Dans ce
65
Error Protection Block
51
CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES
JPWL
cas de figure, le décodage s’interrompt et la dernière version de l’image correctement décodée
est fournie en sortie du décodeur.
2.4 Etude des performances des précodeurs linéaires
Nous étudions, dans cette section, les performances de la stratégie de transmission
proposée avec les précodeurs linéaires de la littérature. On évalue ainsi la pertinence des
critères utilisés par les précodeurs afin d’assurer la QoS pour la transmission d’images JPWL.
2.4.1 Contexte de simulation
2.4.1.1 Paramétrage de la couche physique
Nous considérons un système MIMO (4×4) conduisant à fournir 1 à 4 sous-canaux
SISO après diagonalisation. En pratique, cette configuration matérielle constitue un bon
compromis entre de bonnes performances et un coût matériel modéré. L’espacement entre les
antennes est fixé à 0,4λ avec λ la longueur d’onde de l’onde porteuse. Il a été démontré que
cet espacement fournit la plus faible corrélation entre les antennes [36]. Les paramètres de la
couche physique (fréquence de la porteuse, modulation OFDM, puissance d’émission et seuil
de sensibilité) sont fixés suivant la norme IEEE 802.11n. Nous ne tenons toutefois pas compte
des codes correcteurs définis par la norme, car nous utilisons les codes Reed-Solomon fournis
par le codeur JPWL. Dans le cadre de ces simulations, nous considérons une modulation
MAQ-4 sur chaque sous-canal SISO.
2.4.1.2 Paramétrage de la couche application
Dans le cadre de ces tests, nous transmettons les images Caps et Monarch (fig 2.7) de
résolution 768 × 512 pixels. Nous utilisons des images présentant un contenu très différent et
de résolution relativement importante, à l’image de l’évolution des services qui favorisent les
images de grande dimension. Ces images sont codées par l’intermédiaire de JPWL pour être
transmises sur le canal MIMO (4×4) décrit dans le paragraphe précédent. Comme la
décomposition de ce canal conduit à considérer quatre sous-canaux SISO, nous codons les
images JPWL en quatre couches de qualité hiérarchisées présentant chacune un débit de
0,25bpp66 offrant ainsi une granularité visible entre les couches de qualité. Chaque image est
codée en une seule tuile. Nous intégrons les protections prédéfinies par le standard JPWL
pour l’entête principal, l’entête de tuile et les entêtes de paquets. Nous intégrons également les
marqueurs de resynchronisation en début de paquet (marqueurs SOP67) et en fin d’entête de
paquet (marqueurs EPH68). Afin d’évaluer les performances des précodeurs, nous considérons
un schéma sans codage canal sur les données utiles ainsi qu’un schéma EEP intégrant des
codes RS(37,32) sur les données utiles. Nous utilisons le code RS(37,32) car il présente la
redondance la plus faible parmi les codes du standard JPWL. Nous limitons ainsi la
robustesse résultant uniquement du codage canal afin de mettre en avant la robustesse globale
du schéma.
66
bit par pixel
Start Of Packet
68
End of Packet Header
67
52
CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES
JPWL
(a)
(b)
Figure 2.7. Images transmises dans le cadre des simulations : (a) « Caps » et (b) « Monarch »
Remarque sur le multiplexage spatial
La norme JPWL spécifie la syntaxe que doit respecter le bitstream compressé. Cette
norme spécifie en particulier que la redondance propre à chaque couche de qualité est intégrée
dans les marqueurs EPB, qui prennent initialement place dans les données d’entête de tuile
(tile-part header). Dans le cadre de notre stratégie de transmission, les données d’entête (main
header et tile-part header) sont transmises avec la couche de base car, en l’absence de ces
données, nous ne pouvons strictement rien décoder. Toutefois, nous sortons du cadre de la
syntaxe JPWL standardisée en embarquant les marqueurs EPB (la redondance liée au codage
canal) avec les couches de qualité correspondante (voir fig. 2.8). Nous considérons en effet,
qu’il n’est pas logique du point de vue de la transmission, de transmettre toute la redondance
de l’image sur le sous-canal uniquement alloué à la transmission de la couche de base, telle
que la configuration standard le défini initialement.
Sous-canaux SISO
hiérarchisés
σ 12
σ 22
σ 32
σ 42
1ère couche
Main
header
Tile-part
header
2ème couche
3ème couche
4ème couche
Marqueur EPB Données utiles Marqueur EPB Données utiles Marqueur EPB Données utiles Marqueur EPB Données utiles
Couche 1
Couche 1
Couche 2
Couche 2
Couche 3
Couche 3
Couche 4
Couche 4
0,25bpp
0,5bpp
0,75bpp
1bpp
Figure 2.8. Répartition des couches de qualité JPWL et des données EPB
sur les sous-canaux SISO
53
CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES
JPWL
2.4.1.3 Métriques d’évaluation
Nous évaluons les performances des précodeurs par l’intermédiaire de trois critères
usuels à savoir :
• le TEB : le taux d’erreur binaire est très souvent utilisé afin d’évaluer la QoS d’un lien
radio ;
•
le PSNR : ce critère est certainement le plus utilisé à l’heure actuelle afin d’évaluer la
qualité visuelle d’une image, bien qu’il présente des limites comme cela est illustré
dans [123]. Il s’appuie sur l’Erreur Quadratique Moyenne (EQM) telle que (pour des
échantillons codés sur 8 bits) :
 255 2
PSNR = 10 log 10 
 EQM



où
EQM =
1
M ×N
∑ ∑ (Xˆ
M
N
i =1 j =1
i, j
− X i, j
)
2
(2.32)
avec X̂ les échantillons reconstruits après codage/décodage ; X les échantillons originaux ; M
et N le nombre d’échantillons en hauteur et en largeur respectivement.
•
le score SSIM : la métrique SSIM [124] (pour Structural Similarity) permet de
mesurer la similarité entre une image compressée et l’image originale. A la différence
du PSNR qui repose sur l’erreur quadratique (erreur pixel par pixel), la métrique SSIM
est sensible à la similarité des structures des images comparées. L’hypothèse sousjacente étant que l’œil humain est plus sensible aux changements de structure dans
l’image. Cette métrique assigne un score allant de 0 (très mauvaise qualité) à 1
(reconstruction parfaite).
Le tableau 2.1 résume les scores PSNR et SSIM pour les différentes configurations de
codage utilisé dans le cadre de nos simulations (voir §2.4.1.2).
Caps sans CCE
Caps avec RS(37,32)
Monarch sans CCE
Monarch avec RS(37,32)
1ère couche
PSNR SSIM
+ 2ème couche
PSNR SSIM
+ 3ème couche
PSNR SSIM
+ 4ème couche
PSNR SSIM
32,45
31,96
28,85
28,24
35,77
35,05
32,99
32,14
38,12
37,31
35,68
34,71
39,76
38,93
37,60
36,70
0,874
0,864
0,877
0,871
0,925
0,917
0,925
0,920
0,948
0,940
0,947
0,941
0,960
0,954
0,957
0,952
Tableau 2.1. Distorsion des images tests pour un codage de 0,25bpp par couche de qualité
avec ou sans codage canal, en termes de PSNR (dB) et de score SSIM
On note que le contenu de l’image a un impact sur les scores des deux métriques pour
un codage à débit identique. On remarque également que la robustesse apportée par le codage
canal se fait au prix de la qualité visuelle. On note en particulier que l’ajout de la redondance
entraine une perte de 0,83dB pour l’image Caps et 0,90dB pour l’image Monarch pour un
décodage avec 4 couches de qualité. Pour un débit source donné, cet écart augmente avec
l’augmentation de la redondance dans le flux. Il est donc important, dans le cadre d’une
stratégie de transmission, de choisir un CCE adapté aux conditions de transmission.
54
CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES
JPWL
2.4.1.4 Modélisation du canal
Nous utilisons deux modèles de canaux pour les simulations à savoir un canal
statistique et un canal réaliste. Le canal statistique est utilisé car il permet de visualiser
l’évolution des performances en fonction du RSB, alors que le canal réaliste permet de
visualiser l’adaptation de la stratégie face à des conditions de transmission qui fluctuent de
manière réaliste.
Canal statistique
Le canal statistique simule des évanouissements de Rayleigh. Une matrice de canal H
ainsi qu’un vecteur de bruit sont tirés aléatoirement pour chaque vecteur de symboles émis.
Les éléments de H sont indépendants et identiquement distribués. Ils appartiennent au
domaine complexe et suivent une loi gaussienne centrée de variance unitaire. Le bruit est lui
aussi gaussien. Comme la puissance reçue dépend du précodage, on considère que le RSB
correspond au rapport entre la puissance totale émise sur la puissance totale du bruit. Enfin,
dans le cadre des simulations sur canal statistique, nous considérons une connaissance parfaite
de la CSI à l’émission et à la réception.
Canal réaliste
Nous utilisons le simulateur 3D à tracé de rayons présenté dans le chapitre 1 (§1.3.2.3)
afin de fournir les réponses impulsionnelles du canal réaliste. La scène utilisée est un
environnement suburbain correspondant à une portion du campus de l’Université de Poitiers.
La figure 2.9 (a) représente cet environnement de transmission où les bâtiments sont
représentés en rouge. Nous simulons une transmission dans laquelle l’émetteur MIMO est
fixe et le récepteur MIMO se déplace le long d’une trajectoire de 138m à la vitesse de 5m/s.
Les conditions de transmission alternent successivement entre mauvaises (NLOS dans la zone
1), moyennes (NLOS dans les zones 2 et 4) et bonnes (LOS dans la zone 3). L’évolution du
gain σ du canal est présentée sur la figure 2.9 (b) où σ est défini par l’équation (2.7).
Dans le cadre des simulations sur canal réaliste, nous considérons une connaissance
imparfaite de la CSI avec une estimation, tous les 20 symboles OFDM (conforme à la norme
IEEE 802.11n) via une séquence d’apprentissage. Cette mise à jour de la CSI permet de
limiter l’impact de l’effet Doppler.
Emetteur MIMO
Trajectoire
Récepteur MIMO
(mètres)
138
120
Position sur
la trajectoire
Bâtiments
70
0
(a)
Gain
canal
MIMO
4×4 en
dB
Gaindu
of 4x4
MIMO
channel
in dB
20
Zone 1
Zone 2
Zone 3
Zone 4
18
16
14
12
10
8
6
0
500
1000
1500
2000
Position
receiver du
trajectory
(×λ) (×λ)
Position
suron
la the
trajectoire
récepteur
(b)
Figure 2.9. (a) Topologie de l’environnement de transmission et (b) évolution du gain du
canal MIMO
55
CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES
JPWL
2.4.2 Résultats de simulation
2.4.2.1 Résultats sur canal statistique
La figure 2.10 illustre les performances en termes de TEB global des différentes
stratégies de précodage. Le TEB global est évalué en faisant la moyenne des TEB sur chaque
sous-canal.
Système MIMO 4×4, b = 4, MAQ-4
0
10
MMSE
MBER
WF
E-dmin
-1
TEB global
10
-2
10
-3
10
-4
10
0
5
10
15
RSB en dB
20
25
30
Figure 2.10. Courbe de TEB global des différentes stratégies de précodage
Nous remarquons que le précodeur qui fournit les moins bonnes performances est le
précodeur WF. Ce précodeur maximise la capacité théorique de la transmission. Pour cela, il
peut sacrifier une ou plusieurs voies conduisant à un TEB de 0,5 sur les voies sacrifiées, ce
qui pénalise le TEB global. Le précodeur MMSE peut également sacrifier des voies mais il
présente une politique d’allocation plus favorable aux voies défavorisées, ce qui conduit à un
TEB global inférieur à celui présenté par le précodeur WF. Comme nous pouvions nous y
attendre, le précodeur MBER présente les meilleure performances (TEB le plus faible) des
précodeurs diagonaux étudiés car il minimise le TEB global de la transmission. Les
meilleures performances sont atteintes par le précodeur E-dmin. La non-diagonalité de ce
précodeur lui offre un degré de liberté supplémentaire ce qui lui permet de présenter les
meilleures performances. Les figures 2.11 et 2.12 illustrent les résultats en termes de PSNR et
de score SSIM pour les images Caps et Monarch. A partir de ces courbes, nous pouvons
relever trois points importants.
Premièrement, le PSNR et la métrique SSIM convergent vers les mêmes conclusions
quelles que soient l’image et/ou la configuration de codage canal. On précisera tout de même
que les images présentant un PSNR ou un score SSIM nul correspondent à des cas de figure
où le décodeur JPWL est dans l’incapacité de fournir un fichier en sortie. De la même façon,
on remarque la présence d’un « palier » sur certaines courbes avec des images présentant un
PSNR de 7,5dB. Ces cas de figures correspondent à des images majoritairement noires (donc
inexploitables) en sortie du décodeur. Ces cas de figures sont d’ailleurs notés plus sévèrement
par la métrique SSIM qui attribue un score d’environ 0,005 pour ces configurations.
56
CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES
JPWL
Système MIMO 4×4, b = 4, MAQ-4
Pas de CCE sur les données utiles
Système MIMO 4×4, b = 4, MAQ-4
Pas de CCE sur les données utiles
40
1
35
0.9
0.8
30
Score SSIM
PSNR en dB
0.7
25
20
15
5
0
0
5
10
15
RSB en dB
20
25
0.5
0.4
0.3
MMSE
MBER
WF
E-dmin
10
0.6
MMSE
MBER
WF
E-dmin
0.2
0.1
0
30
0
Codes RS(37,32) sur les données utiles
5
10
15
RSN en dB
20
25
30
Codes RS(37,32) sur les données utiles
40
1
35
0.9
0.8
30
Score SSIM
PSNR en dB
0.7
25
20
15
5
0
0
5
10
15
RSB en dB
20
25
0.5
0.4
0.3
MMSE
MBER
WF
E-dmin
10
0.6
MMSE
MBER
WF
E-dmin
0.2
0.1
30
0
0
5
10
15
RSB en dB
20
25
30
Figure 2.11. Evolution du PSNR et du score SSIM avec différentes configurations de codage
canal sur un canal statistique pour l’image « Caps »
Deuxièmement, les résultats sur la qualité des images (PSNR et SSIM) montrent des
résultats contradictoires avec les courbes de TEB présentées sur la figure 210. Par exemple, le
précodeur WF qui présente les moins bonnes performances en termes de TEB, montrent de
bonnes performances en termes de qualité d’images. A l’inverse, les précodeurs MBER et Edmin, qui présentent les meilleures performances en termes de TEB, fournissent les résultats
les moins bons en termes de qualité d’images. Ces résultats contradictoires s’expliquent par
les politiques d’allocation de puissance des différents précodeurs sur chaque sous-canal (voir
fig. 2.13 dans la suite de l’analyse des résultats).
Enfin, nous pouvons constater l’impact du codage canal sur les données utiles. En
l’absence de CCE, les données sont inexploitables pour les faibles RSB. L’ajout d’un code
correcteur RS(37,32) permet de limiter cet inconvénient. On remarque en particulier les
bonnes performances sur la qualité des images décodées à très faibles RSB pour le précodeur
WF alors que celui-ci est le moins performant en termes de TEB global. Nous noterons
également que le précodeur E-dmin est beaucoup plus faiblement impacté par l’ajout de
57
CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES
JPWL
Système MIMO 4×4, b = 4, MAQ-4
Pas de CCE sur les données utiles
Système MIMO 4×4, b = 4, MAQ-4
Pas de CCE sur les données utiles
40
1
35
0.9
0.8
30
Score SSIM
PSNR en dB
0.7
25
20
15
5
0
0
5
10
15
RSB en dB
20
25
0.5
0.4
0.3
MMSE
MBER
WF
E-dmin
10
0.6
MMSE
MBER
WF
E-dmin
0.2
0.1
0
30
0
Codes RS(37,32) sur les données utiles
5
10
15
RSB en dB
20
25
30
Codes RS(37,32) sur les données utiles
40
1
35
0.9
0.8
30
Score SSIM
PSNR en dB
0.7
25
20
15
MMSE
MBER
WF
E-dmin
10
5
0
0
5
10
15
RSB en dB
20
25
0.6
0.5
0.4
0.3
MMSE
MBER
WF
E-dmin
0.2
0.1
30
0
0
5
10
15
RSB en dB
20
25
Figure 2.12. Evolution du PSNR et du score SSIM avec différentes configurations de codage
canal sur un canal statistique pour l’image « Monarch »
redondance. Il faut toutefois rappeler que la robustesse fournie par la redondance des codes
RS se fait au détriment de la qualité d’image à fort RSB. Par exemple, en l’absence de CCE,
le précodeur E-dmin peut atteindre un PSNR d’environ 40dB pour l’image Caps, alors qu’avec
la redondance introduite par le code RS(37,32), on perd environ 1dB sur la qualité maximale
atteignable.
Afin de justifier les performances contradictoires en termes de TEB global et de
qualité visuelle des précodeurs, nous étudions sur la figure 2.13, l’évolution du TEB par souscanal en fonction des différentes stratégies de précodage. L’étude de l’évolution du TEB sur
chaque sous-canal justifie en effet les résultats contradictoires entre TEB global et qualité
visuelle. Nous rappelons que les images JPWL sont codées en couches de qualité
hiérarchisées. Les images étant hiérarchisées, pour décoder une couche d’indice n, il faut
décoder au préalable toutes les couches d’indice inférieur à n. Les précodeurs qui présentent
les meilleures performances en termes de qualité visuelle sont ceux qui respectent le mieux la
hiérarchie de la source. Par exemple, à faible RSB, le précodeur WF favorise les voies 1 et 2
ce qui lui permet de décoder les premières couches de qualité et d’obtenir la meilleure qualité
58
30
CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES
JPWL
Système MIMO 4×4, b = 4, MAQ-4, sous-canal 1
0
10
MMSE
MBER
WF
E-dmin
-1
-1
-2
10
-3
10
-4
-4
0
5
10
15
RSB en dB
20
25
10
30
Système MIMO 4×4, b = 4, MAQ-4, sous-canal 3
0
0
5
10
15
RSB en dB
20
25
30
Système MIMO 4×4, b = 4, MAQ-4, sous-canal 4
0
10
10
MMSE
MBER
WF
E-dmin
-1
-1
10
TEB
10
TEB
-2
10
-3
10
-2
10
-2
10
MMSE
MBER
WF
E-dmin
-3
-3
10
10
-4
-4
10
MMSE
MBER
WF
E-dmin
10
TEB
TEB
10
10
Système MIMO 4×4, b = 4, MAQ-4, sous-canal 2
0
10
10
0
5
10
15
RSB en dB
20
25
30
0
5
10
15
RSB en dB
20
25
30
Figure 2.13. Evolution du TEB par sous-canal pour les différentes stratégies de précodage
d’image. Toutefois, à fort RSB, le précodeur WF n’alloue pas assez de puissance à la 4ème
voie ce qui peut l’empêcher d’atteindre le PSNR ou le score SSIM maximal. A l’inverse le
précodeur E-dmin néglige les premiers sous-canaux en faveur des sous-canaux défavorisés.
Cette stratégie lui permet d’obtenir les meilleures performances en termes de TEB global
mais fournit des performances relativement mauvaises en termes de qualité d’image.
Toutefois à fort RSB, il surpasse plus rapidement les autres précodeurs en termes de qualité
car il fournit un TEB suffisamment faible sur l’ensemble des voies. Nous remarquons
néanmoins que les précodeurs optimisent chacun un critère particulier qui ne prend pas en
compte les spécificités du contenu transmis. Ainsi, aucun des critères utilisés n’est en mesure
d’assurer la QoS pour toutes les valeurs de RSB.
2.4.2.2 Résultats sur canal réaliste
Dans le cadre de ces simulations, les images sont transmises pour chaque position de
la trajectoire du récepteur (décomposée en 2300 points de passage) en tenant compte de la
mobilité (fig. 2.9). On dispose donc d’une image reçue pour chaque point de la trajectoire,
soit 2300 images. Afin de rendre les courbes plus lisibles, les résultats ont été moyennés à
l’aide d’une fenêtre glissante comprenant 20 valeurs. Cette valeur, déterminée
59
CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES
JPWL
Système MIMO 4×4, b = 4, MAQ-4
Pas de CCE sur les données utiles
Zone 1
Zone 2
Zone 3
Système MIMO 4×4, b = 4, MAQ-4
Pas de CCE sur les données utiles
Zone 4
Zone 1
1
40
35
Zone 2
Zone 3
Zone 4
0.8
Score SSIM
PSNR en dB
30
25
20
15
WF
MMSE
MBER
E-dmin
10
5
0
0
0.6
0.4
WF
MMSE
MBER
E-dmin
0.2
0
500
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
0
Codes RS(37,32) sur les données utiles
Zone 1
40
Zone 2
Zone 3
500
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
Codes RS(37,32) sur les données utiles
Zone 4
Zone 1
1
Zone 2
Zone 3
Zone 4
35
0.8
Score SSIM
PSNR en dB
30
25
20
15
WF
MMSE
MBER
E-dmin
10
5
0
0
500
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
0.6
0.4
WF
MMSE
MBER
E-dmin
0.2
0
0
500
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
Figure 2.14. Evolution du PSNR et du score SSIM avec différentes configurations de codage canal
sur un canal réaliste pour l’image « Caps »
expérimentalement, permet de lisser les résultats tout en conservant le comportement général
des courbes les unes par rapport aux autres. Lorsqu’une image s’avère non décodable, son
PSNR et son score SSIM sont considérés comme étant nul. Les figures 2.14 et 2.15 montrent
les résultats de simulation en termes de PSNR et score SSIM pour les images « Caps » et
« Monarch » sur le canal réaliste. On remarquera que globalement les résultats en termes de
PSNR et de score SSIM montrent les mêmes dynamiques et la même hiérarchie dans les
performances des différents précodeurs. Les remarques qui suivent s’appliquent donc aux
deux métriques. Les tableaux 2.2 à 2.5 complètent les résultats en fournissant les
performances moyennes des différentes stratégies de précodage en termes de PSNR moyen en
fonction des conditions de transmission. On trouve également l’écart-type du PSNR sur la
zone considérée. L’écart-type apporte ainsi une information sur la notion de stabilité du
résultat en réception.
60
CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES
JPWL
Système MIMO 4×4, b = 4, MAQ-4
Pas de CCE sur les données utiles
Système MIMO 4×4, b = 4, MAQ-4
Pas de CCE sur les données utiles
Zone 1
40
Zone 2
Zone 3
Zone 4
Zone 1
1
Zone 2
Zone 3
Zone 4
35
0.8
25
Score SSIM
PSNR en dB
30
20
15
WF
MMSE
MBER
E-dmin
10
5
0
0
0.6
0.4
WF
MMSE
MBER
E-dmin
0.2
0
500
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
0
Codes RS(37,32) sur les données utiles
Zone 1
40
Zone 2
Zone 3
500
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
Codes RS(37,32) sur les données utiles
Zone 4
Zone 1
Zone 2
Zone 3
Zone 4
1
35
0.8
25
Score SSIM
PSNR en dB
30
20
15
WF
MMSE
MBER
E-dmin
10
5
0
0
500
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
0.6
0.4
WF
MMSE
MBER
E-dmin
0.2
0
0
500
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
Figure 2.15. Evolution du PSNR et du score SSIM avec différentes configurations de codage
canal sur un canal réaliste pour l’image « Monarch »
Résultats en l’absence de codage canal
Pour de mauvaises conditions de transmission (zone 1), les précodeurs montrent de
mauvaises performances car les conditions de transmission sont très difficiles (faible RSB sur
le canal, pas de CCE). Seul le précodeur WF arrive à fournir un PSNR moyen autour de 15dB
avec un écart-type par rapport au PSNR moyen très important (10,21dB pour « Caps » et
8,41dB pour « Monarch »). Cela signifie qu’il peut arriver que ce précodeur décode la couche
de base car il est celui qui met le plus de puissance sur le premier sous-canal (cf. fig. 2.13).
Toutefois, ce résultat est très instable et les performances de QoS sont globalement
mauvaises.
Lorsque les conditions deviennent moyennes (zones 2 et 4), le précodeur WF permet
le décodage de une à deux couches de qualité. Il présente un PSNR moyen (34,41dB pour
« Caps » et 31,23dB pour « Monarch ») avec un écart-type du PSNR beaucoup plus faibles
(1,54dB pour « Caps » et 1,77dB pour « Monarch ») correspondant à une variation entre le
décodage d’une ou de deux couches de qualité (cf. tab. 2.1).
61
CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES
JPWL
Précodeurs
WF
MMSE
MBER
E-dmin
MAUVAISES CONDITIONS
Zone 1
PSNR
Ecart-type
moyen (dB)
16,38
7,31
6,50
3,90
10,21
1,93
2,60
3,77
CONDITIONS MOYENNES
Zones 2 et 4
PSNR
Ecart-type
moyen (dB)
34,41
26,23
8,41
12,47
1,54
8,83
3,23
9,64
BONNES CONDITIONS
Zone 3
PSNR
Ecart-type
moyen (dB)
37,86
37,87
31,59
39,73
0,67
0,71
8,29
0,37
Tableau 2.2. Performances moyennes pour l’image « Caps » sans codage canal
Précodeurs
WF
MMSE
MBER
E-dmin
MAUVAISES CONDITIONS
Zone 1
PSNR
Ecart-type
moyen (dB)
25,65
11,05
6,68
3,73
10,44
8,23
2,63
3,78
CONDITIONS MOYENNES
Zones 2 et 4
PSNR
Ecart-type
moyen (dB)
35,11
34,09
23,85
27,93
0,72
2,35
9,79
12,73
BONNES CONDITIONS
Zone 3
PSNR
Ecart-type
moyen (dB)
37,29
37,31
36,54
38,93
0,70
0,95
4,58
0,00
Tableau 2.3. Performances moyennes pour l’image « Caps » avec code RS(37,32)
Précodeurs
WF
MMSE
MBER
E-dmin
MAUVAISES CONDITIONS
Zone 1
PSNR
Ecart-type
moyen (dB)
14,54
6,66
5,91
3,42
8,41
1,92
2,30
3,40
CONDITIONS MOYENNES
Zones 2 et 4
PSNR
Ecart-type
moyen (dB)
31,23
22,70
7,67
11,11
1,77
7,75
2,76
7,94
BONNES CONDITIONS
Zone 3
PSNR
Ecart-type
moyen (dB)
35,37
35,28
28,38
37,52
0,75
1,13
7,60
1,22
Tableau 2.4. Performances moyennes pour l’image « Monarch » sans codage canal
Précodeurs
WF
MMSE
MBER
E-dmin
MAUVAISES CONDITIONS
Zone 1
PSNR
Ecart-type
moyen (dB)
22,26
9,34
6,06
3,47
9,25
6,47
2,46
3,40
CONDITIONS MOYENNES
Zones 2 et 4
PSNR
Ecart-type
moyen (dB)
32,16
30,93
20,49
25,36
0,91
2,12
8,55
11,87
BONNES CONDITIONS
Zone 3
PSNR
Ecart-type
moyen (dB)
34,70
34,72
33,99
36,70
0,32
0,76
4,28
0,00
Tableau 2.5. Performances moyennes pour l’image « Monarch » avec code RS(37,32)
62
CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES
JPWL
Le précodeur MMSE, qui ne permettait pas de décoder la couche de base lorsque les
conditions étaient mauvaises, améliore sensiblement ses performances dans des conditions de
transmission de qualité moyennes. Ainsi, ses performances oscillent entre le décodage de la
couche de base avec plus ou moins d’erreurs et l’impossibilité de décoder la couche de base.
Cette incertitude dans le décodage se traduit par un écart-type du PSNR très important
(8,83dB pour « Caps » et 7,75dB pour « Monarch »). Les précodeurs MBER et E-dmin
n’arrivent toujours pas à décoder la couche de base. Cette incapacité à fournir un résultat
exploitable s’explique par le fait que pour satisfaire leur critère respectif, ces précodeurs
favorisent les sous-canaux d’indice important au détriment du sous-canal transportant la
couche de base. Les précodeurs WF et MMSE s’adaptent ainsi mieux à la transmission des
images JPWL car ils respectent mieux la notion de hiérarchisation.
Enfin dans de bonnes conditions de transmission (zone 3), les précodeurs WF et
MMSE fournissent des résultats très similaires correspondant au décodage des trois premières
couches de qualité sans erreur avec une très bonne stabilité dans les résultats (se traduisant par
un faible écart-type). La puissance fournie sur le quatrième sous-canal n’est toutefois pas
suffisante afin de décoder correctement la dernière couche de qualité. Le précodeur MBER
fournit des résultats très contrastés qui se traduisent par un écart-type important. En effet, il
présente des résultats correspondant au décodage de une à trois couches de qualité avec de
temps à autre une image impossible à décoder. Ces performances très contrastées s’expliquent
par le fait qu’ils n’attribuent que peu de puissance à la couche de base et à la première couche
d’amélioration (sous-canaux 1 et 2). De ce fait, les premières couches deviennent très
sensibles aux évanouissements sur le canal de transmission présentant ainsi une QoS
médiocre. Contrairement aux performances affichées dans des conditions de transmission
mauvaises ou moyennes, le précodeur E-dmin fournit d’excellents résultats lorsque le canal est
bon. Le comportement singulier du précodeur E-dmin qui, on le rappelle, est le seul précodeur
non-diagonal, provient de son fonctionnement très particulier. E-dmin est une généralisation du
précodeur Max-dmin qui fonctionne pour des systèmes MIMO (2×2). Pour s’adapter à un
système MIMO (4×4), E-dmin considère deux sous-systèmes MIMO (2×2). Or, il a été
démontré dans [18], que la combinaison optimale permettant de minimiser dmin consiste à
associer les sous-canaux 1 et b, 2 et b-1, …, b/2 et b/2 + 1. Dans le cadre d’un système MIMO
(4×4), le premier sous-système MIMO est donc composé des sous-canaux 1 et 4 alors que le
second est composé des sous-canaux 2 et 3. Par conséquent, lorsque les conditions sont
mauvaises ou moyennes, le quatrième sous-canal pénalise le premier, ce qui entraîne des
difficultés pour décoder la couche de base et donc une mauvaise QoS. Toutefois, lorsque les
conditions sur le canal sont bonnes, le précodeur E-dmin arrive à fournir un TEB nul sur toutes
les voies, conduisant à obtenir la qualité maximale en réception. Cette supériorité lorsque les
conditions sont bonnes provient de la non-diagonalité offrant un degré de liberté
supplémentaire. En effet, E-dmin agit sur la puissance mais également sur la géométrie des
constellations, ce qui lui permet de surpasser les précodeurs diagonaux.
Impact du codage canal
Les précodeurs utilisés dans le cadre de ces simulations ne modifient pas leur politique
d’allocation de la puissance en fonction du codage canal utilisé. Cependant, le TEB présenté
en réception avant décodage canal par certain précodeur peut devenir suffisamment faible
après décodage canal pour permettre d’exploiter une ou plusieurs couches de qualité.
On notera en particulier que l’ajout du codage canal permet au précodeur WF
d’augmenter significativement le nombre d’image décodée avec la couche de base dans de
mauvaises conditions de transmission (zone 1). Il en résulte une augmentation importante du
63
CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES
JPWL
PSNR moyen. Lorsque les conditions deviennent moyennes (zones 2 et 4), le précodeur WF
permet de décoder majoritairement les images avec deux couches de qualité et cela de
manière plus stable qu’en l’absence de codage canal. En effet, l’écart-type est quasiment
divisé par deux sur ces zones. De la même manière, le précodeur MMSE qui fournissait de
mauvais résultats pour des conditions moyennes, arrive à décoder des images composées
d’une ou deux couches de qualité avec un écart-type acceptable. Lorsque les conditions
deviennent bonnes (zone 3), les précodeurs WF et MMSE présentent des TEB sur la
quatrième voie, qui restent trop élevés par rapport à la capacité de correction du code
RS(37,32). Ainsi, la QoS n’évolue pas vis-à-vis des performances sans CCE. A ce titre, nous
rappelons que la redondance introduite par le code RS(37,32) se fait au détriment de la qualité
visuelle. Ainsi, le PSNR moyen pour la configuration sans CCE, lorsque le canal est bon, est
plus important que le PSNR moyen avec CCE.
Concernant le précodeur MBER, les TEB affichés par ce précodeur sur les couches de
qualité les plus importantes sont trop élevés pour obtenir une bonne QoS globale grâce au
code RS(37,32). Ainsi, les images sont indécodables lorsque le canal est mauvais. Avec des
conditions moyennes, ce précodeur oscillent entre une couche décodée correctement et des
images inexploitables. On notera toutefois un gain lorsque les conditions deviennent bonnes.
Ce gain s’explique par le nombre de cas de décodage impossible qui diminuent avec l’ajout
du code RS(37,32). Ainsi, les performances moyennes sur cette zone sont moins pénalisées.
Le précodeur E-dmin quant à lui, améliore sensiblement ses performances dans des conditions
moyennes. Le codage canal n’a cependant aucun impact lorsque le canal est bon, car E-dmin
atteignait déjà la qualité maximale sans codage canal sur cette zone.
Finalement, l’étude des performances des précodeurs sur canal réaliste confirme le fait
qu’il est indispensable de prendre en considération la hiérarchie de la source dans l’évaluation
de la QoS. L’exemple du précodeur MBER est révélateur de cette caractéristique. En effet, ce
précodeur minimise le TEB sur l’ensemble des sous-canaux par une répartition particulière de
la puissance. Toutefois, le TEB atteint sur chaque sous-canal ne permet pas de décoder de
manière satisfaisante les données transmises. A l’inverse, le précodeur WF qui présente le
TEB global le plus mauvais, fournit la meilleure QoS pour la transmission d’image car il est
le précodeur qui fournit le plus de puissance au premier et au second sous-canal, qui
transportent les couches d’importance majeure.
2.5 Synthèse et conclusion
Ce second chapitre a permis de présenter le principe du précodage linéaire dans les
systèmes MIMO. Nous avons ainsi détaillé les étapes conduisant à la décomposition du canal
MIMO en canal virtuel équivalent. Cette décomposition permet de voir le canal MIMO
comme un ensemble de sous-canaux SISO hiérarchisés, parallèles et indépendants. Nous
avons également présenté le principe du précodage diagonal et non-diagonal à travers les
précodeurs WF, MMSE, MBER et E-dmin. Ces algorithmes sont basés sur la connaissance du
canal à l’émission et peuvent être vus comme des pré-égaliseurs qui allouent la puissance
d’émission en optimisant un critère lié à la transmission. Dans un second temps, nous avons
présenté une stratégie de transmission qui s’appuie sur la décomposition du canal et sur les
précodeurs MIMO. On fournit ainsi une stratégie de transmission d’image qui s’appuie sur la
correspondance entre la hiérarchie du canal et la hiérarchie entre les couches de qualité issues
du codeur JPWL. Les tests de simulation sur canal statistique et sur canal réaliste ont permis
de mettre en avant la robustesse de cette stratégie de transmission en l’absence de CCE sur les
données utiles.
64
CHAPITRE 2. PERFORMANCES DES PRECODEURS LINEAIRES POUR LA TRANSMISSION D’IMAGES
JPWL
A l’issue de ces tests, nous avons pu mettre en évidence quelques conclusions. Nous
avons montré en particulier que l’évaluation du TEB global n’est pas un critère pertinent pour
juger de la QoS d’une transmission d’image hiérarchisée. Pour être pertinent, le TEB doit être
pris en compte sur chaque sous-canal. Concernant les différentes stratégies de précodage
évaluées, nous avons montré qu’aucune n’est en mesure d’assurer la QoS pour tous les états
du canal. En effet, les critères optimisés ne tiennent pas compte des caractéristiques d’un
contenu hiérarchisé. La puissance est alors allouée sans contrainte sur le décodage de la
source ce qui conduit à des résultats sous-optimaux en termes de PSNR ou de score SSIM.
L’ajout de CCE peut alors apparaître comme une solution pour combler le manque
d’efficacité du schéma pour de faibles RSB. En fait, l’ajout de redondance peut être pénalisant
en termes de qualité visuelle à fort RSB. Il y a donc un compromis à atteindre entre le codage
de la source et le codage canal, optimal au sens de la qualité de l’image, et prenant
évidemment en compte les conditions sur le canal de transmission.
Compte tenu de la hiérarchisation de la source, les solutions UEP ainsi que les
modulations adaptatives semblent particulièrement intéressantes dans le cadre de la stratégie
de transmission proposée. Néanmoins, il existe un manque d’interaction entre les précodeurs
et le codage canal ou la modulation, car l’optimisation des différents critères ne fait pas
intervenir l’impact potentiel de ces paramètres. C’est pourquoi nous proposons dans le
troisième chapitre une stratégie de précodage diagonale prenant conjointement en compte la
hiérarchisation du contenu à transmettre, le codage canal et l’ordre de la modulation afin de
maximiser la qualité visuelle des images reçues.
65
CHAPITRE 3
PRISE EN COMPTE DU CONTENU DANS UN
SYSTEME MIMO PRECODE
Sommaire
3.1
Introduction
3.2
Algorithme de précodage basé sur le contenu
68
3.2.1 Principe
68
3.2.2 Modèle d’allocation successive de la puissance
69
3.2.3 Prise en compte du codage canal dans l’allocation de la puissance 71
3.2.4 Algorithme d’approximation du TEB cible
73
3.2.5 Algorithme d’allocation successive de la puissance
75
3.3
Résultats de simulations
3.3.1 Résultats sur canal statistique
3.3.2 Résultats sur canal réaliste
3.3.2.1
3.3.2.2
3.3.2.3
3.3.2.4
3.3.3
Performances en l’absence de CCE
Impact du codage canal
Impact de la modulation
Analyse visuelle
Impact des erreurs d’estimation sur la CSI
3.3.3.1
3.3.3.2
3.4
68
Modèle d’erreur d’estimation
Robustesse des précodeurs aux erreurs d’estimation sur la CSI
Synthèse et conclusion
77
77
79
80
83
83
85
88
88
89
91
67
CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE
3.1 Introduction
Les précodeurs de la littérature déterminent leurs coefficients de précodage de sorte à
optimiser un critère lié à la transmission (TEB, capacité, erreur quadratique moyenne, …). Le
chapitre précédent a permis d’évaluer les performances de plusieurs précodeurs au sein d’une
stratégie de transmission pour la transmission d’une image JPWL hiérarchisée. On a ainsi pu
constater que, malgré la bonne robustesse présentée par certains précodeurs, ces derniers
présentaient des limites.
En premier lieu, les précodeurs respectent mal la hiérarchie du contenu à transmettre.
Les données multimédias sont dans la grande majorité des cas des données fortement
hiérarchisées. Dans nos simulations, les couches de qualité JPWL sont tributaires du décodage
des couches de qualité qui les précèdent. Or, les précodeurs réalisent une optimisation sur
l’ensemble des sous-canaux, sans faire le lien entre les performances sur chaque sous-canal et
la qualité de l’image à la reconstruction. Il en résulte des précodeurs qui affichent de bonnes
performances globales suivant leur critère respectif, mais qui trouvent des limites dans une
application de transmission d’image. Deuxièmement, les précodeurs ne sont pas mis
totalement en relation, conjointement avec les autres éléments de la chaîne de communication.
Par exemple, ils ne modifient pas leur politique d’allocation de la puissance suite à un
changement d’ordre de la modulation. Il serait toutefois intéressant de pouvoir compenser une
perte de robustesse suite à une augmentation de l’efficacité spectrale de la modulation, et
inversement. De la même façon, la capacité de correction d’un CCE pourrait être prise en
compte pour adapter les coefficients de précodage. En effet, l’utilisation d’un CCE avec un
très fort pouvoir de correction devrait permettre une économie de la puissance à allouer.
Ces constatations permettent de dessiner les contraintes d’un précodeur efficace pour
la transmission d’un contenu multimédia hiérarchisé. Ainsi, nous présentons dans ce chapitre
une technique de précodage basée sur le respect de la hiérarchie du contenu à transmettre.
Cette technique présente également un important aspect de dépendance entre plusieurs
paramètres de la chaîne de communication, qui ont un impact sur le compromis débitdistorsion. En fin de chapitre, nous évaluons les performances de cette technique de
précodage par rapport aux techniques de précodage de l’état de l’art dans un contexte de
transmissions d’images.
3.2 Algorithme de précodage basé sur le contenu
3.2.1 Principe
L’algorithme proposé est conçu pour transmettre une image décomposée en couches
de qualité hiérarchisées sur des sous-canaux SISO, eux-mêmes hiérarchisés. Afin d’assurer le
caractère conjoint de cet algorithme, il est nécessaire d’allouer la puissance en fonction des
autres paramètres de la chaîne de communication numérique, à savoir : l’ordre des
modulations utilisées, la capacité de correction des codes correcteurs d’erreur et le RSB sur
les différents sous-canaux SISO. La figure 3.1 présente le synoptique de la stratégie UPA
proposée. Le canal MIMO est décomposé en b sous-canaux SISO conduisant à considérer b
couches de qualité JPWL. Le codage canal est réalisé par les codes Reed-Solomon fournis par
le standard JPWL. Ces codes dépendent des paramètres N et K, le paramètre K étant commun
à tous les codes RS du standard. L’algorithme peut prendre en compte un ordre de modulation
M ajusté sur chaque sous-canal SISO. La puissance allouée par l’algorithme est également
tributaire du RSB sur les sous-canaux. Cette information est fournie par la CSI.
68
CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE
Codage
JPWL en b
couches de
qualité
hiérarchisées
Codage
canal JPWL
RS(Ni,K)
CSI :
σ i2 , i = 1...b
Mi
i = 1…b
Ni
i = 1…b
b
MAQ-M1
MAQ-M2
γ 1 = f12σ 12
Stratégie
UPA par
précodage
(Fd)
γ 2 = f 22σ 22
Décodage
ML
(Gd)
γ b = f b2σ b2
MAQ-Mb
MAQ-M1 -1
MAQ-M2
-1
Décodage
JPWL
robuste
MAQ-Mb -1
Canal MIMO-OFDM
Matrice de canal virtuel Hv
avec b sous-canaux SISO
Codage JPWL
Figure 3.1. Synoptique de la stratégie UPA
Comme nous l’avons vu précédemment, il peut être judicieux de sacrifier des voies
pour la transmission d’images hiérarchisées, car le décodage d’une couche de qualité dépend
obligatoirement du décodage correct des couches précédentes. Il n’est donc pas nécessaire
d’allouer de la puissance sur une voie si les voies précédentes n’assurent pas un décodage
correct des données transmises. Afin de s’assurer du caractère décodable d’une couche de
qualité, on introduit une notion de QoS par le biais d’un TEB cible sur chacune des voies.
L’idée est alors de fournir la puissance nécessaire sur une voie pour permettre d’atteindre le
TEB cible, en fonction des autres paramètres jouant un rôle dans le compromis
débit/distorsion.
3.2.2 Modèle d’allocation successive de la puissance
Le modèle d’allocation proposé est un modèle sous contrainte de TEB. Cet algorithme
met en relation le RSB de chaque sous-canal SISO, l’ordre de la modulation MAQ et la
capacité de correction des CCE utilisés, afin de calculer les coefficients de la matrice de
précodage Fd = diag ( f i ) bi=1 (voir §2.2.2). Nous faisons l’hypothèse que le bruit sur chaque
sous-canal SISO est gaussien, comme c’est communément le cas [125]. Par conséquent, la
probabilité d’erreur binaire Peb ,i sur le sous-canal i pour une modulation MAQ-Mi peut être
déterminée en utilisant l’expression suivante [17] :
Peb,i =
(
)
2 M i −1


3γ i

erfc

M
−
2
(
1
)
M i log 2 M i
i


(3.1)
où γ i est le RSB sur le sous-canal SISO i pondéré par le coefficient de précodage f i 2 tel que :
γ i = f i 2σ i2
(3.2)
L’objectif du modèle est de déterminer le coefficient de précodage f i 2 sur le sous-canal i
permettant d’atteindre un TEB cible noté TEB C ,i . Ce paramètre correspond au TEB cible en
réception avant décodage canal. Par conséquent, la probabilité d’erreur binaire Peb ,i peut être
69
CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE
identifiée au TEB cible TEB C ,i dans des conditions asymptotiques. Ainsi, nous pouvons
écrire :
TEBC ,i =
(
)
 3 f 2σ 2 
i
i

erfc


M i log 2 M i
 2( M i − 1) 
2 M i −1
(3.3)
A partir de l’équation 3.3, nous pouvons calculer le coefficient de précodage f i 2 permettant
d’atteindre le paramètre TEB c ,i et qui dépend alors de la valeur propre σ i2 (correspondant au
RSB du sous-canal SISO d’indice i) et de l’ordre de la modulation MAQ-Mi. Le coefficient de
précodage s’écrit :
2( M i − 1)  −1  TEBC ,i M i log 2 M i
erf 1 −
fi =

3σ i2 
2 M i −1


(
2
)




2
(3.4)
Les variations du coefficient de précodage f i 2 en fonction du RSB σ i2 , de l’ordre de
modulation Mi et du TEB cible sont présentées sur la figure 3.2.
1
MAQ-4
MAQ-16
MAQ-64
0.9
Coefficient de précodage fi²
0.8
TEBC,i = 10-6
TEBC,i = 10-9
TEBC,i = 10-12
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
10
15
20
25
RSB en dB
30
35
40
Figure 3.2. Evolution des coefficients de précodage en fonction du RSB, de l’ordre de
modulation et du TEB cible
Sur la figure 3.2 nous pouvons constater la quantité de puissance nécessaire permettant
d’atteindre un TEB cible particulier. Pour un ordre de modulation donné, une diminution de la
valeur du TEB cible conduit l’algorithme à allouer plus de puissance (augmentation de la
valeur du coefficient de précodage). De même, si l’on souhaite augmenter l’efficacité
spectrale de la modulation pour atteindre un TEB cible équivalent, l’algorithme doit fournir
plus de puissance.
70
CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE
3.2.3 Prise en compte du codage canal dans l’allocation de la puissance
Rappelons que le paramètre TEBC,i correspond au TEB cible en réception avant
décodage canal. Ainsi, il est possible de prendre en compte la capacité de correction des codes
correcteurs utilisés, dans le réglage du paramètre TEBC,i. Nous considérons les codes ReedSolomon intégrés dans la norme JPWL. Notons qu’un code RS est défini par un nombre de
blocs de symboles en entrée et un nombre de blocs de symboles en sortie notés
respectivement K et N.
On définit si le nombre de bits par symbole sur le sous-canal i tel que si = log 2 ( M i )
avec i = 1…b. Ainsi, la probabilité d’erreur binaire après décodage canal PRS ,i pour un code
RS(Ni,Ki) donné sur des symboles de si bits est définie par [17] :
PRS ,i =
1
si
 Ni  j
N −j
  PS ,i (1 − PS ,i ) i
 j 
Ni
j
j =ti +1 N i
∑
(3.5)
N 
où  i  est un coefficient binomial, PS ,i = si Peb ,i est la probabilité d’erreur symbole pour des
 j 
symboles de si bits, et ti est la capacité de correction d’un code RS(Ni,Ki) donné telle que :
 N − Ki 
ti =  i

 2 
(3.6)
où x  représente la partie entière de x. Les performances des codes RS implémentés dans le
standard JPWL sont représentées sur la figure 3.3 (cf. équation 3.5).
1,E-02
RS(37,32)
RS(43,32)
RS(51,32)
RS(64,32)
RS(85,32)
RS(128,32)
RS(38,32)
RS(45,32)
RS(53,32)
RS(75,32)
RS(96,32)
No RS
RS(40,32)
RS(48,32)
RS(56,32)
RS(80,32)
RS(112,32)
1,E-03
1,E-04
BER
Probabilité d’erreur après décodage canal PRS,i
1,E-01
1,E-05
1,E-06
1,E-07
1,E-08
1,E-09
1,00E-04
1,00E-03
BER input
1,00E-02
1,00E-01
Probabilité d’erreur avant décodage canal Peb,i
Figure 3.3. Performances des codes RS implémentés dans la norme JPWL
71
CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE
A partir de la figure 3.3, nous pouvons comparer le gain relatif sur la probabilité
d’erreur après décodage canal des différents codes RS. On distingue alors deux groupes de
codes : les codes RS qui présentent un impact important en termes de correction, au regard de
la redondance introduite (code RS(37,32) au code RS(48,32)) et les codes RS qui ont un
impact plus modéré compte tenu de la grande quantité de redondance introduite (code
RS(51,32) au code RS(128,32)). Cette constatation est en accord avec les conclusions de [64]
qui spécifie que le gain sur le TEB au-delà du code RS(64,32) n’est pas justifié par rapport à
la redondance introduite. Cette constatation confirme l’intérêt de prendre en compte plusieurs
paramètres complémentaires liés à la robustesse. En effet, l’étude sur l’état de l’art a montré
que les gains liés à l’allocation de la puissance pouvaient être plus importants que les gains
liés au codage canal. Il est donc judicieux de mettre en relation ces paramètres afin de limiter
l’utilisation des codes correcteurs introduisant trop de redondance au profit de l’allocation de
la puissance.
D’après les équations 3.1 et 3.3, Peb,i dépend du coefficient de précodage f i 2 et
s’identifie au TEBC,i. Ainsi :
PS ,i = si Peb,i = si TEBC ,i
(3.7)
On définit le paramètre Bi comme étant le TEB cible après décodage canal sur le sous-canal i
de telle sorte que PRS ,i ≤ Bi . D’après l’équation 3.5, nous pouvons alors écrire :
1
si
Ni
j
j =ti +1 N i
∑
 Ni 
j
N −j
 (siTEBC ,i ) (1 − siTEBC ,i ) i ≤ Bi
 j 
(3.8)
Le paramètre Bi correspond donc au TEB acceptable sur la couche de qualité i avant le
décodage source. Cette valeur doit être déterminée suivant le contenu considéré. Par exemple,
dans le cas d’un codage à longueur variable où une seule erreur est susceptible de
désynchroniser l’intégralité du flux, on choisira une valeur de Bi suffisamment faible pour
correspondre à une transmission quasiment sans erreur. Si les désynchronisations ne sont pas
un problème (codage à longueur fixe), on pourra régler le paramètre Bi en fonction du type de
donnée transitant sur le canal en exploitant par exemple la hiérarchie existante entre des sousbandes d’ondelette ou, entre les coefficients DC ou AC d’un codeur basé DCT. Ainsi, cet
algorithme reste flexible et peut s’adapter aux caractéristiques du contenu transitant sur le
canal.
Le paramètre TEBC,i est approximé grâce à un algorithme itératif qui sera présenté
dans le paragraphe 3.2.4. La figure 3.4 montre les variations du paramètre TEBC,i en fonction
de la capacité de correction ti des codes RS définis dans le standard JPWL. Ce standard
spécifie les valeurs des paramètres si et Ki qui sont respectivement égales à 8 et 32. Ainsi, le
codage canal s’effectue pour des blocs de 32 symboles de 8 bits. Par conséquent, le choix
d’un code RS particulier dépend uniquement du paramètre Ni correspondant au nombre de
symboles en sortie du code RS. La figure 3.4 illustre l’impact de la capacité de correction et
du paramètre Bi sur la valeur du TEB cible. La diminution de la valeur de Bi implique une
diminution du TEB cible et, par conséquent, une augmentation de la valeur du coefficient de
précodage (voir fig. 3.2). Ainsi, la solution proposée fournit une grande flexibilité dans le
processus d’allocation de la puissance, qui s’adapte conjointement avec l’état du canal ainsi
qu’avec l’importance des couches de qualité JPWL transmises à travers les b sous-canaux
SISO. De plus, l’allocation de la puissance est finement ajustée afin de prendre en compte la
capacité de correction et l’ordre de modulation.
72
CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE
-1
10
-2
Paramètre TEBC,i
10
-3
10
-4
10
-6
Bi = 10
-9
Bi = 10
-12
Bi = 10
-5
10
-6
10
0
10
20
30
40
50
Capacité de correction ti d’un code RS(Ni,Ki)
Figure 3.4. Variation du paramètre TEBC,i pour différentes valeurs de Bi et pour différentes
capacités de correction ti
3.2.4 Algorithme d’approximation du TEB cible
L’expression du TEB cible en fonction de PRS étant difficile à écrire analytiquement,
on utilise un algorithme itératif (fig. 3.5) afin d’approximer le TEB cible suivant l’équation
3.8. Cet algorithme converge rapidement vers une valeur de TEBC,i pour laquelle PRS,i est
quasiment égal à Bi. Le tableau 3.1 montre les valeurs fournies par l’algorithme
d’approximation pour un TEB cible de 10-9 avec les différents codes RS de la norme JPWL.
Code RS(Ni,K)
RS(37,32)
RS(38,32)
RS(40,32)
RS(43,32)
RS(45,32)
RS(48,32)
RS(51,32)
RS(53,32)
RS(56,32)
RS(64,32)
RS(75,32)
RS(80,32)
RS(85,32)
RS(96,32)
RS(112,32)
RS(128,32)
Capacité de correction ti TEB cible TEBC,i
2
3
4
5
6
8
9
10
12
16
21
24
26
32
40
48
2,92.10-5
1,27.10-4
3,17.10-4
5,88.10-4
9,49.10-4
1,9.10-3
2,39.10-3
2,95.10-3
4,2.10-3
6,7.10-3
9,59.10-3
1,14.10-2
1,24.10-2
1,55.10-2
1,9.10-2
2,18.10-2
Tableau 3.1. Approximation du TEB cible pour les codes de la norme JPWL avec Bi = 10-9
73
CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE
Initialisation
max = 5.10-1
min = 10-15
TEB = 10-4
Bi fixé par l’utilisateur
Calcul PRS
j  Ni 
1
j
N −j
  (s i TEB ) (1 − s i TEB ) i
=
∑
s i j = ti +1 N i  j 
Ni
PRS ,i
Test
log (Bi ) − log (PRS ,i ) < 10 −3
oui
non
non
Test
PRS , i > B i
oui
TEBC,i = TEB
FIN
min = TEB
max = PRS
Actualisation TEB
TEB = 10 log(max) + 0,5[log(min) − log(max) ]
Figure 3.5. Algorithme d’approximation du TEB cible
Le tableau 3.1 permet de quantifier l’impact du codage canal sur le paramètre de TEB
cible. Bien sûr, plus la capacité de correction augmente et plus le TEB cible peut être
important, ce qui conduit à diminuer la quantité de puissance à allouer au sous-canal
considéré.
Le paramètre TEBC,i constitue donc un paramètre lié à la qualité de service mais il
permet également d’intégrer l’impact du codage canal dans le processus de précodage. De
plus, ce paramètre est spécifique à chaque sous-canal, ce qui permet de facilement mettre en
œuvre des stratégies UEP, en considérant un code RS différent pour chaque couche de qualité.
On remarquera également que ce modèle s’applique avec des codes Reed-Solomon.
Rappelons que nous avons choisi ce type de codes car ils sont intégrés dans le standard
JPWL. Toutefois, ce modèle peut très bien prendre en compte d’autres types de codes
correcteurs d’erreurs. Il suffit pour cela d’établir le lien entre le TEB d’entrée et le TEB de
sortie pour un code donné.
74
CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE
3.2.5 Algorithme d’allocation successive de la puissance
La transmission d’un contenu hiérarchisé implique de s’assurer que les données
prioritaires soient correctement décodées afin de permettre le décodage des données de
moindre importance. La plupart des précodeurs minimisent leur critère via une méthode
d’optimisation sous contrainte résolue par les multiplicateurs de Lagrange. Cette solution
permet de trouver l’ensemble des coefficients de la matrice Fd qui optimisent la fonction
objectif. Toutefois, la définition du problème d’optimisation des précodeurs est souvent
contradictoire avec la notion de hiérarchie, car l’optimisation est considérée sur l’ensemble
des sous-canaux, sans contrainte sur les flux binaires transitant sur chaque sous-canal. Ceci
explique les résultats paradoxaux obtenus entre l’optimisation d’un critère pertinent (l’erreur
quadratique ou le TEB par exemple) et de mauvais résultats en termes de qualité visuelle.
Ainsi, l’intégration du respect de la hiérarchie de la source passe par la prise en compte de
caractéristiques (contrainte sur le décodage, distorsion, etc.) propre à chacun des flux binaires
transitant sur les sous-canaux. Une solution de ce type est proposée dans [19] où
l’optimisation Lagrangienne consiste à minimiser la distorsion d’une vidéo H.264. Bien que la
solution proposée améliore la QoS pour une modulation et un codage canal donné, le
problème devient complexe à exprimer, dès lors que l’on que l’on souhaite faire varier ces
paramètres en lien avec les variations du canal. Parallèlement à cette approche, nous
proposons ici d’exploiter la notion de hiérarchie au sein de la source dans l’attribution des
valeurs de coefficients de précodage, en attribuant successivement la puissance sur les souscanaux, et non globalement par le biais d’une optimisation. Cette notion d’allocation
successive permet au sous-canal i, transportant la couche de qualité i, de se voir attribuer la
puissance nécessaire au respect des contraintes de QoS et de puissance telles que :
QoS :
TEBi ≤ Bi
Puissance :
∑f
b
i =1
2
i
= P0
(3.9)
Ensuite, nous traitons la couche de qualité et le sous-canal suivant en réitérant ce
processus jusqu’à ce que l’on ait traité tous les sous-canaux ou que la totalité de la puissance
disponible ait été allouée. Le traitement d’un sous-canal d’indice i se décompose ainsi en
quatre étapes :
1. On détermine la valeur du TEB cible TEBC,i en fonction du paramètre de codage canal
Ni et du paramètre de qualité de service Bi. Dans la suite, nous considérerons la même
contrainte de QoS sur tous les sous-canaux soit Bi = B pour i = 1…b ;
2. On détermine la puissance nécessaire Pi pour atteindre TEBC,i en fonction de l’ordre de
modulation Mi et du RSB du sous-canal σ i2 ;
3. On vérifie que la puissance nécessaire Pi sur le sous-canal i est inférieure à la
puissance résiduelle Pr, qui correspond à la puissance restante non-utilisée (initialisée
par rapport à la puissance totale disponible P0) ;
4. En fonction du test, on alloue la puissance nécessaire ou la puissance résiduelle au
coefficient de précodage f i 2 .
De par le fonctionnement de cet algorithme, une voie peut être sacrifiée si les contraintes
ne peuvent pas être respectées. On notera toutefois que la puissance résiduelle est
systématiquement attribuée sur la dernière voie utilisée pour permettre l’utilisation de la
totalité de la puissance disponible. La figure 3.6 schématise le processus d’allocation de la
puissance suivant l’algorithme proposé.
75
CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE
Initialisation
b = min(nT,nR)
Pr = P0
CSI : σ i2 , i = 1…b
Modulations : Mi, i = 1…b
Codes RS : Ni, i = 1…b
Réglage de B
f i 2 = 0 , i = 1…b
i=0
Approximation de TEBC,i tel que :
1
si
Ni
j
j = t i +1 N i
∑
 Ni 
j
N −j
 (s i TEB C ,i ) (1 − s i TEB C ,i ) i ≤ B
 j 
Calcul de la puissance nécessaire Pi
i = i +1
2( M i − 1) 
erf
Pi =
3σ i2

 TEB C ,i M i log 2 M i 
−1 

1−


2 M i −1


(
Test sur la puissance résiduelle
Pi ≤ Pr
2
)
non
oui
f i 2 = Pi
Pr = Pr − Pi
f i 2 = Pr
non
i=b
oui
f i 2 = f i 2 + Pr
Fin
Figure 3.6. Algorithme d’allocation successive de la puissance
76
CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE
Dans le cadre de nos simulations, nous réglons le paramètre B pour atteindre une
transmission quasiment sans erreur. Les transmissions d’images ne requièrent pas de
contraintes de temps comme pour les applications vidéo qui doivent opérer en temps réel.
Ainsi, la notion de TEB quasiment sans erreur ne peut pas être définie, dans notre cas, sur la
base d’une erreur par heure à un débit donné comme c’est le cas des standards ADSL69 ou
DVB-T par exemple. Dans notre cas, le formalisme mathématique est décrit pour des flux
binaires asymptotiquement longs. En pratique, les flux binaires JPWL considérés dans nos
simulations sont de l’ordre de 105 bits. Par conséquent, nous fixons le paramètre B de telle
sorte que :
B << 10 −5
(3.10)
Ainsi, nous avons considéré dans la suite qu’une transmission est quasiment sans erreur pour
une valeur de B = 10-9.
3.3 Résultats de simulations
Dans cette section, nous évaluons les performances de la stratégie proposée en
comparaison des précodeurs de la littérature dans un contexte de transmission d’images. Nous
évaluons les performances de la stratégie proposée, appelée CBP pour « Content-Based
Precoder », à travers les canaux statistique et réaliste présentés dans le paragraphe 2.4.1.4. Le
paramétrage des couches physique et application correspond aux descriptions des paragraphes
2.4.1.1 et 2.4.1.2 respectivement. Nous transmettons les images « Caps » et « Monarch ».
3.3.1 Résultats sur canal statistique
La figure 3.7 présente les résultats de simulations en termes de TEB global en fonction
du RSB sur le canal MIMO (4×4), dont les coefficients sont générés statistiquement suivant
une distribution de Rayleigh. Les courbes de TEB affichées sont déterminées à partir du TEB
moyen sur l’ensemble des sous-canaux. Le TEB global constitue le critère de comparaison
classique des performances des précodeurs dans la littérature. Si l’on se réfère au TEB global,
nous constatons que les performances affichées par le précodeur CBP sont relativement
médiocres au regard des performances affichées par les autres précodeurs. Le précodeur CBP
obtient ainsi les performances les plus mauvaises jusqu’à un RSB de 15dB. A partir de cette
valeur, il présente un TEB global inférieur au précodeur WF mais il faut atteindre un RSB
d’environ 22dB pour que les performances en termes de TEB global convergent avec celles
présentées par les précodeurs MMSE et MBER. Comme nous l’avons vu dans le chapitre
précédent, le précodeur non-diagonal E-dmin surpasse largement les précodeurs diagonaux en
termes de TEB global et pour cette configuration de transmission. Les mauvaises
performances apparentes du précodeur CBP s’expliquent aisément par la stratégie d’allocation
de la puissance de ce précodeur en comparaison des autres stratégies de précodage. Nous
avons montré précédemment que les précodeurs de la littérature fournissent généralement la
solution d’un problème d’optimisation d’un critère pour allouer la puissance sur l’ensemble
des sous-canaux sans contrainte sur le décodage. Néanmoins, nous avons également mis en
évidence l’importance de respecter la hiérarchie de l’image afin d’assurer la QoS. En effet, les
données hiérarchisées imposent souvent que le décodage d’une couche d’indice i nécessite le
décodage correct des couches d’indice inférieur à i. De ce fait, il est indispensable, dans un
69
Asymetric Digital Subscriber Line
77
CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE
contexte de transmission d’images, d’évaluer les performances des précodeurs sur chaque
sous-canal, comme le montre la figure 3.8.
Système MIMO 4×4, b = 4, MAQ-4
0
10
MMSE
MBER
WF
E-dmin
CBP
-1
TEB global
10
-2
10
-3
10
-4
10
0
5
10
15
RSB en dB
20
25
30
Figure 3.7. Courbe de TEB global des différentes stratégies de précodage
Cette figure présente les résultats en termes de TEB sur chacun des sous-canaux en
fonction du RSB sur le canal MIMO. Cette figure permet en outre, de comprendre la stratégie
du précodeur CBP afin de garantir la QoS d’une transmission d’image. Lorsque le canal
présente un RSB très faible traduisant des conditions de transmission difficiles, le précodeur
CBP alloue toute la puissance sur le premier sous-canal et sacrifie les autres voies. De cette
manière, il assure la transmission du premier flux de données. Les trois autres voies étant
sacrifiées, le TEB qu’elles affichent atteint 5.10-2 ce qui explique les mauvaises performances
en termes de TEB global. Par la suite, à mesure que les conditions sur le canal deviennent
meilleures (augmentation du RSB), le précodeur utilise les sous-canaux d’indice supérieur
afin d’acheminer correctement le deuxième flux de données (à partir de 5dB), puis le
troisième (à partir de 10dB) et finalement le dernier (à partir de 15dB). Nous remarquons que
dès lors que la seconde voie est utilisée, le TEB présenté par CBP sur cette voie devient
rapidement meilleur que le TEB présenté par les autres précodeurs. Sur la troisième voie,
nous constatons que le TEB surpasse celui des autres précodeurs diagonaux alors que sur la
quatrième voie, le TEB se met à converger vers le TEB présenté par les autres précodeurs
diagonaux.
Ainsi, nous constatons que le précodeur CBP prend en compte la notion de hiérarchie
de la source par une utilisation cohérente des sous-canaux au regard de l’évolution des
conditions de transmission. Ce schéma permet d’acheminer correctement les couches de
qualité composant l’image, là où les autres précodeurs répartissent la puissance sur
l’ensemble des sous-canaux, pouvant ainsi mettre en péril le décodage des données
hiérarchisées. Finalement, si l’on évalue les performances des précodeurs à partir du TEB
global sur une séquence pseudo-aléatoire, nous constatons que les autres précodeurs
fournissent de meilleures performances, mais ils n’offrent toutefois aucune garantie sur la
QoS pour la transmission d’images hiérarchisées.
78
CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE
Système MIMO 4×4, b = 4, MAQ-4, sous-canal 1
Système MIMO 4×4, b = 4, MAQ-4, sous-canal 2
0
0
10
10
MMSE
MBER
WF
E-dmin
CBP
-1
-1
10
TEB
TEB
10
-2
10
10
-4
-4
0
0
5
10
15
RSB en dB
20
25
10
30
Système MIMO 4×4, b = 4, MAQ-4, sous-canal 3
5
10
15
RSB en dB
20
25
30
Système MIMO 4×4, b = 4, MAQ-4, sous-canal 4
10
MMSE
MBER
WF
E-dmin
CBP
-1
10
-1
10
-2
TEB
TEB
0
0
10
10
-3
-2
10
MMSE
MBER
WF
E-dmin
CBP
-3
10
10
-4
10
-2
10
-3
-3
10
10
MMSE
MBER
WF
E-dmin
CBP
-4
0
5
10
15
RSB en dB
20
25
30
10
0
5
10
15
RSB en dB
20
25
30
Figure 3.8. Evolution du TEB par sous-canal pour les différentes stratégies de précodage
3.3.2 Résultats sur canal réaliste
On rappelle que le canal réaliste est défini par les réponses impulsionnelles obtenues
via un simulateur à tracé de rayons 3D, dans l’environnement suburbain présenté dans le
paragraphe 2.4.1.4. Dans le cadre de ces simulations, les images sont transmises pour chaque
position de la trajectoire du récepteur en tenant compte de la mobilité. On dispose donc d’une
image reçue pour chaque point de la trajectoire. On rappelle que les résultats ont été
moyennés à l’aide d’une fenêtre glissante comprenant 20 valeurs, afin de rendre les courbes
plus lisibles (voir §2.4.2.2). Les figures 3.9 et 3.10 montrent les résultats de simulation en
termes de PSNR et score SSIM pour les images « Caps » et « Monarch » sur le canal réaliste.
On remarquera que globalement les résultats en termes de PSNR et de score SSIM montrent
les mêmes dynamiques et la même hiérarchie dans les performances des différents
précodeurs. Les remarques qui suivent s’appliquent donc aux deux métriques. Les tableaux
3.2 à 3.5 complètent les résultats en fournissant les performances moyennes des différentes
stratégies de précodage en termes de PSNR moyen en fonction des conditions de
transmission. On trouve également l’écart-type par rapport au PSNR moyen sur la zone
considérée. L’écart-type fournit ainsi une information sur la notion de stabilité du résultat en
réception.
79
CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE
Système MIMO 4×4, b = 4, MAQ-4
Pas de CCE sur les données utiles
Zone 1
Zone 2
Zone 3
Système MIMO 4×4, b = 4, MAQ-4
Pas de CCE sur les données utiles
Zone 4
Zone 1
1
40
Zone 2
Zone 3
Zone 4
35
0.8
Score SSIM
PSNR en dB
30
25
20
CBP
WF
MMSE
MBER
E-dmin
15
10
5
0
0
0.6
0.4
CBP
WF
MMSE
MBER
E-dmin
0.2
0
500
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
0
Codes RS(37,32) sur les données utiles
Zone 1
40
Zone 2
Zone 3
500
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
Codes RS(37,32) sur les données utiles
Zone 4
Zone 1
1
Zone 2
Zone 3
Zone 4
35
0.8
25
20
CBP
WF
MMSE
MBER
E-dmin
15
10
5
0
0
500
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
Score SSIM
PSNR en dB
30
0.6
0.4
CBP
WF
MMSE
MBER
E-dmin
0.2
0
0
500
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
Figure 3.9. Evolution du PSNR et du score SSIM avec différentes configurations de
codage canal sur un canal réaliste pour l’image « Caps »
3.3.2.1 Performances en l’absence de CCE
Nous remarquons que, globalement, notre stratégie est meilleure que les autres pour
garantir de manière stable la qualité (PSNR et score SSIM) des images en réception. En
l’absence de codes RS, nous constatons en effet un écart particulièrement significatif lorsque
les conditions sont mauvaises (zone 1). Le précodeur CBP est ainsi le seul à fournir de
manière stable un résultat exploitable en réception. On notera que l’écart-type du PSNR est
relativement élevé sur cette zone (7,37dB pour « Caps » et 6,35dB pour « Monarch »). Ces
valeurs s’expliquent par les conditions extrêmement défavorables en début de parcours
(jusqu’aux environs de la position 150) qui s’améliorent par la suite. Les bonnes
performances affichées par le précodeur CBP s’expliquent par le fait que toute la puissance
est allouée au premier sous-canal qui transporte la couche de base. Les autres précodeurs
quant à eux, utilisent aux moins deux sous-canaux sur cette zone. Ainsi la puissance n’est pas
assez importante sur le premier sous-canal pour permettre un décodage correct de la couche
80
CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE
Système MIMO 4×4, b = 4, MAQ-4
Pas de CCE sur les données utiles
Zone 1
40
Zone 2
Zone 3
Système MIMO 4×4, b = 4, MAQ-4
Pas de CCE sur les données utiles
Zone 4
Zone 1
1
Zone 2
Zone 3
Zone 4
35
0.8
25
Score SSIM
PSNR en dB
30
20
15
CBP
WF
MMSE
MBER
E-dmin
10
5
0
0
0.6
0.4
CBP
WF
MMSE
MBER
E-dmin
0.2
0
500
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
0
Codes RS(37,32) sur les données utiles
Zone 1
40
Zone 2
Zone 3
500
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
Codes RS(37,32) sur les données utiles
Zone 4
Zone 1
1
Zone 2
Zone 3
Zone 4
35
0.8
25
20
15
CBP
WF
MMSE
MBER
E-dmin
10
5
0
0
500
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
Score SSIM
PSNR en dB
30
0.6
0.4
CBP
WF
MMSE
MBER
E-dmin
0.2
0
0
500
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
Figure 3.10. Evolution du PSNR et du score SSIM avec différentes configurations de
codage canal sur un canal réaliste pour l’image « Monarch »
de base. Lorsque les conditions sont moyennes (zone 2 et 4), la différence avec le précodeur
WF est relativement moins importante. Elle reste toutefois significative vis-à-vis des autres
stratégies de précodage. Le précodeur CBP exploite l’amélioration des conditions sur le canal
en allouant de la puissance au second sous-canal. On peut ainsi obtenir des images en
réception composée de deux couches de qualité alors que les autres précodeurs cherchent à
transmettre trois à quatre couches de qualité, ce qui conduit à des configurations présentant
beaucoup de distorsions. Dans de bonnes conditions, les précodeurs diagonaux transmettent
trois couches de qualité sans erreur. Bien que le précodeur CBP permette d’obtenir un
meilleur TEB sur la quatrième voie que les autres précodeurs diagonaux, il n’est toutefois pas
suffisamment bas pour obtenir un décodage correct de la dernière couche de qualité. De ce
fait, nous obtenons une qualité d’image reçue équivalente. La non-diagonalité du précodeur
E-dmin lui permet de transmettre quatre couches de qualité sans erreur comme cela a été
expliqué dans le chapitre 2. Globalement, la stratégie de précodage proposée permet d’assurer
la QoS, sans apport de redondance sur les données utiles et quels que soient les états du canal
de transmission. En comparaison, les autres précodeurs n’y arrivent que lorsque les conditions
sont bonnes, ou moyennes dans le cas du précodeur WF.
81
CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE
Précodeurs
WF
MMSE
MBER
E-dmin
CBP
MAUVAISES CONDITIONS
Zone 1
PSNR
Ecart-type
moyen (dB)
16,38
7,31
6,50
3,90
29,40
10,21
1,93
2,60
3,77
7,37
CONDITIONS MOYENNES
Zones 2 et 4
PSNR
Ecart-type
moyen (dB)
34,41
26,23
8,41
12,47
35,20
1,54
8,83
3,23
9,64
1,34
BONNES CONDITIONS
Zone 3
PSNR
Ecart-type
moyen (dB)
37,86
37,87
31,59
39,73
38,12
0,67
0,71
8,29
0,37
0,31
Tableau 3.2. Performances moyennes pour l’image « Caps » sans codage canal
Précodeurs
WF
MMSE
MBER
E-dmin
CBP
MAUVAISES CONDITIONS
Zone 1
PSNR
Ecart-type
moyen (dB)
25,65
11,05
6,68
3,73
32,45
10,44
8,23
2,63
3,78
1,88
CONDITIONS MOYENNES
Zones 2 et 4
PSNR
Ecart-type
moyen (dB)
35,11
34,09
23,85
27,93
35,89
0,72
2,35
9,79
12,73
1,08
BONNES CONDITIONS
Zone 3
PSNR
Ecart-type
moyen (dB)
37,29
37,31
36,54
38,93
37,39
0,70
0,95
4,58
0,00
0,71
Tableau 3.3. Performances moyennes pour l’image « Caps » avec code RS(37,32)
Précodeurs
WF
MMSE
MBER
E-dmin
CBP
MAUVAISES CONDITIONS
Zone 1
PSNR
Ecart-type
moyen (dB)
14,54
6,66
5,91
3,42
26,17
8,41
1,92
2,30
3,40
6,35
CONDITIONS MOYENNES
Zones 2 et 4
PSNR
Ecart-type
moyen (dB)
31,23
22,70
7,67
11,11
32,29
1,77
7,75
2,76
7,94
1,66
BONNES CONDITIONS
Zone 3
PSNR
Ecart-type
moyen (dB)
35,37
35,28
28,38
37,52
35,60
0,75
1,13
7,60
1,22
0,45
Tableau 3.4. Performances moyennes pour l’image « Monarch » sans codage canal
Précodeurs
WF
MMSE
MBER
E-dmin
CBP
MAUVAISES CONDITIONS
Zone 1
PSNR
Ecart-type
moyen (dB)
22,26
9,34
6,06
3,47
28,78
9,25
6,47
2,46
3,40
2,51
CONDITIONS MOYENNES
Zones 2 et 4
PSNR
Ecart-type
moyen (dB)
32,16
30,93
20,49
25,36
33,07
0,91
2,12
8,55
11,87
1,21
BONNES CONDITIONS
Zone 3
PSNR
Ecart-type
moyen (dB)
34,70
34,72
33,99
36,70
34,80
0,32
0,76
4,28
0,00
0,52
Tableau 3.5. Performances moyennes pour l’image « Monarch » avec code RS(37,32)
82
CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE
3.3.2.2 Impact du codage canal
Nous constatons que le codage canal permet, en outre, de contrer les mauvaises
conditions en début de parcours (position 0 à 150). Etant donné que l’algorithme CBP prend
en compte la capacité de correction du CCE afin de diminuer en conséquence la puissance
allouée sur les sous-canaux, il peut alors transmettre plus de couches de qualité par rapport à
la configuration sans code RS. Ainsi le précodeur CBP transmet une à deux couches sur la
zone 1 ; puis de deux à trois couches sur les zones 2 et 4. On constate ainsi un gain en termes
de PSNR moyen de 2,6 à 3dB dans de mauvaises conditions, et environ 0,7dB dans des
conditions moyennes. Dans de bonnes conditions, le TEB sur le quatrième sous-canal n’est
pas suffisamment bas au regard de la capacité de correction du code RS(37,32) afin de
décoder cette dernière couche. Ainsi, nous remarquons une fois de plus que la qualité en
termes de PSNR moyen diminue avec l’ajout du code RS (-0,73dB pour « Caps » et -0,80dB
pour « Monarch ») du fait de la redondance sur les couches de qualité.
En se basant sur ces résultats, nous pouvons envisager une solution pour améliorer la
qualité des images reçues. En effet, la capacité de correction du code RS pourrait être
augmentée sur le dernier sous-canal lorsque le canal est bon, afin de permettre le décodage de
la quatrième couche de qualité. De la même manière, la redondance sur les trois premières
couches de qualité pourraient être supprimée au profit du codage source (augmentation de la
qualité visuelle). Plus globalement, cette solution consisterait à adapter le codage source et le
codage canal en fonction des conditions de transmission.
3.3.2.3 Impact de la modulation
Les figures 3.11 et 3.12 montrent les performances des précodeurs sur le canal réaliste
avec une modulation MAQ-16. Nous utilisons la configuration de codage intégrant les codes
RS(37,32) pour limiter la perte de robustesse due à la hausse de l’efficacité spectrale de la
modulation. Les tableaux 3.6 et 3.7 fournissent les performances moyennes en termes de
PSNR en fonction des conditions de transmission, ainsi que les écarts-type respectifs pour les
images « Caps » et « Monarch ».
Nous notons que le précodeur CBP est celui qui s’adapte le mieux à un changement
d’ordre de modulation. Il fournit ainsi une bonne QoS pour des conditions de transmission
moyennes ou bonnes, avec les meilleurs PSNR moyen ainsi que les écarts-type les plus
faibles (si ce n’est le cas particulier d’E-dmin). Dans la zone 1, les performances sont
contrastées avec l’impossibilité de décoder l’image sur les positions de réception 0 à 150. Sur
la fin de la zone 1 (position 151 à 436), les conditions s’améliorent légèrement ce qui permet
au précodeur CBP de transmettre fréquemment la couche de base. Il en résulte un écart-type
important (12,36dB pour « Caps » et 10,53dB pour « Monarch ») sur l’ensemble de cette
zone. Nous précisons que sur l’ensemble de la zone 1, le précodeur CBP n’utilise qu’un seul
sous-canal en lui attribuant toute la puissance. Il n’est donc pas possible, compte tenu de la
configuration de codage, d’obtenir de meilleurs résultats sur cette zone.
Concernant les autres précodeurs diagonaux (WF, MMSE et MBER), nous
remarquons qu’ils assurent une bonne QoS uniquement lorsque le canal est bon (zone 3). Le
précodeur WF arrive à transmettre quelques images correctes dans des conditions moyennes
mais il n’assure pas une stabilité dans les résultats (écarts-type de 10,44dB pour « Caps » et
8,82dB pour « Monarch »).
83
CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE
Système MIMO 4×4, b = 4, MAQ-16
Code RS(37,32) sur les données utiles
Zone 1
40
Zone 2
Zone 3
Zone 4
CBP
WF
MMSE
MBER
Zone 1
1
E-dmin
Zone 2
Zone 3
Zone 4
0.9
35
0.8
30
Score SSIM
PSNR en dB
0.7
25
20
15
0.6
0.5
0.4
0.3
10
0.2
5
0
0.1
0
500
1000
1500
2000
0
Position sur la trajectoire du récepteur (×λ)
0
500
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
Figure 3.11. Evolution du PSNR et du score SSIM de l’image « Caps » sur le canal réaliste
avec une modulation MAQ-16
Précodeurs
WF
MMSE
MBER
E-dmin
CBP
MAUVAISES CONDITIONS
Zone 1
PSNR
Ecart-type
moyen (dB)
3,74
0,02
1,80
0,00
18,39
3,94
0,36
3,22
0,00
12,36
CONDITIONS MOYENNES
Zones 2 et 4
PSNR
Ecart-type
moyen (dB)
22,78
6,42
9,12
0,00
32,24
10,44
3,79
5,68
0,00
0,93
BONNES CONDITIONS
Zone 3
PSNR
Ecart-type
moyen (dB)
36,39
35,26
36,20
7,80
37,06
1,14
3,97
4,06
7,05
0,70
Tableau 3.6. Performances moyennes pour l’image « Caps » avec code RS(37,32) et
modulation MAQ-16
Enfin, le précodeur E-dmin fournit une mauvaise QoS en termes de qualité d’images,
sur l’ensemble du canal de transmission. Son cas est particulier, car bien qu’il fournisse les
meilleures performances en termes de TEB global sur l’ensemble des sous-canaux, le TEB sur
le premier sous-canal est trop élevé pour garantir le décodage correct de la couche de base.
Cela s’explique du fait que le précodeur E-dmin combine le premier sous-canal avec le dernier,
pour former un des deux sous-systèmes MIMO (voir §2.2.3). Le dernier sous-canal pénalise
alors le premier, ce qui est incompatible avec la transmission d’un flux hiérarchisé.
Globalement, les précodeurs de la littérature ont du mal à prendre en compte une
augmentation de l’efficacité spectrale pour garantir une bonne qualité d’image en réception.
On rappelle que seul les précodeurs MBER et E-dmin prennent en compte l’ordre de
modulation dans le processus d’allocation de la puissance. Toutefois, comme leur problème
d’optimisation est orienté vers la minimisation de leur critère respectif (TEB et dmin) sans
prise en compte de la notion de hiérarchie de la source, ces précodeurs sont incapables
d’assurer une bonne qualité d’image reçue pour l’ensemble des conditions de transmission.
Au contraire, le précodeur CBP modifie de façon adéquate l’allocation de la puissance pour
contrer la perte de robustesse engendrée par l’augmentation de l’efficacité spectrale en tenant
compte de l’impact du codage canal, ce qui se traduit par une bonne QoS en réception.
84
CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE
Système MIMO 4×4, b = 4, MAQ-16
Code RS(37,32) sur les données utiles
Zone 1
Zone 2
Zone 3
Zone 4
CBP
WF
Zone 1
1
35
MMSE
MBER
Zone 2
E-dmin
Zone 3
Zone 4
0.9
30
0.8
0.7
Score SSIM
PSNR en dB
25
20
15
0.6
0.5
0.4
0.3
10
0.2
5
0.1
0
0
500
1000
1500
2000
0
Position sur la trajectoire du récepteur (×λ)
0
500
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
Figure 3.12. Evolution du PSNR et du score SSIM de l’image « Monarch » sur le canal
réaliste avec une modulation MAQ-16
Précodeurs
WF
MMSE
MBER
E-dmin
CBP
MAUVAISES CONDITIONS
Zone 1
PSNR
Ecart-type
moyen (dB)
3,42
0,01
1,58
0,00
16,18
3,49
0,33
2,87
0,00
10,53
CONDITIONS MOYENNES
Zones 2 et 4
PSNR
Ecart-type
moyen (dB)
20,25
5,68
8,30
0,00
28,58
8,82
3,20
4,76
0,00
1,19
BONNES CONDITIONS
Zone 3
PSNR
Ecart-type
moyen (dB)
33,65
32,28
33,52
6,92
34,43
1,34
4,10
3,91
6,00
0,81
Tableau 3.7. Performances moyennes pour l’image « Monarch » avec code RS(37,32) et
modulation MAQ-16
3.3.2.4 Analyse visuelle
Les figures 3.13 et 3.14 présentent des exemples d’images reçues avec les différentes
stratégies de précodage. La figure 3.13, nous montre ainsi un exemple représentatif de l’image
« Caps » reçue dans de mauvaises conditions de transmission (zone 1, position 251) et sans
code RS. Dans de telles conditions de transmission, nous constatons que les précodeurs
MMSE, MBER et E-dmin ne sont pas en mesure de fournir une image exploitable (fig. 3.13
(c), (d) et (e)). Concrètement, le décodeur robuste JPWL commence le décodage des données
mais tombe très rapidement sur une erreur qui avorte le processus de décodage (voir §2.3.3).
Ce fonctionnement aboutit à une image quasiment vide si ce n’est le coin supérieur gauche
issu du décodage des premières données. Pour cet exemple, seuls les précodeurs WF et CBP
fournissent un résultat acceptable. L’image reçue par l’intermédiaire du précodeur WF (fig.
3.13 (b)) est uniquement constituée de la couche de base malgré une allocation de puissance
sur les trois premiers sous-canaux. La répartition de la puissance sur ces sous-canaux crée un
manque de puissance sur le premier sous-canal qui aboutit au décodage de la couche de base
avec de nombreuses distorsions. Les deux couches de qualité transitant sur les sous-canaux
deux et trois ne sont pas décodées car elles portent beaucoup trop d’erreurs.
85
CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE
CBP
WF
(a) Caps251 : PSNR = 32,45dB ; SSIM = 0,874
(b) Caps251 : PSNR = 24,01dB ; SSIM = 0,573
MMSE
MBER
(c) Caps251 : PSNR = 7,53dB ; SSIM = 0,004
(d) Caps251 : PSNR = 7,53dB ; SSIM = 0,004
E-dmin
(e) Caps251 : PSNR = 7,53dB ; SSIM = 0,004
Figure 3.13. Comparaison visuelle entre les résultats fournis par les précodeurs pour l’image « Caps »
dans de mauvaises conditions de transmission (zone 1, indice 251) et sans CCE sur les données utiles
86
CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE
CBP
WF
(a) Monarch2259: PSNR = 34,71dB ; SSIM = 0,941
(b) Monarch2259 : PSNR = 32,10dB ; SSIM = 0,901
MMSE
MBER
(c) Monarch2259 : PSNR = 30,38dB ; SSIM = 0,861
(d) Monarch2259 : PSNR = 19,28dB ; SSIM = 0,657
E-dmin
(e) Monarch2259 : PSNR = 14,36dB ; SSIM = 0,407
Figure 3.14. Comparaison visuelle entre les résultats fournis par les précodeurs pour l’image
« Monarch » dans des conditions de transmission moyennes (zone 4, indice 2259) avec un code
RS(37,32) sur les données utiles
87
CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE
Le précodeur CBP quant à lui ne transmet que la couche de base en allouant toute la
puissance sur le premier sous-canal. On peut ainsi décoder cette couche sans erreur et obtenir
ainsi le meilleur résultat visuel parmi les précodeurs utilisés. On rappelle que ce résultat est
obtenu en l’absence de protection sur les données utiles.
La figure 3.14, nous montre un exemple représentatif de l’image « Monarch » reçue
dans des conditions de transmission moyennes (zone 4, position 2259) avec un code
RS(37,32) sur les données utiles. Nous constatons tout d’abord que, contrairement au cas
précédent, tous les précodeurs fournissent un résultat exploitable dans le sens où l’on est en
mesure de comprendre l’image. Dans ce type de conditions de transmission, les précodeurs
MBER et E-dmin fournissent des résultats très variables car ils allouent la puissance sur la
totalité des sous-canaux. Or dans la grande majorité des cas, la puissance allouée pour la
transmission d’une couche n’est pas suffisante pour obtenir un décodage correct. Même si le
décodage RS atténue l’effet des erreurs de transmission, elles restent néanmoins trop
nombreuses et se traduisent pas des distorsions visuellement très marquées (fig. 3.14 (d) et
(e)). Les précodeurs CBP, WF et MMSE fournissent les meilleurs résultats (fig. 3.14 (a), (b)
et (c)). Dans ces conditions de transmission, les précodeurs WF et MMSE allouent également
de la puissance sur tous les sous-canaux. Malgré tout, ils transmettent généralement les deux
premières couches sans erreur mais la troisième couche souffre d’un manque de puissance
pour atteindre un TEB suffisamment faible. Ainsi le décodage de cette couche est susceptible
de provoquer des distorsions relativement légères (fig. 3.14 (b) et (c)). Le précodeur CBP
quant à lui, n’alloue la puissance que sur les trois premiers sous-canaux ce qui lui permet de
décoder fréquemment les trois premières couches sans erreur. Il surpasse ainsi globalement
les résultats fournis par les autres précodeurs.
3.3.3 Impact des erreurs d’estimation sur la CSI
La connaissance de la CSI est une problématique à part entière dans le domaine des
télécommunications. Effectivement, il n’est pas réaliste de considérer une connaissance
parfaite de la matrice de canal instantanée caractérisant le canal MIMO-OFDM. C’est pour
cela que nous considérons dans nos travaux une connaissance parfaite à instant donné et pour
un nombre limité de symboles OFDM. Nous ne faisons donc pas l’hypothèse d’une
connaissance parfaite de la CSI, mais d’une mise à jour « parfaite » à intervalles réguliers.
Toutefois dans cette section, nous souhaitons étudier l’impact des erreurs d’estimation
de la CSI au cours de la mise à jour. Nous introduisons ci-dessous le modèle d’erreur utilisé,
puis nous évaluerons l’impact de ce modèle d’erreur sur les résultats de simulations sur le
canal de transmission réaliste.
3.3.3.1 Modèle d’erreur d’estimation
Nous utilisons un modèle d’erreur gaussien sur l’estimation de la CSI. Ce modèle est
fréquemment rencontré dans la littérature [117] [126] [127] afin de caractériser les erreurs
d’estimation sur la CSI. Il consiste à modifier les coefficients complexes de la matrice de
canal par une perturbation gaussienne dont la variance dépend du RSB sur le canal.
On rappelle que la matrice de canal virtuel Hv définie telle que Hv = GvHFv, contient
les valeurs propres du canal MIMO telles que :
Hv = diag (σ i )i =1
b
88
(3.11)
CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE
où σ i2 représente le RSB sur le sous-canal SISO d’indice i. On définit le RSB global σ sur le
canal MIMO tel que :
b
∑σ
σ=
i =1
2
i
(3.12)
Comme la puissance reçue dépend du précodage, on considère que le RSB correspond au
rapport entre la puissance totale émise P0 sur la puissance totale du bruit défini par sa variance
2
σ bruit
:
σ=
P0
(3.13)
2
nRσ bruit
Ce qui conduit à :
P0
2
=
σ bruit
(3.14)
b
nR
∑σ
i =1
2
i
2
En connaissant la valeur de σ bruit
correspondant à la variance du RSB global du canal
MIMO, nous pouvons générer une matrice d’erreur d’estimation sur le canal Herr dont les
2
coefficients complexes sont indépendants de H, iid, centrés et de variance σ err
avec
2
2
σ err
= ασ bruit
. Le paramètre α est généralement fixé à 0,25 [117]. De cette manière, plus le
2
est faible.
RSB sur le canal MIMO est élevé et plus l’erreur d’estimation définie par σ err
Nous pouvons ainsi déterminer la matrice de canal estimée Hest à partir de la matrice
de canal réel H et de la matrice d’erreur d’estimation Herr :
Hest = H + Herr
(3.15)
En utilisant Hest à la place de H, nous intégrons ainsi une erreur d’estimation sur la
CSI dans nos simulations.
3.3.3.2 Robustesse des précodeurs aux erreurs d’estimation sur la CSI
Dans cette section, nous évaluons l’impact des erreurs d’estimation de la CSI sur le
PSNR et le score SSIM des images transmises. Pour cela, nous utilisons la configuration de
codage la plus robuste parmi celles citées précédemment, incluant les codes RS(37,32) sur les
données utiles. La figure 3.15 présente l’évolution du PSNR et du score SSIM pour l’image
« Caps ». Nous ne représentons que les résultats de l’image « Caps » car les conclusions sont
exactement les mêmes pour « Monarch ». Le tableau 3.8 présente une comparaison du PSNR
moyen en fonction des conditions de transmission obtenues avec et sans modèle d’erreur.
Nous pouvons ainsi évaluer la perte moyenne due à la présence d’erreurs d’estimation sur la
matrice de canal. Dans le cadre de ces tests, nous considérons deux configurations du
paramètre B (10-9 en gris et 10-12 en noir) pour le précodeur CBP. On rappelle que le
paramètre B correspond au TEB cible après décodage canal.
89
CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE
CBP, B = 10-9
CBP, B = 10-12
Système MIMO 4×4, b = 4, MAQ-4
Codes RS(37,32) sur les données utiles
MMSE
MBER
WF
E-dmin
Sans modèle d’erreur sur l’estimation de la CSI
Zone 1
40
Zone 2
Zone 3
Zone 4
Zone 1
1
Zone 2
Zone 3
Zone 4
0.9
35
0.8
30
Score SSIM
PSNR en dB
0.7
25
20
15
0.6
0.5
0.4
0.3
10
0.2
5
0
0.1
0
500
1000
1500
0
2000
0
500
Position sur la trajectoire du récepteur (×λ)
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
Avec modèle d’erreur sur l’estimation de la CSI
Zone 1
Zone 2
Zone 3
Zone 4
Zone 1
40
Zone 2
Zone 3
Zone 4
1
35
0.8
25
Score SSIM
PSNR en dB
30
20
15
0.6
0.4
10
0.2
5
0
0
500
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
0
0
500
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
Figure 3.15. Impact des erreurs d’estimation sur la CSI en termes de PSNR et de score
SSIM pour l’image « Caps »
Conditions de
transmission
Mauvaises
Zone 1
Moyennes
Zones 2 et 4
Bonnes
Zone 3
Modèle d’erreur
Sans
Avec
Sans
Avec
Sans
Avec
WF
MMSE
MBER
E-dmin
CBP avec B = 10-9
CBP avec B = 10-12
25,65
11,05
6,68
3,73
32,45
31,97
8,50
3,24
0,10
0,98
19,55
26,15
35,11
34,09
23,85
27,93
35,89
35,48
33,21
19,45
6,92
19,65
28,87
34,25
37,29
37,31
36,54
38,93
37,39
37,40
37,08
37,00
29,67
38,93
31,71
36,88
Tableau 3.8. Impact de l’erreur d’estimation sur la CSI en termes de PSNR moyen (en dB)
pour l’image « Caps » avec un code RS(37,32)
90
CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE
Comme nous pouvons le voir sur la figure 3.15, tous les précodeurs sont pénalisés par
une baisse du PSNR et du score SSIM. En ce qui concerne les précodeurs de la littérature,
nous constatons qu’ils sont inopérants (PSNR moyen inférieur à 10dB) dans de mauvaises
conditions de transmission (zone 1). Dans des conditions de transmission moyennes (zones 2
et 4), seul le précodeur WF assure la QoS (PSNR moyen de 33,21dB) avec une perte modérée
sur le PSNR moyen de 1,9dB. Dans de bonnes conditions de transmission (zone 3), les
précodeurs de la littérature sont faiblement impactés par les erreurs d’estimation sur la CSI
(perte sur le PSNR moyen inférieure à 1dB), mis à part pour le précodeur MBER qui perd
environ 7dB sur le PSNR moyen.
Nous pouvons constater que le précodeur CBP dans sa configuration définie
précédemment (B = 10-9), est le plus fortement impacté par les erreurs d’estimation sur la CSI.
Cela s’explique par le fait que le TEB cible est déterminé pour des hypothèses de
transmission idéales impliquant une estimation correcte de la CSI. Le fait d’évaluer la
puissance nécessaire aux sous-canaux à partir d’une matrice de canal erronée, conduit à
obtenir un TEB en réception supérieur au TEB cible. Par conséquent, le code RS(37,32) doit
corriger un nombre d’erreurs trop important au regard de sa capacité de correction. Il en
résulte un grand nombre de cas où les erreurs non-corrigées sont trop nombreuses sur la
couche de base, ce qui multiplie le nombre de cas d’images non-décodées. Ainsi les erreurs
d’estimation de la CSI conduisent aux pertes les plus importantes sur le PSNR moyen
(12,9dB, 7,02dB et 5,68dB pour des conditions de transmission respectivement mauvaises,
moyennes et bonnes) parmi les précodeurs comparés.
Toutefois, nous constatons que nous pouvons très significativement limiter l’impact
des erreurs d’estimation sur la CSI en renforçant la contrainte sur le TEB en réception. Dans
notre exemple, nous avons fixé le paramètre B égal à 10-12, ce qui permet de fournir
globalement, la meilleure QoS parmi les stratégies de précodage comparées. Ce paramètre est
spécifique au précodeur CBP et n’a pas d’équivalent chez les autres précodeurs qui ne
peuvent donc pas s’adapter à des hypothèses d’erreurs d’estimation sur la CSI.
L’augmentation de la valeur du paramètre B a pour conséquence d’augmenter la puissance
allouée sur un sous-canal (afin d’atteindre un TEB cible plus faible). Par conséquent, il peut
arriver que l’on manque de puissance afin d’utiliser efficacement un sous-canal
supplémentaire pour transmettre une couche d’amélioration. L’augmentation du TEB cible
présente essentiellement un impact lorsque le canal est mauvais (différence d’environ 0,5dB)
ou moyen (différence de 0,4dB). Néanmoins, cette stratégie permet de diminuer efficacement
l’impact des erreurs d’estimation sur la CSI.
3.4 Synthèse et conclusion
Ce troisième chapitre a permis de présenter une méthode originale d’allocation de la
puissance dont l’objectif est de maximiser la qualité visuelle des images reçues. L’algorithme
proposé permet de faire le lien entre la puissance, l’efficacité spectrale de la modulation, la
capacité de correction des CCE et le RSB des sous-canaux SISO. Cette méthode met donc en
relation plusieurs paramètres ayant un impact sur le compromis débit-distorsion, afin d’ajuster
finement la quantité de puissance allouée pour la transmission des couches de qualité JPWL.
L’allocation de la puissance sur les sous-canaux répond à une contrainte de TEB cible. Ce
paramètre est défini en relation avec la sensibilité du contenu aux erreurs de transmission. Si
le contenu est très sensible, on peut définir une contrainte correspondant à une transmission
quasiment sans erreur. A l’inverse, si de par sa nature le contenu est robuste aux erreurs, nous
pouvons adapter le TEB cible en conséquence.
91
CHAPITRE 3. PRISE EN COMPTE DU CONTENU DANS UN SYSTEME MIMO PRECODE
Les tests sur canal statistique ont permis de confirmer le paradoxe entre l’évaluation
des performances globales (TEB global sur l’ensemble des sous-canaux) et la notion de
hiérarchie. En effet, la hiérarchisation des données, qui présente de nombreux avantages
(scalabilité, stratégie de protection inégale, etc.), implique également un décodage progressif
des couches de qualité. Cette notion, qui est une contrainte forte, est contradictoire avec le
problème d’optimisation posé par les précodeurs usuels, qui ne tient pas compte de la
hiérarchisation des données au décodage. Ainsi, la stratégie de précodage proposée fournit de
moins bons résultats en termes de TEB global (critère fréquent d’évaluation), mais nous avons
également montré que ce critère n’a aucun lien avec la QoS dans un contexte de transmission
d’image hiérarchisée.
Les tests sur canal réaliste ont confirmé l’intérêt de notre algorithme pour maximiser
la qualité des images reçues. En premier lieu, nous avons montré la faculté de ce précodeur à
assurer la robustesse de la transmission sans codage canal. L’ajout d’un CCE permet
d’augmenter la valeur du TEB cible en lien avec la capacité de correction. On peut alors
« économiser » de la puissance sur un sous-canal pour la redistribuer à un autre sous-canal, et
transmettre ainsi un plus grand nombre de couches de qualité. L’algorithme montre également
une bonne prise en compte de la perte de robustesse liée à l’augmentation de l’efficacité
spectrale de la modulation. Enfin, nous avons évalué l’impact des erreurs d’estimation sur la
CSI. Notre précodeur montre effectivement une sensibilité importante face à ces erreurs
d’estimation. Toutefois, nous avons montré que nous pouvions significativement limiter
l’impact des erreurs d’estimation en renforçant la contrainte sur le TEB après décodage canal,
qui constitue un paramètre spécifique à notre méthode de précodage.
L’algorithme proposé permet donc d’assurer une bonne QoS pour une configuration
de codage (source et canal) et de transmission (modulation) définie. Il serait néanmoins
intéressant de faire varier les paramètres mis en jeu, afin de trouver la combinaison de
paramètres optimale permettant de maximiser la qualité visuelle des images reçues, en
fonction des conditions de transmission. Cette étude fera l’objet du quatrième chapitre.
92
CHAPITRE 4
STRATEGIE D’ADAPTATION DE LIEN POUR LA
TRANSMISSION D’UN CONTENU JPWL
Sommaire
4.1
Introduction
94
4.2
Stratégie de transmission optimisée
94
4.3
Définition des contraintes
4.3.1 Contrainte de débit
4.3.2 Contrainte sur la QoS
4.3.3 Contrainte sur la puissance
95
95
96
96
4.4
Minimisation de la distorsion
96
4.5
Représentation arborescente pour la résolution du problème
4.5.1 Commentaires sur le choix adopté
4.5.2 Construction de l’arbre
4.5.3 Recherche du chemin minimisant la distorsion
98
99
99
102
4.6
Résultats de simulations sur canal réaliste
4.6.1 Contexte de simulation
102
102
4.6.1.1
4.6.1.2
4.6.2
4.6.3
4.6.4
4.6.5
4.7
Définition de la configuration de base
103
Définition des paramètres pour la stratégie d’adaptation de lien 104
Apports de la stratégie d’adaptation de lien
Gestion des ressources
Complexité de la solution
Analyse visuelle
Synthèse et conclusion
105
108
109
111
115
93
CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL
4.1 Introduction
Le chapitre précédent a permis de présenter une technique de précodage optimisée
pour la transmission d’un contenu hiérarchisé. Ainsi, pour une configuration de transmission
donnée (modulation et codage canal), la stratégie proposée est en mesure d’améliorer la
qualité des images en comparaison d’autres techniques de précodage de la littérature. Le
précodage MIMO est généralement associé à l’optimisation conjointe de l’émetteur et du
récepteur en considérant les hypothèses de fonctionnement suivantes [50] :
•
Le débit des données est fixé. Il ne varie pas en fonction des conditions de travail ;
•
La modulation utilisée n’évolue pas ;
•
Le nombre de voie de données émises en parallèle est constant ;
•
Le codage de l’information est considéré comme indépendant du précodeur. Il
s’effectue donc en amont sans être pris en compte.
Toutefois, la stratégie de précodage qui a été proposée permet de mettre en relation
l’allocation de la puissance avec les paramètres de modulation et de codage canal. Ainsi, il est
envisageable de mettre au point une stratégie d’adaptation de lien, basée sur le précodeur
CBP, permettant d’intégrer des stratégies UEP, UPA, modulation adaptative et codage de
source adaptatif. Dans un tel schéma, le réglage des différents paramètres doit être défini par
rapport à l’état du canal avec comme objectif la maximisation de la qualité des images en
réception.
Dans ce chapitre, nous proposons la mise en place d’une méthode d’optimisation
permettant de sélectionner, avant la transmission, le jeu de paramètre le plus adapté aux
conditions sur le canal de transmission. Pour cela, nous présentons les contraintes considérées
puis nous formulons le problème d’optimisation à résoudre. Nous proposons ensuite une
méthode de résolution de ce problème avant de tester l’efficacité de cette solution face aux
conditions variables du canal réaliste.
4.2 Stratégie de transmission optimisée
La figure 4.1 (à comparer avec la figure 3.1) présente le schéma bloc de la stratégie de
transmission avec adaptation de lien. Le canal MIMO est décomposé en sous-canaux SISO
sur lesquels on fait transiter les couches de qualité JPWL en respectant la correspondance
entre la hiérarchie des sous-canaux et la hiérarchie des couches de qualité. L’architecture de
cette solution reprend celle de la stratégie présentée dans le chapitre 3. La différence tient
dans l’ajout d’un bloc d’optimisation conjointe prenant en entrée la CSI. A partir de la CSI,
l’optimisation est en mesure de déterminer les paramètres suivants :
•
le nombre de sous-canaux utilisés L parmi les b sous-canaux disponibles avec L ≤ b ;
•
le débit source de chaque couche de qualité RS,i avec i = 1…L ;
•
le code RS sur chaque couche de qualité défini par le paramètre Ni avec i = 1…L ;
•
l’ordre de modulation sur chaque sous-canal Mi avec i = 1…L.
Le bloc d’optimisation a pour but de déterminer les paramètres du système avant la
transmission puis de transmettre l’image avec le précodeur CBP, intégrant ainsi une stratégie
UPA. La stratégie offre la possibilité de ne pas utiliser tous les sous-canaux. Pour chacun des
L sous-canaux utilisés, on transmet une couche de qualité JPWL dont le débit source RS,i
dépend du choix de la modulation Mi et du code RS défini par le paramètre Ni.
94
CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL
Optimisation conjointe
RS,i
i = 1…L
Codage
JPWL en L
couches de
qualité
hiérarchisées
Ni
i = 1…L
Codage
canal JPWL
RS(Ni,K)
CSI :
σ i2 , i = 1...b
Mi
i = 1…L
MAQ-M1
MAQ-M2
γ 1 = f12σ 12
Stratégie
UPA par
précodage
(Fd)
MAQ-ML
γ 2 = f 22σ 22
Décodage
ML
(Gd)
γ L = f L2σ L2
MAQ-M1 -1
MAQ-M2
-1
Décodage
JPWL
robuste
MAQ-ML -1
Matrice de canal virtuel Hv
b sous-canaux disponibles
L sous-canaux utilisés
L≤b
Codage JPWL
Figure 4.1. Synoptique de la stratégie d’adaptation de lien
4.3 Définition des contraintes
4.3.1 Contrainte de débit
Comme nous voulons intégrer la possibilité de faire varier l’ordre de modulation, le
débit de la source ainsi que le CCE, il est nécessaire d’introduire une contrainte sur le débit.
De cette manière, on sera en mesure de déterminer le meilleur jeu de paramètres
correspondant à la contrainte de débit considéré. On introduit donc le paramètre Smax,
correspondant au nombre de symboles OFDM maximum que l’on peut utiliser sur un souscanal. Le paramètre Smax pourrait être choisi spécifiquement pour chaque sous-canal (Smax,i
avec i = 1…L) ce qui reviendrait à attribuer un temps d’utilisation propre à chacun d’eux.
Dans le cadre des simulations, nous ne faisons pas cette hypothèse. Nous considérerons donc
le même paramètre Smax sur tous les sous-canaux.
Le fait de fixer la valeur du paramètre Smax entraîne une contrainte sur le débit que
nous décrivons. Pour cela, nous introduisons le paramètre βi correspondant au nombre de bits
qui peuvent être transmis à travers le sous-canal i, pour un nombre de symboles OFDM
correspondant à Smax. Nous pouvons donc écrire :
β i = S max N SC log 2 ( M i )
(4.1)
où NSC est le nombre de sous-porteuses utiles OFDM (NSC = 48 dans la norme IEEE802.11n
[29]). Ainsi, pour une valeur de Smax donnée, le nombre de bits transmissible sur le sous-canal
i ne dépend que de l’ordre de modulation Mi. Après le codage source et le codage canal sur le
sous-canal i, nous pouvons considérer les paramètres βS,i et βC,i correspondant respectivement
au nombre de bits alloués au codage de la source et au nombre de bits alloués au codage
canal. Par conséquent, le système doit respecter la contrainte suivante sur le débit :
β S , i + β C ,i ≤ β i
(4.2)
95
CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL
Le paramètre Smax est défini par l’utilisateur. Toutefois, sa valeur peut dépendre d’une
application particulière ou être défini dans le cadre d’une norme de transmission. La valeur de
Smax à un impact sur le temps de transmission et, par conséquent, sur la qualité de l’image
transmise.
4.3.2 Contrainte sur la QoS
Comme pour la méthode d’allocation de la puissance présentée au chapitre 3, nous
intégrons le paramètre B correspondant au TEB cible en réception après décodage canal.
Comme pour le paramètre Smax, ce paramètre peut être considéré spécifiquement pour chaque
sous-canal (Bi avec i = 1…L) si une application particulière le nécessite. Toutefois, par soucis
de simplification, nous considérerons dans la suite du document la même valeur de B pour
tous les sous-canaux. Le paramètre B permet de formuler la contrainte sur la QoS définie par
l’utilisateur, telle que :
TEBi ≤ B
(4.3)
où TEBi correspond au TEB effectif en réception après décodage canal. La valeur de B est
déterminée par l’utilisateur en fonction de la sensibilité du contenu aux erreurs. En effet, le
réglage de B influencera la quantité d’erreurs acceptables dans le flux binaire.
4.3.3 Contrainte sur la puissance
Au cours de la transmission, les coefficients de précodage f i 2 avec i = 1…L sont
définis sous la contrainte de puissance définie dans le paragraphe 3.2.5 à savoir :
L
∑f
i =1
2
i
= P0
(4.4)
où P0 est la puissance totale disponible à l’émission. Comme nous intégrons la possibilité de
ne pas utiliser la totalité des b sous-canaux disponibles, nous considérons de fait f i 2 = 0 pour
i = L...b .
4.4 Minimisation de la distorsion
Le codeur JPWL utilise l’algorithme de contrôle de débit de JPEG 2000 afin de
minimiser la distorsion de l’image sous contrainte de débit cible [9]. Le codage entropique par
plan de bits de JPEG 2000 est réalisé en trois passes engendrant la création de trois points de
troncature par code bloc. Il est toutefois possible de spécifier plusieurs débits cibles RS,i
correspondant au débit des différentes couches de qualité. Dans ce cas, le flux binaire de
chaque code bloc est coupé en différents endroits. La réunion des premières portions des flux
binaires de chaque code bloc forme une première couche de qualité. L’ajout des secondes
portions de chaque code bloc forme la deuxième et ainsi de suite.
96
CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL
L’optimalité de la répartition des bits se fait suivant l’algorithme de contrôle de débit
inclus dans le codeur JPEG 2000. Chaque sous-bande d’ondelette est divisée en code blocs
dont les coefficients fréquentiels sont codés indépendamment. On définit ainsi {Φj}j = 1,2,…
l’ensemble de tous les code blocs qui représentent l’image. Pour chaque code blocs Φj, un
flux binaire indépendant est généré. Ces flux binaires présentent la propriété de pouvoir être
tronqués en diverses longueurs discrètes notées x1j , x 2j , x 3j ,… La distorsion engendrée par la
reconstruction de chacun des sous-flux tronqués peut alors être estimée et notée
D 1j , D 2j , D 3j ,… Au cours du processus d’encodage, les longueurs x nj et les distorsions
associées D nj sont calculées et stockées temporairement. Une fois que l’image entière a été
compressée, une opération post-traitement traite tous les code blocs compressés et détermine
les points de troncature optimaux afin d’atteindre la contrainte de débit spécifiée dans les
paramètres de codage.
L’algorithme JPEG 2000 utilise l’erreur quadratique moyenne comme mesure de la
distorsion. Etant donné que l’erreur quadratique moyenne est une mesure additive, la
distorsion totale D de l’image reconstruite peut s’écrire :
D = ∑Dj j
n
(4.5)
j
où nj est le point de troncature pour le code bloc Φj. On définit X comme étant le nombre de
bits associé au codage du flux binaire. Alors, pour un ensemble de points de troncature nj,
nous pouvons écrire :
X = ∑xjj
n
(4.6)
j
Le but de l’algorithme d’adaptation de débit est de trouver l’ensemble n des valeurs nj
qui minimisent D, sous la contrainte X ≤ β S avec βS le nombre de bit alloué au codage de
l’image tel que β S = ∑i =1 β S ,i . La méthode des multiplicateurs de Lagrange est une méthode
L
bien connue permettant de résoudre des problèmes d’optimisation sous contrainte. Dans notre
cas, le problème d’optimisation s’écrit :
(
(n, ) = min ∑ R j j − µD j j
s.c
X ≤ βS
n
n
)
(4.7)
où la valeur du multiplicateur de Lagrange doit être ajustée afin de trouver les points de
troncature qui minimisent l’équation 4.7 en satisfaisant la condition X = βS. Il n’y a pas
d’algorithme simple qui garantisse un optimum global pour un ensemble de points de
troncature donné. Toutefois, chacun des ensembles de points de troncature ni qui minimisent
l’équation 4.7, pour différentes valeurs de , est optimal au sens d’une distorsion minimum
atteinte pour un débit cible donné. Si la plus grande valeur de est trouvée de telle sorte que
l’ensemble des points de troncature ni, obtenus par la minimisation de l’équation 4.7, fournit
un débit X ≤ βS, alors il n’est pas possible de trouver un autre ensemble de points de troncature
qui fournira une distorsion globale plus faible pour un débit inférieur ou égal à X [9].
Ainsi, le contrôle de débit du codeur JPEG 2000 permet de s’assurer que pour un
nombre de bits fixés, la répartition des bits dans le flux binaire assure la plus faible distorsion
97
CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL
possible au sens de l’erreur quadratique. Par conséquent, dans notre stratégie d’adaptation de
lien, le problème de minimisation de la distorsion peut être vu comme un problème de
maximisation du débit de la source. Pour une image, le débit alloué au codage de la source RS
peut se définir tel que :
RS =
βS 1 L
= ∑ β S ,i
ρ
ρ i =1
(4.8)
où ρ est le nombre total de pixels dans l’image. La minimisation de la distorsion D de l’image
correspond à la maximisation du nombre de bits alloués au codage de la source βS en
respectant les contraintes énumérées précédemment :
Contrainte de débit :
β S ,i + β C ,i ≤ β i
Contrainte de QoS :
TEB i ≤ B ,
Contrainte de puissance :
∑
L
i =1
f i ≤ P0
2
avec
β i = S max N SC log 2 (M i ) ,
β
β C ,i = i ( N i − K ) ,
Ni
avec
L≤b.
(4.9)
Nous pouvons résumer la contrainte de débit par l’expression suivante :
β S ,i −
K
S max N SC log 2 ( M i ) ≤ 0 avec i = 1... L
Ni
(4.10)
Maintenant que les contraintes du système ont été introduites et que le problème
d’optimisation a été formulé, nous pouvons décrire la méthode permettant de le résoudre.
4.5 Représentation arborescente pour la résolution du problème
Le processus de transmission d’une image suivant la stratégie d’adaptation de lien peut
être décrit en quatre étapes :
1.
Initialisation : Acquisition de la CSI, réglage de Smax et B par l’utilisateur ;
2.
Optimisation conjointe pour déterminer la configuration de codage/transmission
{L, M i , N i , RS ,i }iL=1 optimale ;
3.
Codage source et codage canal JPWL en fonction de L, Ni et Rs,i pour i = 1…L ;
4.
Transmission sur le canal MIMO en utilisant l’allocation hiérarchisée source-canal,
la modulation adaptative (Mi pour i = 1…L) et la stratégie UPA grâce au précodeur
CBP ( f i 2 pour i = 1…L).
Le rôle de l’optimisation conjointe est donc de fournir une méthode permettant de
déterminer la configuration de codage qui maximise le débit de la source en fonction des
autres contraintes sur les paramètres du système (débit, QoS et puissance). Comme les
paramètres Mi et Ni sont discrets, on peut envisager de confronter toutes les configurations de
codage qui respectent les contraintes données pour sélectionner ensuite la configuration qui
maximise le débit de la source. La représentation sous forme d’arbre est un bon moyen de
98
CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL
répertorier toutes les configurations possibles puis par la suite de sélectionner la configuration
optimale.
4.5.1 Commentaires sur le choix adopté
Il est à noter que la résolution de ce problème d’optimisation par la méthode des
multiplicateurs de Lagrange, associé aux conditions de Kuhn et Tucker [118] qui garantissent
les conditions d’optimalité d’un problème d’optimisation sous contraintes d’inégalités, serait
trop complexe car il y a beaucoup de paramètres qui sont à la fois discrets et continus. En
effet, cette méthode est basée sur l’usage de dérivées partielles conduisant à des valeurs
optimales continues pour les variables discrètes. Une manière de résoudre ce problème serait
alors d’associer la valeur discrète la plus proche ce qui n’assure plus l’optimalité de la
solution. Par ailleurs, nous ne sommes pas certains de trouver un optimum global comme
solution (problème de convexité). De plus, comme nous l’avons vu précédemment, la solution
adoptée doit respecter la hiérarchie de la source par une prise en compte de chacun des souscanaux. On rappelle l’exemple du précodeur MBER étudié dans le chapitre 2 qui minimise
globalement le TEB sur l’ensemble des sous-canaux mais qui ne définit pas de contraintes
pour le décodage des couches de qualité, les rendant inexploitables en réception en l’absence
d’un CCE très performant. Le traitement global des sous-canaux est en contradiction avec la
transmission d’un contenu hiérarchisé, où il est nécessaire d’assurer une transmission correcte
et exploitable sur chaque sous-canal. La représentation en arbre présente l’avantage de traiter
l’allocation des ressources, sous-canal par sous-canal, respectant ainsi la hiérarchie de la
source et du canal. Cette représentation est un bon moyen d’assurer une qualité de base avant
la transmission des couches d’amélioration lorsque les conditions sur le canal le permettent.
4.5.2 Construction de l’arbre
Un ensemble de paramètres optimisés {L, M i , N i , RS ,i }i =1 représente une configuration
de codage/transmission avec Mi ∈
, l’ensemble de taille m contenant les ordres de
modulation disponibles, avec j) représentant le jème élément de . Ni ∈ , l’ensemble de
taille n contenant les codes RS disponibles, avec j) représentant le jème élément de . Par
conséquent, il y a (m × n) configurations de codage possibles. La complexité de l’arbre est
exponentielle. En effet, l’arbre se construit jusqu’au sous-canal d’indice b, ce qui représente
de manière exhaustive (m × n)b configurations possibles (fig. 4.2). La construction de l’arbre
repose sur un algorithme récursif. Pour chaque couple de modulation et de codage canal sur
un sous-canal formant une configuration de codage potentiel, on stocke les informations
relatives à la configuration (nœuds verts sur la figure 4.2). D’un point de vue pratique, on
utilise une structure « config » contenant les éléments suivants :
L
•
L’indice i du sous-canal courant ;
•
L’ordre de modulation Mi ∈
•
Le code RS défini par le paramètre Ni ∈
•
Le nombre de bits βS,i alloué au codage de la source pouvant être transmis via le souscanal i ;
•
La puissance résiduelle Pr après le calcul de l’allocation de puissance nécessaire pour
garantir la contrainte de QoS compte tenu des paramètres sur le sous-canal.
utilisé sur le sous-canal i ;
utilisé sur le sous-canal i ;
99
CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL
Sous-canal SISO 1
Modulation
MAQ
Code RS
N1 =
N1 =
Sous-canal SISO 2
Stockage
config
Modulation
MAQ
Code RS
N1 =
N2 =
1
N2 =
2
N2 =
3
N2 =
n
1
2
M2 =
M1 =
Stockage
config
3
M2 =
M1 =
Racine de l’arbre
(initialisation)
N1 =
n
N1 =
(m-1)×n + 1
M1 =
N1 =
M1 =
N1 =
N1 =
M2 =
M2 =
N2 =
n+1
M2 =
N2 =
n+2
M2 =
N2 =
n+3
N2 =
2×n
(m-1)×n + 2
(m-1)×n + 3
m×n
M2 =
M2 =
Figure 4.2. Exemple de représentation en arbre pour 2 sous-canaux SISO
Les programmes décris ci-dessous (tableaux 1 et 2) permettent de créer l’arbre à partir
d’une fonction récursive.
1:
2:
3:
4:
5:
Initialisation de la puissance : config→Pr = P0 ;
Sélection du sous-canal : config→i = 0 ;
Réglages de l’utilisateur : Smax et B ;
Acquisition CSI: Hv = diag(σ1,σ2,…,σb) ;
Appel de la fonction récursive Créer_Arbre(config) ;
Tableau 4.1. Programme d’initialisation pour la création de l’arbre
La fonction d’initialisation de l’arbre (tableau 4.1) est nécessaire afin d’initialiser la
puissance à sa valeur maximale, lire le CSI et définir les valeurs des paramètres Smax et B. La
100
CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL
fonction récursive est appelé Créer_Arbre (tableau 4.2). Elle est appelée en utilisant une
structure « config » en paramètre.
La fonction Créer_Arbre permet de créer l’arbre de manière exhaustive et, par
conséquent, de tester toutes les combinaisons de modulation et de codage canal sur chaque
sous-canal. Cette fonction est appelée récursivement à chaque nœud vert de l’arbre (voir
figure 4.2). Le principe de cet algorithme consiste à déterminer la quantité de puissance
nécessaire pour atteindre la contrainte TEBC,i. Dès lors que la puissance nécessaire
(correspondant au coefficient de précodage f i 2 ) est déterminée, cette valeur est comparée
avec la quantité de puissance résiduelle Pr. Si l’on dispose d’une quantité de puissance
suffisante, la configuration de transmission est considérée possible. La quantité de données
utiles βS,i qui peut transiter par le sous-canal i est alors calculée pour cette configuration. Les
informations de codage et de transmission sont stockées dans une nouvelle structure
« config ». La puissance résiduelle est mise à jour puis la fonction « Créer_Arbre » est
appelée avec la nouvelle structure « config » en paramètre s’il reste des sous-canaux
disponibles. Si une condition d’arrêt intervient (lorsque qu’il n’y a plus de puissance
résiduelle ou que tous les sous-canaux ont été utilisés), la branche courante de l’arbre est
interrompu puis une autre configuration est testée.
Créer_Arbre(config)
1:
2:
3:
4:
5:
6:
pour chaque Mi ∈ faire
pour chaque Ni ∈ faire
Calculer TEBC ,i en fonction de B ;
Calculer f i 2 en fonction de σ i2 ;
si f i 2 ≤ (config→Pr) alors
i = (config→L) + 1 ;
7:
Calculer β i en fonction de Smax ;
8:
Calculer βC,i en fonction de β i ;
9:
Calculer β S ,i = β i − β C ,i ;
10:
11:
12:
13:
14:
15:
16:
17:
18:
19:
Stockage de la configuration dans
new_config = { i, Mi, Ni, β S ,i } ;
(new_config→Pr) = (config→Pr) - f i 2 ;
si( i + 1 ≤ b ) alors
Créer_Arbre(new_config) ;
sinon Fin de la branche ;
fin de si
sinon Fin de la branche ;
fin de si
fin de pour
fin pour
Tableau 4.2. Fonction récursive permettant la création de l’arbre répertoriant les
configurations de codage/transmission
101
CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL
Ainsi, nous pouvons créer un arbre contenant toutes les possibilités de codage et de
transmission respectant les contraintes. Le respect des contraintes permet en outre de
supprimer toutes les configurations inenvisageables ce qui conduit à créer un arbre nonexhaustif, diminuant ainsi la complexité.
4.5.3 Recherche du chemin minimisant la distorsion
Une fois que l’arbre est construit, il ne reste plus qu’à déterminer la configuration de
codage/transmission optimale qui minimise la distorsion de la source. Ce choix est
relativement simple car nous cherchons simplement à maximiser le débit de la source. Pour ce
faire, il suffit de parcourir toutes les feuilles de l’arbre afin de trouver le chemin qui maximise
L
le critère ∑i =1 β S ,i , avec L correspondant au nombre de sous-canaux utilisés par le chemin
courant.
Ainsi, le chemin optimal fournit le nombre de sous-canaux à utiliser (correspondant
également au nombre de couches de qualité JPWL), le débit source de chaque couche de
qualité, l’ordre de la modulation MAQ et le code RS sur chaque sous-canal. Lorsque les
paramètres ont été calculés, l’image est codée puis transmise à travers le canal MIMO. Au
cours de la transmission d’une même image, les paramètres restent constants à l’exception des
coefficients de précodage f i 2 avec i = 1…L, qui sont calculés dynamiquement en fonction de
l’état du canal et des autres paramètres du système.
Remarque
Dans le cas de figure peu fréquent où plusieurs feuilles de l’arbre fourniraient le même
critère ∑i =1 β S ,i qui maximise le débit de la source, le choix de la configuration optimale
L
parmi ces configurations potentielles serait défini par le chemin qui maximise le
L −1
critère ∑i =1 β S ,i .
4.6 Résultats de simulations sur canal réaliste
4.6.1 Contexte de simulation
Les simulations qui suivent ont pour objet de mettre en avant l’apport de la stratégie
d’adaptation de lien pour un canal MIMO 4×4 qui varie dans le temps par rapport aux
stratégies de transmission non-adaptatives étudiées dans les chapitres 2 et 3. Ainsi, nous
n’utiliserons que le canal réaliste présenté dans le paragraphe 2.4.1.4 qui permet de faire
varier de manière réaliste les conditions de transmission en fournissant alternativement des
conditions mauvaises (NLOS, zone 1), moyennes (NLOS, zone 2 et 4) ou bonnes (LOS, zone
3). A ce titre, le paramétrage de la couche physique est le même que pour les simulations des
chapitres 2 et 3, et est défini dans le paragraphe 2.4.1.1. Nous ne considérons pas une
connaissance parfaite de la CSI mais seulement une actualisation de la CSI tous les 20
symboles OFDM conformément à la norme IEEE 802.11n. Entre deux actualisations, des
erreurs sur la CSI peuvent donc apparaître.
102
CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL
Afin d’évaluer le gain apporté par la stratégie d’adaptation de lien, nous définissons
tout d’abord une configuration de base permettant de fournir des résultats références avec les
stratégies non-adaptatives. A partir de cette configuration de base, nous déterminons la valeur
du paramètre Smax équivalent (correspondant au nombre de symboles OFDM maximum
utilisables) fournissant ainsi la contrainte de base à la stratégie d’adaptation de lien. On peut
ainsi évaluer le gain de cette stratégie dans des conditions comparables.
4.6.1.1 Définition de la configuration de base
Nous transmettons les images « Caps » et « Monarch » (cf. fig 2.7) de résolution 768 ×
512 pixels. Ces images sont codées par l’intermédiaire de JPWL pour être transmises sur le
canal MIMO 4×4. Comme la décomposition de ce canal conduit à considérer quatre souscanaux SISO, nous codons les images JPWL en quatre couches de qualité hiérarchisées
présentant chacune un débit de 0,125bpp. Chaque image est codée en une seule tuile. Nous
intégrons les protections prédéfinies par le standard JPWL pour l’entête principal, l’entête de
tuile et les entêtes de paquets. Nous intégrons également les marqueurs de resynchronisation
en début de paquet (marqueurs SOP) et en fin d’entête de paquet (marqueurs EPH). Nous
utilisons toujours le code RS(37,32) de JPWL sur les données utiles. Le tableau 4.3 résume
les paramètres des couches physique et application pour la définition de la configuration de
base.
CONFIGURATION DE BASE
COUCHE PHYSIQUE
Système MIMO
Sous-canaux SISO équivalents
Modulation
COUCHE APPLICATION
Nombre de couche de qualité
Débit de la source
Codage canal (données utiles)
4×4
4
MAQ-4 / sous-canal
4
0,125bpp / couche de qualité
RS(37,32)
Tableau 4.3. Définition des paramètres de la configuration de base
Les scores PSNR et SSIM des images codées via la configuration de base sont fournis
dans le tableau 4.4 ci-dessous :
Caps
Monarch
1ère couche
PSNR SSIM
+ 2ème couche
PSNR SSIM
+ 3ème couche
PSNR SSIM
+ 4ème couche
PSNR SSIM
29,60 0,810
24,92 0,805
31,80 0,861
28,09 0,868
33,49 0,892
30,28 0,898
34,95 0,916
32,01 0,918
Tableau 4.4. Distorsion (PSNR en dB et SSIM) des images tests pour un codage de 0,125bpp
par couche de qualité avec code RS(37,32) sur les données utiles
Le tableau 4.4 permet de fournir des repères pour la lecture des courbes de PSNR et de
score SSIM issus des résultats de simulation.
103
CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL
4.6.1.2 Définition des paramètres pour la stratégie d’adaptation de lien
Dans le cadre de la stratégie d’adaptation de lien, l’utilisateur doit définir la valeur du
paramètre Smax qui correspond au nombre de symboles OFDM maximum que la stratégie peut
utiliser sur chaque sous-canal. Pour cela, nous définissons la valeur de Smax à partir des
paramètres de la configuration de base (tab. 4.3) et des paramètres de la couche application.
Considérant une résolution d’image de 768×512 pixels pour un débit de 0,125bpp par couches
de qualité pour la configuration de base, nous pouvons faire transiter 49152 bits par souscanal SISO. Sachant qu’un symbole OFDM de la norme IEEE802.11n [29] utilise 48 sousporteuses utiles et que l’on utilise des modulations MAQ-4 sur chaque sous-canal, nous
pouvons faire transiter 96 bits par symbole OFDM. Au final, il faut donc utiliser 512
symboles OFDM afin de faire transiter une image codée suivant la configuration de base
définie par le tableau 4.3.
Afin de se placer dans des conditions comparables, nous définissons donc le paramètre
Smax de la stratégie d’adaptation de lien équivalent à 512 symboles OFDM. Le tableau 4.5
résume les autres paramètres utilisés dans le cadre de la stratégie d’adaptation de lien.
CONFIGURATION POUR L’ADAPTATION DE LIEN
COUCHE PHYSIQUE
Système MIMO
Sous-canaux SISO équivalents
Ordre des modulations MAQ-M
Nombre de symboles OFDM maximum par sous-canal Smax
4×4
4
{4, 16, 64}
512
COUCHE APPLICATION
Nombre de couche de qualité
Débit de la source
Paramètres N des codes RS(N,32)
TEB cible après décodage canal B
1à4
variable
{37, 38, 40, 43, 45}
10-9
Tableau 4.5. Définition des paramètres de la stratégie d’adaptation de lien
Dans le cadre de notre stratégie, nous utilisons trois ordres de modulation possibles
(MAQ-4, MAQ-16 et MAQ-64) indépendamment sur chacun des sous-canaux SISO. Les
quatre sous-canaux SISO peuvent être utilisés partiellement ou en totalité afin de transmettre
une image composée de une à quatre couches de qualité. Le débit de la source est variable car
il dépend du nombre de sous-canaux utilisés, des ordres de modulation ainsi que des CCE
utilisés. On considère la possibilité d’utiliser cinq codes RS différents définis dans la norme
JPWL allant du code RS(37,32) au code RS(45,32), pour une capacité de correction t pouvant
aller de 2 à 6. Nous utilisons uniquement les codes présentant la redondance la plus faible afin
de ne pas attribuer toute la robustesse du schéma aux performances du codage canal. Le choix
des paramètres du tableau 4.5 (modulation, codage canal et système MIMO) conduit à
considérer jusqu’à 50625 configurations ((m × n)b avec m = 3, n = 5 et b = 4). Le précodeur
CBP qui est au cœur de la stratégie d’adaptation de lien est paramétré afin de fournir un TEB
cible après décodage canal équivalent à 10-9 (voir §3.2.5). Il en est d’ailleurs de même pour
l’utilisation du précodeur CBP avec la configuration de base.
104
CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL
4.6.2 Apports de la stratégie d’adaptation de lien
Dans le cadre de ces simulations, les images sont transmises pour chaque position de
la trajectoire du récepteur en tenant compte de la mobilité. On dispose donc d’une image
reçue pour chaque point de la trajectoire. Afin de rendre les courbes plus lisibles, les résultats
ont été moyennés à l’aide d’une fenêtre glissante comprenant 20 valeurs (voir §2.4.2.2). Les
figures 4.3 et 4.5 montrent les résultats de simulation de transmission avec la configuration de
base (tab. 4.3) pour les images « Caps » et « Monarch » respectivement. Les figures 4.4 et 4.5
montrent, quant à elles, le gain apporté par la stratégie d’adaptation de lien par rapport aux
performances affichées par le précodeur CBP dans une configuration de transmission avec
codage canal et modulation figés. Les tableaux 4.6 et 4.7 viennent compléter les résultats en
fournissant les performances moyennes en termes de PSNR par zones de transmission ainsi
que l’écart-type par rapport au PSNR moyen sur la zone considérée. L’écart-type fournit ainsi
une information sur la dynamique des résultats.
Premièrement, nous pouvons constater que les courbes des images « Caps » et
« Monarch » présentent un comportement similaire entre les précodeurs. Cette constatation
est également vraie concernant les métriques PSNR et SSIM.
Deuxièmement, nous observons que le comportement des précodeurs est similaire à
celui des chapitres 2 et 3. Nous noterons également qu’en l’absence d’optimisation, la
meilleure QoS est fournie par le précodeur CBP avec une bonne stabilité dans les résultats et
cela quelles que soient les conditions de transmission. Les explications quant à ces résultats
ont été données précédemment dans les chapitres 2 et 3.
Enfin, nous pouvons noter l’apport de la stratégie d’adaptation de lien par rapport à un
schéma non-adaptatif. On remarque ainsi que la stratégie d’adaptation de lien améliore de
façon significative la robustesse du schéma à la transmission en comparaison du précodeur
CBP qui affiche les meilleures performances parmi les précodeurs dans une configuration
non-adaptative. Dans de mauvaises conditions de transmission (zone 1), nous pouvons
constater un gain moyen de 0,54dB pour « Caps » et de 0,7dB pour « Monarch » par rapport
au précodeur CBP seul. De plus, ce gain est à mettre en relation avec l’écart-type du PSNR
qui est le plus faible sur cette zone (1,07dB pour « Caps » et 1,47dB pour « Monarch ») parmi
toutes les stratégies proposées. En effet, on remarque que la stratégie d’adaptation de lien est
en mesure de choisir un jeu de paramètres permettant de contrer les évanouissements
fréquentiels comme c’est typiquement le cas autour de la position d’indice 100. Dans des
conditions de transmission de qualité moyennes (zone 2 et 4), le gain en robustesse est encore
meilleur par rapport au précodeur CBP (en moyenne 0,87dB pour « Caps » et 0,99dB pour
« Monarch »). Enfin, on constate une amélioration significative des performances due à la
stratégie d’adaptation de lien lorsque le canal présente de bonnes conditions de transmission
(zone 3). En effet, la stratégie peut pleinement tirer parti des conditions favorables en utilisant
une modulation avec une haute efficacité spectrale (MAQ-64) ainsi qu’un faible niveau de
redondance. La quantité de donnée utile est ainsi largement supérieure comparativement aux
stratégies non-adaptatives, ce qui explique l’écart important avec le précodeur CBP seul en
termes de PSNR moyen (4,34dB pour « Caps » et 5,09dB pour « Monarch »). D’une manière
générale, la stratégie d’adaptation de lien fournit une bonne stabilité dans les résultats au
regard des écart-type par rapport au PSNR moyen à peu près équivalent quelles que soient les
conditions de transmission.
105
CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL
Zone 1
Zone 2
Zone 3
Zone 4
Zone 1
1
35
30
Zone 2
Zone 3
Zone 4
0.8
Score SSIM
PSNR en dB
25
20
CBP
WF
MMSE
MBER
E-dmin
15
10
5
0
0
0.6
CBP
WF
MMSE
MBER
E-dmin
0.4
0.2
0
500
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
0
500
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
Figure 4.3. Résultats de simulation (PSNR et score SSIM) pour l’image « Caps » avec la
configuration de base
Zone 2
Zone 3
Zone 4
Zone 1
1
38
0.95
36
0.9
Score SSIM
PSNR en dB
Zone 1
40
34
32
30
28
Zone 3
Zone 4
0.85
0.8
0.75
0.7
CBP
CBP optimisé
26
24
Zone 2
0
500
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
CBP
CBP optimisé
0.65
0.6
0
500
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
Figure 4.4. Apport de la stratégie d’adaptation de lien (PSNR et score SSIM) pour l’image
« Caps »
Précodeurs
WF
MMSE
MBER
E-dmin
CBP
CBP optimisé
MAUVAISES CONDITIONS
Zone 1
PSNR
Ecart-type
moyen (dB)
24,52
11,58
6,55
3,60
30,40
30,94
9,08
8,18
2,70
3,85
2,27
1,07
CONDITIONS MOYENNES
Zone 2 et 4
PSNR
Ecart-type
moyen (dB)
31,80
31,25
23,64
26,80
32,69
33,56
0,88
1,79
8,37
10,79
1,11
1,23
BONNES CONDITIONS
Zone 3
PSNR
Ecart-type
moyen (dB)
33,48
33,53
33,12
34,95
33,65
37,99
Tableau 4.6. Performances moyennes pour l’image « Caps »
106
0,32
0,61
3,24
0,00
0,53
1,24
CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL
Zone 1
Zone 2
Zone 3
Zone 4
Zone 1
35
Zone 2
Zone 3
Zone 4
1
30
0.8
Score SSIM
PSNR en dB
25
20
15
CBP
WF
MMSE
MBER
E-dmin
10
5
0
0
0.6
0.4
CBP
WF
MMSE
MBER
E-dmin
0.2
0
500
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
0
500
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
Figure 4.5. Résultats de simulation (PSNR et score SSIM) pour l’image « Monarch » avec la
configuration de base
Zone 1
Zone 2
Zone 3
Zone 4
Zone 1
38
1
36
0.95
30
28
26
Zone 4
0.85
0.8
0.75
0.7
24
CBP
CBP optimisé
22
20
Zone 3
0.9
32
Score SSIM
PSNR en dB
34
Zone 2
0
500
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
CBP
CBP optimisé
0.65
0.6
0
500
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
Figure 4.6. Apport de la stratégie d’adaptation de lien (PSNR et score SSIM) pour l’image
« Monarch »
Précodeurs
WF
MMSE
MBER
E-dmin
CBP
CBP optimisé
MAUVAISES CONDITIONS
Zone 1
PSNR
Ecart-type
moyen (dB)
20,99
10,06
6,07
3,57
26,18
26,88
7,48
6,97
2,54
3,46
2,34
1,47
CONDITIONS MOYENNES
Zone 2 et 4
PSNR
Ecart-type
moyen (dB)
28,14
27,33
20,36
24,29
29,28
30,27
0,96
1,83
6,98
9,50
1,23
1,52
BONNES CONDITIONS
Zone 3
PSNR
Ecart-type
moyen (dB)
30,28
30,42
30,03
32,01
30,45
35,54
0,33
0,65
2,83
0,00
0,85
1,42
Tableau 4.7. Performances moyennes pour l’image « Monarch »
107
CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL
4.6.3 Gestion des ressources
L’optimisation conjointe de la stratégie d’adaptation de lien calcule le débit source le
plus adapté pour chaque image transmise. Ce débit peut donc changer au cours de la
simulation de transmission de sorte à s’adapter à l’état du canal. La figure 4.7 montre
comment le débit de la source varie en fonction de la position sur la trajectoire du récepteur.
On remarque en outre, que le débit s’adapte parfaitement aux variations du canal, en variant
d’environ 0,1bpp dans de mauvaises conditions (zone 1) à plus de 1bpp lorsque les conditions
deviennent bonnes (zone 3). A titre de comparaison, la configuration de base est définie pour
transmettre une image de 0,125bpp (la couche de base) à 0,5bpp (décodage de toutes les
couches). L’adaptation du débit, conjointement à la modulation adaptative, la stratégie UEP et
la stratégie UPA, est un facteur d’amélioration de la QoS, en comparaison des autres
stratégies de la littérature qui n’ajustent généralement que les paramètres liés à la
transmission.
Zone 1
Zone 2
Zone 3
Zone 4
1.2
Débit source en bpp
1
0.8
0.6
0.4
0.2
0
0
500
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
Figure 4.7. Variation du débit source des images JPWL fournie par l’optimisation conjointe
de la stratégie d’adaptation de lien
La figure 4.8 met en avant l’évolution dans la sélection des sous-canaux ainsi que les
ordres de modulation sur chacun d’eux. L’étude de cette figure montre que les sous-canaux et
les ordres de modulation sont utilisés de manière cohérente au regard des conditions variables
du canal de transmission, et dépendent ainsi de la position sur la trajectoire du récepteur.
108
CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL
Zone 1
Ordre de modulation
MAQ-64
Zone 2
Zone 3
Zone 4
Sous-canal 1
Sous-canal 2
Sous-canal 3
Sous-canal 4
MAQ-16
MAQ-4
0
500
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
Figure 4.8. Utilisation des ordres de modulation et des sous-canaux en fonction de la position
sur la trajectoire du récepteur
Lorsque les conditions sont mauvaises (zone 1), la solution utilise seulement un ou
deux sous-canaux couplés avec la plus robuste des modulations (MAQ-4). Lorsque les
conditions deviennent moyennes (zones 2 et 4), la stratégie utilise trois sous-canaux avec une
modulation MAQ-4 ou MAQ-16 sur les deux premiers sous-canaux SISO et une modulation
MAQ-4 sur le troisième. Si l’on fait le parallèle avec la figure 4.5, nous constatons que
l’augmentation de l’efficacité spectrale sur les sous-canaux 1 et 2 est le facteur majeur de
l’augmentation du débit source. Lorsque les conditions de transmission sont bonnes (zone 3),
la stratégie utilise trois ou quatre sous-canaux. L’amélioration des conditions permet
d’exploiter pleinement le canal en utilisant la modulation présentant la plus grande efficacité
spectrale (MAQ-64) sur le premier sous-canal. Le second et le troisième sous-canal utilisent
majoritairement soit la MAQ-64 soit la MAQ-16. Enfin le quatrième sous-canal utilise les
modulations MAQ-16 ou MAQ-4. Ce sont ces hautes efficacités spectrales qui sont à l’origine
de l’augmentation significative du débit source que l’on peut constater sur la figure 4.5. Cette
augmentation est alors synonyme d’une augmentation de la qualité de l’image que l’on peut
aussi constater sur les figures 4.4 et 4.6. Ainsi, nous pouvons noter que le schéma met en
œuvre une adaptation rapide et cohérente dans l’utilisation des sous-canaux et des ordres de
modulation face aux variations du canal de transmission.
4.6.4 Complexité de la solution
La figure 4.9 présente l’évolution du nombre de configurations évaluées dans l’arbre
pour chaque image transmise. On rappelle que compte tenu des paramètres de modulation, de
codage canal et du système MIMO considéré, l’arbre peut comporter au maximum 50625
configurations possibles. Toutefois, de par les contraintes définies pour l’optimisation, on
rappelle qu’un grand nombre de configurations ne sont pas possibles et ne sont donc pas
évaluées, diminuant ainsi la complexité de la solution.
109
CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL
Nombre de configurations possibles
Zone 1
Zone 2
Zone 3
Zone 4
3500
3000
2500
2000
1500
1000
500
0
0
500
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
Figure 4.9. Evolution du nombre de configurations évaluées dans l’arbre
Ainsi, nous pouvons noter que le nombre de configurations possibles augmente avec
l’amélioration des conditions sur le canal. Cette constatation est logique car plus les
conditions de transmission sont bonnes, plus nombreuses sont les solutions potentielles. On
remarque malgré tout que l’on est relativement éloigné des 50625 configurations maximales
et cela même lorsque les conditions de transmission sont bonnes. Ceci est dû à la difficulté de
satisfaire toutes les contraintes, en particulier la contrainte sur la puissance qui limite le
nombre de sous-canaux pouvant être utilisé. Le tableau 4.8 résume le nombre moyen de
configurations évaluées en fonction des conditions de transmission :
Nombre moyen de
configurations possibles
MAUVAISES
CONDITIONS
CONDITIONS
MOYENNES
BONNES
CONDITIONS
Zone 1
Zone 2 et 4
Zone 3
21
288
2939
Tableau 4.8. Nombre moyen de configurations évaluées par l’arbre en fonction des
conditions de transmission
Malgré le grand nombre de configurations possibles, il y en a relativement peu qui
satisfassent les contraintes du système. Il est d’ailleurs important de rappeler que cette
stratégie est essentiellement conçue pour la transmission d’image dans des conditions de
transmission difficiles. Il est ainsi intéressant de constater que plus les conditions de
transmission sont mauvaises et moins la solution est complexe, du fait des contraintes plus
difficiles à satisfaire. Il est également important de noter qu’aucune méthode n’a été mise en
œuvre afin de diminuer la complexité de l’arbre. On peut toutefois facilement envisager des
hypothèses lors de la construction de l’arbre allant dans ce sens. A titre d’exemple, il n’est pas
nécessaire de construire la branche de l’arbre utilisant une MAQ-4 sur le premier sous-canal
lorsque le canal est bon.
110
CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL
4.6.5 Analyse visuelle
Les figures 4.10 et 4.11 présentent un comparatif entre des images reçues par
l’intermédiaire du précodeur CBP seul, par rapport au précodeur CBP inclut dans le cadre de
la stratégie d’adaptation de lien. Ces exemples sont représentatifs pour les différentes
configurations de transmission.
Dans de mauvaises conditions de transmission (fig. 4.10 (a) et (b) ; fig. 4.11 (a) et (b)),
le précodeur CBP permet la transmission d’une ou deux couches de qualité. Il arrive
fréquemment que les images ne souffrent d’aucune distorsion comme c’est le cas pour la
figure 4.11 (a). Il peut également arriver que l’on obtienne une image composée de deux
couches de qualité avec des distorsions (apportées par le canal) sur la seconde couche. Par
exemple, on peut distinguer l’apparition de fausses couleurs sur la figure 4.10 (a). La stratégie
d’adaptation de lien fournit généralement des images de qualité légèrement supérieure
présentant rarement des distorsions (fig. 4.10 (b) et fig. 4.11 (b)). Ceci est dû à la possibilité
de l’algorithme adaptatif de sélectionner des codes RS présentant une capacité de correction
plus élevée et donc mieux adaptée aux conditions de transmission difficiles rencontrées sur la
zone 1. L’augmentation de la capacité de correction des codes RS est prise en compte lors de
l’allocation de la puissance par le précodeur CBP qui peut alors assurer l’exploitation d’un à
deux sous-canaux SISO. La qualité des images transmises est donc équivalente mais les codes
RS limitent significativement les distorsions en réception ce qui permet à la stratégie
d’adaptation de lien d’afficher de meilleures performances moyennes en termes de PSNR et
SSIM.
Dans des conditions de transmission moyennes (fig. 4.10 (c) et (d) ; fig. 4.11 (c) et
(d)), on retrouve globalement le même schéma avec cette fois une qualité d’image oscillant
entre deux et trois couches de qualité. Le précodeur CBP fournit trois types de résultats à
savoir : 2 couches décodées sans erreurs (fig. 4.11 (c)), 3 couches décodées avec des
distorsions portées par la troisième couche (fig. 4.10 (c)) ou 3 couches décodées sans erreur.
Enfin, dans de bonnes conditions de transmission (fig. 4.10 (e) et (f) ; fig. 4.11 (e) et
(f)) nous pouvons constater le gain en qualité obtenu par la solution adaptative en
comparaison du précodeur CBP seul. En effet, les exemples présentés montrent des gains en
PSNR de 4,75dB pour « Caps » et de 5,17dB pour « Monarch » résultant de l’augmentation
du débit source par l’exploitation de modulations à plus haute efficacité spectrale (voir fig.
4.8).
111
CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL
Précodeur CBP, zone 1
Précodeur CBP avec adaptation de lien, zone 1
(a) Caps399 : PSNR = 29,57dB ; SSIM = 0,804
(b) Caps399 : PSNR = 31,91dB ; SSIM = 0,863
Précodeur CBP, zone 2
Précodeur CBP avec adaptation de lien, zone 2
(c) Caps978 : PSNR = 31,82dB ; SSIM = 0,852
(d) Caps978 : PSNR = 34,77dB ; SSIM = 0,914
Précodeur CBP, zone 3
Précodeur CBP avec adaptation de lien, zone 3
(e) Caps1711 : PSNR = 34,95dB ; SSIM = 0,916
(f) Caps1711 : PSNR = 39,70dB ; SSIM = 0,959
Figure 4.10. Comparaison visuelle entre les résultats fournis par le précodeur CBP et par la stratégie
d’adaptation de lien pour l’image « Caps » et pour différentes conditions de transmission
112
CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL
Précodeur CBP, zone 1
Précodeur CBP avec adaptation de lien, zone 1
(a) Monarch151 : PSNR = 24,91dB ; SSIM = 0,805
(b) Monarch151 : PSNR = 28,04dB ; SSIM = 0,868
Précodeur CBP, zone 2
Précodeur CBP avec adaptation de lien, zone 2
(c) Monarch571 : PSNR = 28,13dB ; SSIM = 0,867
(d) Monarch571 : PSNR = 31,94dB ; SSIM = 0,917
Précodeur CBP, zone 3
Précodeur CBP avec adaptation de lien, zone 3
(e) Monarch1843 : PSNR = 32,01dB ; SSIM = 0,918
(f) Monarch1843 : PSNR = 37,18dB ; SSIM = 0,952
Figure 4.11. Comparaison visuelle entre les résultats fournis par le précodeur CBP et par la stratégie
d’adaptation de lien pour l’image « Monarch » et pour différentes conditions de transmission
113
CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL
Avant de clore cette analyse des résultats, nous présentons des cas de figure
particuliers dans lesquels l’image fournie par le décodeur robuste JPWL est porteuse de
distorsions dues au canal de transmission (fig. 4.12 (a) et (c)).
Images fournies par le décodeur robuste JPWL
Images fournies par le décodeur robuste JPWL
si l’on s’abstient de décoder la dernière couche
(a) Caps236 : 2 couches de qualité décodées
PSNR = 26,25dB ; SSIM = 0,603
(b) Caps236 : 1 couche de qualité décodée
PSNR = 29,60dB ; SSIM = 0,810
(c) Monarch2254 : 3 couches de qualité décodées
PSNR = 23,41dB ; SSIM = 0,759
(d) Monarch2254 : 2 couches de qualité décodées
PSNR = 28,00dB ; SSIM = 0,868
Figure 4.12. Présence de distorsions au décodage
En l’absence d’instructions données au décodeur robuste JPWL, le décodage
s’effectue sur la totalité des données reçues. Il peut alors arriver que la dernière couche de
qualité soit victime d’erreurs de transmission qui se traduisent en distorsion plus ou moins
marquées (fig. 4.12 (a) et (b)). Ces distorsions s’expliquent par le fonctionnement du
précodeur CBP. On rappelle que dans le cadre du précodeur CBP, la répartition de la
puissance est réalisée sous contrainte de TEB cible. Il peut arriver néanmoins qu’après
allocation de la puissance sur les premiers sous-canaux, le dernier sous-canal utilisé ne
dispose plus assez de puissance pour atteindre le TEB cible. Il en résulte ainsi une sensibilité
accrue aux erreurs de transmission qui, dans certains cas de figure, n’empêche pas le
décodage de la dernière couche de qualité, mais se traduit en distorsion. On remarquera
néanmoins que les autres couches de qualité, disposant de suffisamment de puissance, ne
souffre pas d’erreur de transmission non corrigée. Ainsi, en s’abstenant de décoder la dernière
couche de qualité, nous pouvons fournir une meilleure qualité visuelle (fig. 4.12 (b) et (d)).
114
CHAPITRE 4. STRATEGIE D’ADAPTATION DE LIEN POUR LA TRANSMISSION D’UN CONTENU JPWL
A partir de cette constatation, nous pouvons envisager deux cas de figure :
•
Les distorsions présentées ne sont visuellement pas dérangeantes. Cependant,
seule une analyse subjective peut nous apporter cette conclusion ;
•
Si cela est nécessaire, on s’abstient de décoder la dernière couche de qualité qui
est généralement la seule qui porte des distorsions. Cette stratégie – qui pourrait
également s’appliquer aux autres précodeurs – nécessite néanmoins un organe de
décision au niveau du décodage.
Ainsi ces constatations nous laissent envisager une stratégie de décodage basée sur
l’analyse du contenu en réception. Cette étude fera l’objet du prochain chapitre.
4.7 Synthèse et conclusion
Ce quatrième chapitre a permis de présenter une stratégie d’adaptation de lien
s’appuyant sur la stratégie de transmission d’image sur un canal MIMO décomposé en souscanaux SISO, et sur le précodeur CBP présenté dans le chapitre 3. L’objectif de cette stratégie
était d’intégrer la possibilité de mettre en œuvre conjointement de l’UEP, de l’UPA, de la
modulation adaptative et du codage de source adaptatif pour maximiser la qualité visuelle des
images reçues. Après avoir formulé le problème de minimisation de la distorsion et les
contraintes liées à la stratégie, nous avons proposé un algorithme permettant d’évaluer toutes
les possibilités de codage à travers une représentation en arbre. Le cœur de cet algorithme
s’appuie sur le précodeur CBP, qui permet de s’assurer qu’une configuration de
codage/transmission est envisageable ou non. Il permet en outre d’allouer la puissance en
relation avec la valeur des autres paramètres du système (RSB des sous-canaux, modulation,
codage canal, TEB cible) ce qui assure un caractère totalement conjoint à la stratégie. Après
avoir construit l’arbre, le chemin maximisant le débit de la source représente la configuration
optimale pour la transmission.
Les tests de simulation de la stratégie d’adaptation de lien sur canal réaliste ont
clairement mis en évidence l’intérêt d’intégrer une notion d’adaptabilité dans le schéma de
transmission. On retiendra en outre, que cette stratégie permet de limiter l’instabilité dans les
résultats lorsque les conditions sont mauvaises et améliore significativement la qualité des
images reçues dans de bonnes conditions. De plus, nous avons montré que la complexité de
cette solution diminue à mesure que les conditions deviennent difficiles, ce qui est un
avantage étant donné que cette solution est essentiellement conçue pour les conditions de
transmission les plus difficiles (faibles RSB, multi-trajets et mobilité).
Enfin cette étude ouvre la porte à une stratégie de décodage basée sur le contenu en
réception. En effet, nous avons montré que certaines images reçues sont porteuses de
distorsions du fait de la gestion de la puissance sur le dernier sous-canal utilisé. Nous
proposons donc une stratégie de décodage basée sur l’analyse du contenu en réception dans le
chapitre 5.
115
CHAPITRE 5
ANALYSE DU CONTENU DANS L’APPRECIATION
DE LA QUALITE DE L’EXPERIENCE
Sommaire
5.1
Introduction
118
5.2
Problématique
119
5.3
Les métriques de qualité
122
5.4
Solution proposée
5.4.1
La métrique à référence réduite QIP
5.4.2
Intégration de QIP dans la stratégie de transmission
5.4.3
Remarques sur l’utilisation de QIP dans la stratégie de
transmission
125
5.5
Résultats de simulation sur canal réaliste
5.5.1
Analyse objective
5.5.2
Analyse visuelle
126
126
130
5.6
Validation subjective
5.6.1
Motivations
5.6.2
Protocole de test
135
135
135
5.6.2.1
5.6.2.2
5.6.2.3
5.6.3
5.7
Base d’images
Panel d’observateurs
Présentation des images
Analyse des résultats
Synthèse et conclusion
123
123
124
135
136
136
137
140
117
CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE
5.1 Introduction
Au cours des dernières années, les recherches dans le domaine des communications
numériques ont fait place au concept de qualité d’expérience (QoE). L’idée consiste à prendre
en compte l’expérience de l’utilisateur final dans l’appréciation des performances d’un
algorithme ou d’un système donné. Les recherches ayant pour objectif d’intégrer la QoE
connaissent actuellement un essor important compte tenu des applications industrielles.
Effectivement, l’intégration de la QoE dans les systèmes pourrait par exemple permettre de
solutionner des problèmes liés à la congestion des réseaux, en allouant plus finement les
ressources suivant l’utilisation qui en est faite. Par exemple, les auteurs de [128] s’intéressent
à la QoE dans le cadre de la diffusion en temps réel de vidéoconférences dans un réseau
filaire. Pour mesurer la QoE, les auteurs s’appuient sur une métrique objective (bVQM70).
Cette métrique compare la vidéo originale et la vidéo reçue afin de fournir un score de
fidélité. Toutefois, cette métrique nécessite un paramétrage. Comme aucune norme ne définit
de paramétrage lié au Système Visuel Humain (SVH) afin de fournir des résultats liés à la
perception humaine, les auteurs ont réalisé une campagne de tests subjectifs afin de calibrer la
métrique bVQM pour qu’elle soit la plus proche du jugement des observateurs. A partir de la
métrique calibrée, les auteurs testent l’impact de différents paramètres sur la QoE. Les
conclusions de cette étude recommandent de contrôler le trafic via des algorithmes qui
utilisent au mieux les ressources afin d’assurer une qualité stable. Les auteurs recommandent
également de recoder les flux en temps réel (codage source adaptatif) afin de s’adapter aux
variations sur le réseau. On notera que ces recommandations trouvent un écho dans notre
stratégie. A l’heure actuelle les systèmes sont néanmoins majoritairement caractérisés par la
qualité de services (QoS) qui est une indication plutôt liée à des critères objectifs qu’à
l’expérience de l’utilisateur. Naturellement, le concept de QoE est étroitement associé au
jugement subjectif humain. Toutefois, comme le font remarquer les auteurs de [129], le
recours au jugement humain est plutôt mal considéré dans la littérature. L’hypothèse
dominante étant que si on optimise la QoS, alors la QoE de l’utilisateur va nécessairement
augmenter, ce qui d’après ces mêmes auteurs est faux, car même avec une excellente QoS, on
peut obtenir une mauvaise QoE. Nous avons en outre proposé des résultats allant dans ce sens
dans le chapitre 2, où le TEB n’était pas révélateur de la qualité des images en termes de
PSNR et de score SSIM.
Dans les chapitres précédents, nous avons présenté une méthode optimale afin
d’ajuster conjointement les ressources liées aux stratégies UPA, UEP, modulation adaptative
et codage source adaptatif, en fonction de l’état du canal de transmission. Dans ces travaux, la
QoS est vue comme la capacité à minimiser la distorsion de la source au sens de l’erreur
quadratique moyenne. Ainsi, les ressources de la chaîne sont ajustées de manière optimale en
ce sens. Nous avons ainsi montré que notre stratégie d’adaptation de lien est en mesure de
fournir une bonne QoS. Néanmoins, il serait intéressant d’enrichir cette dernière afin qu’elle
recouvre la notion de QoE. Effectivement, bien que les critères objectifs employés (PSNR et
score SSIM) indiquent que la QoS est atteinte, on a pu voir à la fin du chapitre 4 que des cas
de figures pouvaient être relativement médiocres du point de vue de la QoE. La QoE peut être
corrélée à la QoS lorsqu’il n’y a pas d’erreur en réception. A ce moment là, la stratégie fournit
la meilleure qualité possible compte tenu des conditions sur le canal de transmission. Par
contre, en cas d’erreurs de transmission (fréquentes compte tenu du contexte de transmission
difficile), il devient difficile d’évaluer la QoE du fait que l’on ne sait ni quelle zone du flux de
l’image codée va être touchée, ni l’importance de la dégradation (acceptable ou aberrante).
C’est pour cela que la stratégie d’adaptation de lien est optimale au sens de la QoS mais pas
70
batch Video Quality Metric
118
CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE
de la QoE car il faudrait alors, que la stratégie prenne en compte l’expérience de l’utilisateur
afin de fournir une image de qualité satisfaisante au sens du jugement humain. C’est ce que
l’on se propose de faire dans ce dernier chapitre qui constitue une ouverture vers le concept de
QoE.
Dans un premier temps, nous développerons la problématique liée à la QoE ainsi que les
différentes familles de métrique objectives permettant de déterminer la qualité des images.
Nous proposerons ensuite une solution basée sur l’utilisation d’une métrique à référence
réduite intégrant des contraintes psychovisuelles. Puis nous analyserons les résultats de
simulation sur canal réaliste de manière objective (PSNR et score SSIM) puis subjective
(analyse visuelle). Finalement, nous présenterons la campagne de tests subjectifs réalisée afin
de valider l’utilisation de la stratégie proposée pour maximiser la QoE de l’utilisateur.
5.2 Problématique
Lors de la transmission d’une image codée en couches de qualité hiérarchisées, nous
avons la possibilité de ne décoder qu’une version partielle de l’image. Si on prend l’exemple
d’une image codée en quatre couches de qualité, nous pouvons donc obtenir jusqu’à quatre
images présentant chacune une qualité différente. En l’absence de stratégie de décodage au
niveau du récepteur, le décodeur robuste JPWL décode les données en totalité, ou jusqu’à
rencontrer une erreur qui avorte le processus de décodage. Il arrive alors que le décodeur
fournisse un résultat présentant des distorsions, qui sont généralement causées par un manque
de puissance sur le dernier sous-canal utilisé. La figure 5.1 illustre un cas de figure tiré des
simulations du chapitre 4 (CBP optimisé fig. 4.4) où le décodeur fournit un résultat sousoptimal autant objectivement (PSNR et score SSIM) que subjectivement.
(a) Couche 1 : PSNR = 33,73dB ; SSIM = 0,899
(c) Couche 1+2+3 : PSNR = 39,08dB ; SSIM = 0,955
Résultat présentant la meilleure qualité
objective et subjective
(b) Couche 1+2 : PSNR = 37,43dB ; SSIM = 0,941
(d) Couche 1+2+3+4 : PSNR = 28,53dB ; SSIM = 0,923
Résultat fourni par le décodeur JPWL robuste avec
les 4 couches décodées
Figure 5.1. Décodage sous-optimal de l’image « Caps1615 »
119
CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE
Nous pouvons donc distinguer plusieurs configurations de décodage en réception,
fournissant chacune un PSNR ou un score SSIM que l’on peut confronter. On peut mettre en
évidence un nombre de cas non négligeable dans lesquels le PSNR ou le score SSIM de
l’image reçue (noté PSNRreçu ou SSIMreçu) est inférieur au PSNR ou au score SSIM maximal
atteignable correspondant au meilleur score parmi toutes les configurations de décodage
possible en réception (noté PSNRmax ou SSIMmax). Les figures 5.2 et 5.3 montrent les cas de
figure obtenus lors des simulations sur canal réaliste du chapitre 4, où le score reçu est
différent du score maximal atteignable.
Zone 1
40
Zone 2
Zone 3
Zone 4
PSNR en dB
35
30
PSNRmax
PSNRreçu
25
0
500
1000
1500
Position sur la trajectoire du récepteur (×λ)
2000
Figure 5.2. Cas de décodage sous-optimal en termes de PSNR pour l’image « Caps »
Zone 1
Zone 2
Zone 3
Zone 4
1
0.95
0.9
Score SSIM
0.85
0.8
0.75
0.7
0.65
SSIMmax
SSIMreçu
0.6
0.55
0.5
0
500
1000
1500
Position sur la trajectoire du récepteur (×λ)
2000
Figure 5.3. Cas de décodage sous-optimal en termes de score SSIM pour l’image « Caps »
120
CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE
Le tableau 5.1 résume la fréquence d’apparition de ces cas de figure, et la perte
moyenne (l’écart) entre le score maximal et le score reçu lorsque ces cas se présentent.
Fréquence d’apparition des cas où
PSNRreçu < PSNRmax
Perte moyenne
Fréquence d’apparition des cas où
SSIMreçu < SSIMmax
Perte moyenne
MAUVAISES
CONDITIONS
BONNES
CONDITIONS
MOYENNES
CONDITIONS
Zone 1
Zones 2 et 4
Zone 3
1,22 %
11,33 %
16,15 %
1,30dB
0,73dB
0,47dB
1,68%
16,29%
24,35%
0,064
0,028
0,014
Tableau 5.1. Analyse des cas de décodage sous-optimal pour les images « Caps » et
« Monarch »
En étudiant les figures 5.2, 5.3 ainsi que le tableau 5.1, on constate qu’il y a très peu de
cas de figure problématiques lorsque les conditions de transmission sont mauvaises (1,22%
pour le PSNR et 1,68% pour SSIM). Cela s’explique par le fait que lorsque les conditions sont
mauvaises, on n’utilise généralement que les premiers sous-canaux (le premier et le second,
voir fig. 4.8). Or, le fait d’utiliser peu de sous-canaux implique d’être plus robuste aux
évanouissements fréquentiels qui touchent en premier lieu les sous-canaux d’indice important
(sous-canal trois et quatre). De ce fait, il y a très peu de cas de figure où la puissance allouée
n’est pas suffisante pour décoder correctement la dernière couche transmise. Néanmoins,
lorsqu’un cas de figure apparaît, la perte moyenne sur la qualité est relativement importante
(1,30dB en termes de PSNR et 0,064 sur le score SSIM) car elle touche la première couche
d’amélioration qui contient des détails visuellement significatifs. A mesure que les conditions
s’améliorent sur le canal de transmission, notre stratégie utilise le troisième sous-canal (zones
2 et 4) puis le quatrième sous-canal (zone 3). Toutefois, l’augmentation du nombre de souscanaux utilisés est synonyme d’une plus grande sensibilité aux évanouissements fréquentiels.
De ce fait, nous constatons une augmentation des cas de figure où le score reçu est inférieur
au score maximal atteignable (de 11,33% à 16,15% en PSNR et de 16,29% à 24,35% pour
SSIM). Toutefois, malgré l’augmentation du nombre de cas de décodage sous-optimal, nous
remarquons que l’impact sur la qualité diminue (de 0,73dB à 0,47dB en PSNR et de 0,028 à
0,014 pour SSIM). Cela s’explique par le fait que le saut en qualité entre les couches décroît à
mesure que l’on décode des couches d’indice élevé. Enfin, nous remarquons qu’il existe une
différence entre les fréquences d’apparition des cas de décodage sous-optimal suivant la
métrique considérée. Effectivement, la métrique SSIM présente un plus grand nombre de cas
que la métrique PSNR. Cela provient du fait qu’il arrive fréquemment que malgré la présence
de distorsions portées par la dernière couche, le PSNR reçu correspond tout de même au
meilleur PSNR parmi toutes les configurations de décodage possibles. La métrique SSIM est
beaucoup plus sévère car lorsqu’elle détecte une distorsion, elle pénalise suffisamment le
score de l’image reçue de sorte qu’il ne représente plus le score SSIM maximal. Cette analyse
met donc en avant une divergence dans l’appréciation des distorsions entre les deux métriques
objectives utilisées.
Pour résumer, lorsque les conditions de transmission sont mauvaises les cas de
décodage sous-optimal sont rares mais présentent un impact important. A mesure que les
121
CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE
conditions sur le canal de transmission s’améliorent, les cas de décodage sous-optimal se
multiplient mais leur impact sur la qualité diminue. Cette analyse de cas met ainsi en avant le
fait qu’il peut être plus judicieux du point de vue de la QoE, de s’abstenir de décoder la
dernière couche de qualité dans certains cas de figure. Il est toutefois nécessaire d’intégrer un
organe de décision qui doit être à même de capter l’expérience de l’utilisateur afin d’assister
le décodeur vers la meilleure configuration de décodage. Cet organe de décision doit reposer
sur une métrique de qualité appropriée.
5.3 Les métriques de qualité
On dispose de deux méthodes afin d’évaluer la qualité des images numériques. La
première consiste à effectuer des tests subjectifs dans lesquels un panel d’observateurs donne
leur avis sur la qualité des images ou des vidéos présentées, comme c’est le cas dans [130]
pour des vidéos H.264. Bien qu’il s’agisse de la méthode la plus fiable au sens du système
visuel humain afin d’évaluer la qualité d’une image, elle est néanmoins délicate à mettre en
place, coûteuse en temps et en argent. La seconde méthode permettant d’évaluer la qualité des
images consiste à utiliser des mesures objectives. Il existe une grande variété de métriques
objectives de qualité. Leur nombre ne cesse d’ailleurs d’augmenter compte tenu de
l’effervescence actuelle dans le domaine de l’évaluation de la qualité [131] et de la prise en
compte du SVH [132-134] dans cette tâche. Les métriques de qualité peuvent être classées en
trois catégories basées sur la référence utilisée pour évaluer la qualité de l’image [123].
Les métriques à référence complète
Les métriques à référence complète nécessitent d’avoir accès à l’image originale afin
d’évaluer la qualité de l’image test. Ce type de métrique est très utilisé dans le contexte des
transmissions d’image afin d’évaluer la robustesse des algorithmes ou des stratégies mises en
œuvre. Le PSNR et le score SSIM sont des exemples connus et très utilisés. Toutefois, ce type
de métrique ne peut pas être utilisé comme organe de décision dans le cadre de la stratégie
envisagée car nous n’avons pas accès à l’image originale au niveau du récepteur.
Les métriques sans référence
A l’inverse des métriques à référence complète, les métriques sans référence ne
nécessitent strictement aucune information issue de l’image originale afin d’évaluer la qualité
de l’image test. Bien que cette tâche soit facile pour l’homme, c’est une tâche très complexe
pour les machines. Ainsi, l’absence de référence permet d’utiliser ce type de métrique dans le
cadre d’une stratégie de transmission. Cependant, la complexité de l’évaluation de la qualité
en réception peut être une barrière à son intégration dans une application pratique. Pour plus
d’information sur les principales métriques sans référence, nous renvoyons le lecteur vers
[135].
Les métriques à référence réduite
Les métriques à référence réduite exploitent une information tirée de l’image originale.
Cette information - appelée référence réduite - est alors utilisée après une opération
quelconque (compression, transmission, tatouage, etc.) afin d’évaluer la qualité de l’image.
Ce type de métrique est particulièrement intéressant dans le cadre d’une stratégie de
transmission car il est tout à fait envisageable de transmettre la référence réduite avec l’image
pour une évaluation en réception. La taille de la référence réduite ne doit toutefois pas être
prohibitive au regard des ressources utilisée pour la transmission, et doit également être
protégée pour une évaluation fiable de la qualité au niveau du récepteur. Le lecteur trouvera
une description des principales métriques à référence réduite dans [135].
122
CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE
5.4 Solution proposée
Dans le cadre du projet CAIMAN, une métrique à référence réduite, appelée QIP71, a
été crée au département SIC de l’institut XLIM. Nous avons utilisé cette métrique afin de
traiter la problématique liée à la QoE. Ce choix se justifie tout d’abord par la taille de la
référence réduite qui, comme nous allons le voir, est négligeable et donc parfaitement adaptée
dans un contexte de transmission. De plus, cette métrique s’appuie sur des contraintes
psychovisuelles afin d’évaluer la qualité des images. Enfin, de par son fonctionnement basé
sur les variations du nombre de points de saillance visuelle dans l’image (point attirant l’œil,
également appelé point d’intérêt), elle est parfaitement adaptée aux distorsions
caractéristiques de JPEG 2000 et JPWL. Nous préciserons ce propos après avoir présenté la
métrique QIP.
5.4.1 La métrique à référence réduite QIP
La métrique QIP a été récemment introduite dans [136]. Son fonctionnement repose sur
l’analyse des points d’intérêt afin de prédire une variation entre l’image originale et l’image
test. Les points d’intérêt sont liés aux points de saillance visuelle, c’est-à-dire les points qui
attirent naturellement l’œil humain. La figure 5.4 présente le fonctionnement sur lequel repose
la métrique QIP.
Côté Côté
émetteur récepteur
Image
originale
Image test
Construction
du masque
Information réduite :
Série de bits
Reconstruction
du masque
Détection des
points d’intérêt
(Harris)
Détection des
points d’intérêt
(Harris)
Masque d’activité
Masque d’activité
Masque d’activité
Nombre de points d’intérêt par
région de haute activité (NHA)
Nombre de points d’intérêt par
région de haute activité (NHA)
Nombre de points d’intérêt par
région de faible activité (NFA)
Nombre de points d’intérêt par
région de faible activité (NFA)
Prédiction
de la qualité
Qualité
perçue
Figure 5.4. Organigramme de la métrique à référence réduite QIP
La métrique décompose l’image originale en 12×12 partitions égales (bon compromis
entre précision du découpage et le nombre de régions pour des images de 768×512 pixels
[136]) sur lesquelles un détecteur de points d’intérêt de Harris [136] est appliqué. Ce
détecteur fournit ainsi le nombre de point d’intérêt dans chaque région. Chacune de ces
régions est alors classée en termes de saillance visuelle (HA : Haute Activité ou FA : Faible
71
Quality by Interest Points
123
CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE
Activité). Une région de haute activité est typiquement une zone de détails alors qu’une
région de faible activité représente une zone de l’image relativement homogène. Cette
distinction en région d’activité se base sur le fait que, d’un point de vue psychovisuel, une
erreur dans une zone de haute activité est susceptible d’être moins perceptible qu’une erreur
dans une zone de faible activité. On détermine ensuite le nombre total de points d’intérêt dans
les régions de faible activité (NFA) ainsi que le nombre total de points d’intérêt dans les
régions de haute activité (NHA).
La référence réduite est alors constituée des deux entiers NHA et NFA codés sur 2 octets
chacun, et du masque d’activité codé sur 18 octets (12×12 bits) qui cartographie les régions de
haute et faible activité. Au total, la référence réduite ne fait que 22 octets, ce qui est
négligeable au regard de la taille des images transmises (environ 0,09% des images 768×512
pixels, compressées suivant la configuration de base définie dans le §4.6.1.1).
En réception, la référence réduite est exploitée afin d’appliquer le masque d’activité
sur l’image reçue. Le détecteur de Harris est appliqué afin de déterminer le nombre de points
d’intérêt dans les régions de haute et faible activité. Ces nouvelles valeurs sont comparées aux
valeurs contenues dans la référence réduite. Une étape de prédiction de la qualité, qui permet
en outre de pondérer l’impact des variations des points d’intérêt suivant la nature des régions
d’activité, permet alors d’assigner un score entre 0 (très mauvaise qualité) et 1 (excellente
qualité).
5.4.2 Intégration de QIP dans la stratégie de transmission
Au cours d’une transmission sur le canal sans fil, le nombre de points d’intérêt dans une
zone touchée par des erreurs de transmission va varier, affectant le score issu de la métrique
QIP. Nous pouvons ainsi attribuer un score grâce à la métrique QIP correspondant à chaque
configuration de décodage et fournir au récepteur la configuration qui maximise le score QIP.
QIP agit ainsi en tant qu’organe de décision pour assister le décodeur JPWL vers la
configuration de décodage qui maximise la QoE. La figure 5.5 illustre la procédure pour un
cas de figure présentant trois couches de qualité.
Codage JPWL issu
de l’optimisation
Transmission à travers
le canal MIMO
Canal sans fil
+ référence
réduite QIP
Décodage JPWL robuste de
toutes les configurations
Evaluation
QIP
Couche
1
0,88
Couche
1+2
0,92
Résultat fourni à
l’utilisateur
PSNR = 34,85dB
SSIM = 0,943
Couche
1+2+3
0,23
Figure 5.5. Stratégie de transmission intégrant QIP pour un cas de figure « extrême » à trois
couches de qualité
124
CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE
Après acquisition de la CSI, notre stratégie détermine la meilleure configuration de
codage/transmission. Lors du codage de l’image via le codeur JPWL, nous générons la
référence réduite QIP qui sera par la suite transmise avec la couche de base sur le premier
sous-canal. Après transmission sur le canal, QIP est utilisée comme un sélectionneur de
couche de qualité capable de détecter une réduction de la qualité perçue pendant le décodage
d’une nouvelle couche de qualité JPWL. Nous décodons toutes les configurations possibles
avec le décodeur robuste JPWL. Chaque configuration est évaluée par QIP qui assigne un
score entre 0 (très mauvaise qualité) et 1 (excellente qualité). Nous retenons évidemment la
configuration présentant le meilleur score QIP.
5.4.3 Remarques sur l’utilisation de QIP dans le cadre de la stratégie de
transmission
Comme nous l’avons montré, la métrique QIP repose sur l’analyse des variations des
points de saillance visuelle dans l’image. Ce fonctionnement est particulièrement adapté afin
de capter les distorsions typiques de JPWL. Comme nous pouvons le voir sur les figures 5.6
(a), (b), (c) et (d), les distorsions de JPWL ont tendance à augmenter significativement le
nombre de points d’intérêt dans les zones touchées. Il est donc tout à fait cohérent d’utiliser
une métrique qui exploite la variation des points d’intérêt pour prédire la qualité des images.
(a) PSNR = 28,82dB ; SSIM = 0,803
(c) PSNR = 26,22dB ; SSIM = 0,785
(b) PSNR = 30,45dB ; SSIM = 0,779
(d) PSNR = 23,44dB ; SSIM = 0,732
Figure 5.6. Distorsions typiques de JPWL
125
CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE
QIP est conçu à l’origine pour évaluer les variations entre une image originale et une
image test ayant subi une opération dégradant plus ou moins la qualité (compression,
transmission, tatouage, etc.). Dans le cadre de notre stratégie de transmission, la métrique ne
doit pas nécessairement être générée par rapport à l’image originale. En effet, elle peut être
générée par rapport à l’image présentant la meilleure qualité après compression (composée de
toutes les couches de qualité sans erreur). Dans un contexte de transmission, ce choix est plus
logique étant donné que l’évaluation en réception a pour but de choisir entre différentes
configurations de décodage dont la qualité maximale ne peut être supérieure à l’image
compressée composée de toutes les couches de qualité sans erreur de transmission. De ce fait,
l’image composée de toutes les couches de qualité sans erreur se voit attribuer un score de 1.
Indépendamment de l’aspect lié à la qualité, nous disposons alors d’un outil indiquant si
l’image a subi des erreurs de transmission, dans le cas où le score de l’image reconstituée est
différent de 1. De la même manière, le décodage peut être simplifié car il n’est pas nécessaire
de décoder toutes les configurations possibles si le score QIP est égal à 1 en réception.
Néanmoins, ce choix implique que l’on ne peut pas comparer les images reçues pour
différentes transmissions sur la base du score QIP car l’image référence est spécifique à
chaque cas. Nous continuerons donc de comparer les images reçues sur la base du PSNR et du
score SSIM afin de mesurer l’impact de la métrique QIP.
5.5 Résultats de simulation sur canal réaliste
Dans cette section, nous présentons des résultats de simulation sur le canal réaliste.
Nous intégrons la stratégie de décodage basée sur la métrique à référence réduite dans la
stratégie d’adaptation de lien présenté dans le chapitre 4. Nous utilisons les mêmes paramètres
que dans les simulations du paragraphe 4.6 afin de montrer l’impact de la stratégie de
décodage sur les résultats présentés précédemment. La référence réduite est protégée et
transmise avec la couche de qualité de base sur le premier sous-canal SISO.
5.5.1 Analyse objective
Les figures 5.7 et 5.8 montrent les performances de la stratégie d’adaptation de lien
avec ou sans stratégie de décodage pour les images « Caps » et « Monarch ». Ces figures ne
représentent que les cas de figure où le score de qualité fourni par le décodeur JPWL
(PSNRreçu et SSIMreçu) est différent du score de qualité obtenu via la stratégie de décodage
(PSNRQIP et SSIMQIP) basée sur la métrique QIP. Le tableau 5.2 renseigne sur les
performances moyennes en fonction des conditions de transmission. On rappelle que le PSNR
moyen et le score SSIM moyen sont déterminés uniquement à partir des cas qui vérifient la
condition PSNRreçu ≠ PSNRQIP (ou SSIMreçu ≠ SSIMQIP).
En observant les courbes de PSNR, nous pouvons faire deux principales constatations.
Tout d’abord, la stratégie de décodage basée sur QIP permet d’éliminer les cas de figure où le
PSNR reçu est nettement dégradé. Cette observation traduit la capacité de la métrique QIP à
capter les cas de figure où des distorsions semblent importantes. Ces cas de figure semblent
donc aller dans le sens de la QoE. Dans un second temps, nous observons une quantité non
négligeable de cas où la métrique QIP sélectionne une configuration qui présente un PSNR
inférieur au PSNR fourni par le décodeur JPWL sans stratégie de décodage. Par conséquent, il
ne se dégage pas une supériorité évidente de la stratégie de décodage en termes de PSNR
moyen (tab. 5.2). Nous rappelons que les cas traités sur les courbes contiennent
obligatoirement des erreurs (score QIP ≠ 1) qui sont plus ou moins marquées. Ainsi des
126
CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE
distorsions présentant un faible impact du point de vue de l’erreur quadratique moyenne, sont
jugées plus sévèrement par la métrique QIP qui indique au décodeur de ne pas prendre en
compte la dernière couche de qualité. Ces cas de figure ne permettent donc pas de savoir de
manière objective si la décision prise va dans le sens de la QoE. Nous sommes donc
typiquement dans des cas de figure nécessitant une évaluation subjective de la qualité.
40
1
38
0.95
0.9
Score SSIM
PSNR en dB
36
34
32
0.85
0.8
30
PSNRreçu
PSNRQIP
28
26
0
SSIMreçu
SSIMQIP
0.75
0.7
500
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
0
500
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
Figure 5.7. Comparaison des performances de la stratégie d’adaptation de lien avec ou sans
stratégie de décodage pour l’image « Caps »
38
1
36
0.95
0.9
34
Score SSIM
PSNR en dB
0.85
32
30
28
0.8
0.75
0.7
0.65
26
PSNRreçu
PSNRQIP
24
22
0
500
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
0.6
SSIMreçu
SSIMQIP
0.55
0.5
0
500
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
Figure 5.8. Comparaison des performances de la stratégie d’adaptation de lien avec ou sans
stratégie de décodage pour l’image « Monarch »
Si l’on fait le parallèle avec les courbes de score SSIM, nous constatons la même
tendance concernant les valeurs « extrêmes » de score SSIM reçu, qui sont captées par la
métrique QIP. Toutefois, on remarque que les cas de figure où le score SSIM issu de la
stratégie de décodage est inférieur au score SSIM fourni par le décodeur JPWL, sont moins
nombreux. Cette constatation indique que la métrique QIP sélectionne des configurations de
décodage qui respectent mieux la structure de l’image. Les performances en termes de score
SSIM moyen fournit dans le tableau 5.2 vont dans ce sens. Ainsi, les meilleures performances
moyennes sont systématiquement fournies par la stratégie utilisant QIP.
127
CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE
MAUVAISES CONDITIONS CONDITIONS MOYENNES
Zone 1
Zones 2 et 4
Sans QIP Avec QIP
Sans QIP Avec QIP
PSNR moyen
Caps
PSNR moyen
Monarch
SSIM moyen
Caps
SSIM moyen
Monarch
BONNES CONDITIONS
Zone 3
Sans QIP Avec QIP
30,15dB
29,99dB
32,76dB 32,84dB
37,26dB
37,38dB
25,12dB
25,52dB
29,23dB 29,53dB
34,78dB
34,37dB
0,769
0,815
0,857
0,887
0,931
0,938
0,789
0,813
0,865
0,887
0,929
0,937
Tableau 5.2. Performances moyennes en fonction des conditions de transmission
12
10
8
6
4
2
0
-2
-4
0
500
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
Impact de la stratégie de décodage sur le score SSIM
Impact de la stratégie de décodage sur le PSNR
Les figures 5.9 et 5.10 permettent de quantifier l’écart (gain ou perte défini par
PSNRQIP-PSNRreçu et SSIMQIP-SSIMreçu) sur le score de qualité (PSNR ou SSIM)
correspondant aux figures 5.7 et 5.8. Les tableaux 5.3 et 5.4 apporte une analyse statistique
pour ces figures.
0.3
0.25
0.2
0.15
0.1
0.05
0
-0.05
-0.1
0
500
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
Figure 5. 9. Impact de la stratégie de décodage basée QIP pour l’image « Caps »
RESULTAT POUR L’IMAGE « CAPS »
Pourcentage de cas
favorable/défavorable
Ecart moyen
Impact positif sur le PSNR
Impact négatif sur le PSNR
48,16%
51,84%
+0,57dB
-0,35dB
Impact positif sur SSIM
Impact négatif sur SSIM
63,88%
36,12%
+0,017
-0,005
Tableau 5.3. Statistiques sur l’impact de la stratégie de décodage pour l’image « Caps »
128
12
10
8
6
4
2
0
-2
-4
0
500
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
Impact de la stratégie de décodage sur le score SSIM
Impact de la stratégie de décodage sur le PSNR
CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE
0.3
0.25
0.2
0.15
0.1
0.05
0
-0.05
-0.1
0
500
1000
1500
2000
Position sur la trajectoire du récepteur (×λ)
Figure 5.10. Impact de la stratégie de décodage basée QIP pour l’image « Monarch »
RESULTAT POUR L’IMAGE « MONARCH »
Pourcentage de cas
favorable/défavorable
Ecart moyen
Impact positif sur le PSNR
Impact négatif sur le PSNR
40%
60%
+0,55dB
-0,73dB
Impact positif sur SSIM
Impact négatif sur SSIM
67,62%
32,38%
+0,021
-0,005
Tableau 5.4. Statistiques sur l’impact de la stratégie de décodage pour l’image « Monarch »
Dans le tableau 5.4, le pourcentage de cas favorable ou défavorable est déterminé
uniquement sur la base des cas où PSNRQIP ≠ PSNRreçu ou SSIMQIP ≠ SSIMreçu. Ces résultats
confirment l’impact modéré de notre stratégie de décodage si l’on se place du point de vue de
l’erreur quadratique moyenne (PSNR). En effet, l’impact sur le PSNR est globalement négatif
avec 51,85% des cas pour « Caps » et 60% des cas pour « Monarch ». On constate également
des résultats qui ne sont pas identiques entre les deux images. Cette constatation indique que
le contenu de l’image présente un impact sur l’efficacité de la stratégie de décodage au sens
de l’erreur quadratique. Ce n’est cependant pas le cas de la métrique SSIM qui présente
globalement des résultats similaires quelle que soit l’image. Ainsi, l’impact sur le score SSIM
est positif dans environ 65% des cas avec des gains moyens (de l’ordre de 0,02) relativement
plus important que les pertes moyennes (-0,005).
Pour résumer, nous constatons que la métrique QIP est efficace afin d’éliminer les cas
aberrants. On remarque également que la métrique QIP est sévère avec les distorsions
impliquant une faible erreur quadratique et qu’elle favorise les configurations de décodage qui
respectent mieux la structure de l’image. Ces résultats pointent ainsi une différence dans
l’appréciation des distorsions qui ne peut être tranchée que par des tests subjectifs.
129
CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE
5.5.2 Analyse visuelle
Les figures 5.11 à 5.14 proposent une analyse visuelle de cas où l’on peut comparer
des images fournies selon un mode de décodage classique (fig. 5.11 (a), fig. 5.12 (a), fig. 5.13
(a) et fig. 5.14 (a)) face à des images décodées à l’aide de la stratégie de décodage basée sur
QIP (fig. 5.11 (b), fig. 5.12 (b), fig. 5.13 (b) et fig. 5.14 (b)). Les images présentent
volontairement un format important afin d’aider le lecteur à se faire une opinion sur la qualité
respective de chacune d’elles. Nous pouvons distinguer trois types de résultats.
Le premier type est constitué par des cas de figure où des distorsions grossières sont
présentes sur l’image comme c’est le cas pour les figures 5.11 (a) et 5.12 (a). Dans ces
exemples, la dernière couche de qualité est porteuse d’erreurs de transmission qui se
traduisent au décodage en distorsions visuellement gênantes. La métrique QIP détecte ces
erreurs et indique au décodeur de ne pas prendre en compte la dernière couche de qualité,
obtenant ainsi des images d’une qualité supérieure. Pour ces deux cas de figure, nous
constatons que les métriques PSNR et SSIM vont dans le même sens que QIP, en attribuant
de meilleurs scores à la configuration indiquée par QIP. On peut ainsi vraisemblablement
penser que ce choix maximise la QoE de l’utilisateur.
La seconde étude de cas porte sur l’image « Monarch780 » (fig. 5.13). Cet exemple
porte sur une image constituée de trois couches de qualité. Le décodage JPWL classique (fig.
5.13 (a)) exploite toutes les couches de qualité. On peut alors apercevoir de très légères
distorsions dans le coin supérieur droit de l’image. La métrique QIP capte ces distorsions et
indique de ne pas décoder la dernière couche, ce qui induit une perte de détail sur l’ensemble
de l’image (fig. 5.13 (b)), mais également la suppression de ces légères distorsions. Dans le
cas de figure présenté, la configuration sélectionnée par QIP n’est validée par aucune des
deux autres métriques (PSNR et SSIM). Il est assez difficile de se faire une opinion sur ce cas
sur la seule base des métriques de qualité objectives, car malgré la perte sur le PSNR et le
score SSIM, la version présentée par QIP peut être recevable du point de vue de la QoE. Seule
une validation visuelle (subjective) serait en mesure de nous donner des indications allant en
ce sens.
La dernière étude de cas porte sur l’image Caps1012. Ce cas est particulièrement
intéressant car la version de l’image issue du décodage JPWL classique (fig. 5.14 (a)) contient
des distorsions qui altèrent violemment la structure de l’image. La métrique QIP détecte les
distorsions et indique de ne pas décoder la dernière couche ce qui donne un résultat moins
détaillé (fig. 5.14 (b)) mais sans les distorsions présentes sur la figure 5.14 (a). Le choix de la
stratégie de décodage est justifié au sens de la métrique SSIM, par contre la configuration
présentée par QIP présente un PSNR inférieur à la configuration classique. La différence entre
ces deux versions de l’image n’est que de 0,56dB alors que visuellement, la différence est
importante. On est typiquement dans un cas de figure où le PSNR montre ses limites en
attribuant un score quasiment équivalent à deux images de qualité différentes.
Finalement, nous constatons que lorsque la stratégie de décodage entraîne un gain en
termes de PSNR et de score SSIM, il y a de fortes chances que ce choix aille dans le sens de
la QoE. Par contre, lorsque QIP entraîne une baisse du score attribué par ces métriques, cela
ne met pas forcément en avant de mauvaises performances de la stratégie de décodage. Nous
sommes alors confrontés à un choix entre plusieurs configurations, recevables du point de vue
de la QoE, qui ne peut être validé ou infirmé que par des tests dits subjectifs.
130
CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE
(a) Décodage classique - Caps1567 : PSNR = 28,03dB ; SSIM = 0,908
(b) Décodage avec QIP - Caps1567 : PSNR = 38,76dB ; SSIM = 0,953
Figure 5.11. Analyse visuelle de l’impact de la stratégie de décodage pour « Caps1567 »
131
CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE
(a) Décodage classique - Monarch886 : PSNR = 23,42dB ; SSIM = 0,680
(b) Décodage avec QIP - Monarch886 : PSNR = 28,09dB ; SSIM = 0,869
Figure 5.12. Analyse visuelle de l’impact de la stratégie de décodage pour « Caps886 »
132
CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE
(a) Décodage classique - Monarch780 : PSNR = 31,23dB ; SSIM = 0,892
(b) Décodage avec QIP - Monarch780 : PSNR = 27,54dB ; SSIM = 0,858
Figure 5.13. Analyse visuelle de l’impact de la stratégie de décodage pour « Monarch780 »
133
CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE
(a) Décodage classique - Caps1012 : PSNR = 30,23dB ; SSIM = 0,771
(b) Décodage avec QIP - Caps1012 : PSNR = 29,67dB ; SSIM = 0,811
Figure 5.14. Analyse visuelle de l’impact de la stratégie de décodage pour « Monarch1012»
134
CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE
5.6 Validation subjective
5.6.1 Motivations
Nous rappelons que l’objectif de notre stratégie de décodage consiste à maximiser la
QoE de l’utilisateur. Pour cela, nous avons proposé d’adapter la métrique à référence réduite
QIP pour être utilisée dans un contexte de transmission, afin de fournir une stratégie de
décodage en réception. Cependant, bien qu’elle s’appuie sur des contraintes psychovisuelles,
la métrique à référence réduite QIP n’en reste pas moins une métrique de qualité objective,
basée sur un algorithme. Afin de vérifier que les choix proposés par la stratégie de décodage
vont dans le sens de la QoE de l’utilisateur, il est indispensable de se confronter au jugement
subjectif humain. Cette validation subjective doit permettre de tester la pertinence des choix
de la métrique QIP dans le cadre de la stratégie de transmission. Cette étude permettra
également d’apporter une réponse à certains cas problématiques où QIP contredit le PSNR ou
le score SSIM. Ce n’est qu’après validation statistique que l’on pourra affirmer ou non, que la
stratégie proposée maximise la QoE.
5.6.2 Protocole de test
5.6.2.1 Base d’images
Pour les besoins des tests, nous devons utiliser des images représentatives. A ce titre
nous utilisons les images « Caps », « House » et « Monarch » (fig. 5.15) avec une résolution
de 768×512 pixels, très différentes par leur contenu.
(a)
(b)
(c)
Figure 5.15. Base d’images utilisée : (a) Caps, (b) House et (c) Monarch
135
CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE
Nous avons choisi une résolution importante à l’image de l’évolution des technologies
qui favorisent les images de grande dimension. L’image « Caps » (fig. 5.15 (a)) a été choisie
car elle n’est pas « très détaillée » et met en scène des couleurs vives qui interpellent la vision
humaine. A l’inverse, l’image « House » (fig. 5.15 (b)) a été choisi car elle comporte
beaucoup plus de détail avec des couleurs plus neutres. Enfin, l’image « Monarch » (fig. 5.15
(c)) fournit un contraste intéressant entre un fond flou et un premier plan détaillé. De plus, la
zone d’intérêt dans cette image est bien marquée (le papillon et quelques fleurs) ce qui permet
d’évaluer l’impact des distorsions sur des zones d’importance visuelle différentes en termes
d’information. Cet ensemble d’images présente donc une variété intéressante malgré le faible
nombre d’images utilisées. De plus, l’expérience générant des milliers de résultat par image et
étant par nature très chronophage, nous devons limiter le nombre d’images utilisées.
Les images ont été transmises à travers le canal réaliste avec la stratégie d’adaptation de
lien conformément au paramétrage défini dans le paragraphe 4.6. Les images ont ensuite été
décodées à l’aide du décodeur JPWL robuste ainsi qu’avec la stratégie de décodage basée sur
la métrique QIP. La base d’images a alors été constituée uniquement à partir des cas où la
stratégie de décodage fournit un résultat différent du décodeur JPWL en l’absence de
stratégie. Il n’est effectivement pas intéressant de retenir les cas de figure où le décodeur
JPWL et la stratégie de décodage convergent vers un résultat équivalent. La base d’images
comprend ainsi 765 images.
5.6.2.2 Panel d’observateurs
Dix-sept observateurs non-experts de la thématique ont participé à la campagne
d’évaluation. Ce nombre est conforme à l’exigence minimale mentionnée dans [137], après
rejet des observateurs/observations aberrants. Le panel de participants est constitué de sept
femmes et dix hommes pour la plupart étudiants, présentant une moyenne d’âge de 25 ans.
Sachant que les jeunes représentent la majorité des utilisateurs des nouvelles technologies, il
est souvent recommandé par les différentes instances d’évaluation d’avoir un panel
relativement jeune, hormis pour des études spécifiques.
5.6.2.3 Présentation des images
L’expérience psychovisuelle se déroule en trois étapes. Tout d’abord, on effectue une
collecte des informations personnelles de l’observateur puis de celui-ci passe des tests
d’acuité visuelle et de vision des couleurs. Par la suite, le test est expliqué aux observateurs
afin qu’ils comprennent sa finalité. Ainsi, un discours unique est lu lors de la phase
d’entraînement indispensable afin d’appréhender le test. Les participants sont alors invités à
poser toutes les questions en cas de besoin avant de commencer le test.
L’évaluation proprement dite consiste à présenter aux participants, les 765 images dans
un ordre aléatoire. La présentation est faite selon un protocole strict. Les images sont
affichées comme le montre la figure 5.16. L’idée consiste à demander à l’observateur de
comparer deux images issues du décodage à une couche de qualité de différence. Par
exemple, une image issue du décodage de la première et la seconde couche est comparée au
décodage de l’image avec trois couches de qualité. La position des images est aléatoire et
l’observateur ne dispose naturellement pas de cette information, afin d’éviter un phénomène
d’habitude. Le temps d’évaluation de chaque couple d’image n’est pas fixé. Pour limiter la
136
CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE
fatigue visuelle, l’application comporte un compteur obligeant l’observateur à s’arrêter toutes
les vingt minutes.
Figure 5.16. Interface développée pour le test subjectif
La notation se fait sur une échelle discrète composée de deux parties (une pour chaque
image). Si les deux images présentent une qualité similaire, l’observateur peut choisir le
qualificatif « équivalente ». Dans le cas où une des images présente une meilleure qualité,
trois gradations sont possibles : « légèrement meilleure », « meilleure » et « bien meilleure ».
5.6.3 Analyse des résultats
Dans cette section, nous présentons les résultats issus de la campagne d’évaluation
subjective. Les résultats sont donnés tout d’abord dans leur forme globale. Dans un second
temps, nous étudierons les résultats par image afin de constater l’impact du contenu.
La figure 5.17 montre la proportion de cas où le choix des utilisateurs correspond à la
configuration proposée par la stratégie de décodage basée sur QIP, pour l’ensemble de la base
d’images. On peut ainsi remarquer que dans la grande majorité des cas (73,63%), les
observateurs sont allés dans le sens de la stratégie de décodage. Il est à noter que dans 19,55%
des cas, la qualité est jugée comme étant équivalente, ce qui signifie que la stratégie ne
pénalise pas la qualité de l’image perçue. Seulement 6,82% des cas de figure sont favorables
au décodage initialement proposé par le décodeur robuste JPWL. Ces résultats montrent que
les décisions prises par la stratégie de décodage sont corroborées par le jugement humain.
Nous pouvons donc dire que la stratégie proposée va dans le sens de la QoE des utilisateurs.
137
CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE
Proportion de préférences
80%
70%
60%
50%
40%
30%
20%
10%
0%
Décodage JPWL
classique
Qualité équivalente
Stratégie de
décodage avec QIP
Figure 5.17. Proportion de préférence des observateurs pour l’ensemble de la base d’images
50%
Proportion de préférences
45%
40%
35%
30%
25%
20%
15%
10%
5%
0%
Bien
meilleure
Meilleure
Légèrement
meilleure
Décodage JPWL
classique
Qualité
équivalente
Légèrement
meilleure
Meilleure
Bien
meilleure
Stratégie de décodage
avec QIP
Figure 5.18. Détail des scores moyens pour toutes les images et tous les observateurs
138
CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE
La figure 5.18 détaille les résultats de la figure 5.17 en faisant ressortir les différents
qualificatifs utilisés par les observateurs sur l’ensemble de la base d’image. Nous constatons
ainsi que le qualificatif le plus utilisé est « légèrement meilleure » en faveur de la stratégie
basée sur QIP. Ceci s’explique par le fait que les configurations de décodage sélectionnées par
QIP contiennent une couche de qualité de moins (moins de détails) que les images fournies
par le décodeur JPWL classique contenant des erreurs de transmission. La différence est donc
jugée comme étant légère mais néanmoins le nombre d’occurrence important (48,28% des
cas) indique une tendance nette des observateurs. Les observateurs préfèrent donc avoir moins
de détails plutôt que les distorsions caractéristiques de JPWL. On remarque également que les
observateurs jugent tout de même les images proposées par QIP comme étant « meilleure »
dans 23,78% des cas ce qui constitue le second meilleur résultat. Le dernier résultat
significatif concerne des qualités d’images jugées équivalentes (19,55%). On rappelle que ce
qualificatif ne pénalise aucune des deux méthodes. Le score lié à ce qualificatif peut donc être
additionné avec les résultats de chacune des deux méthodes. Ainsi, les trois résultats les plus
significatifs, représentant 91,61% des cas, vont dans le sans de la stratégie de décodage basée
sur la métrique à référence réduite QIP.
La figure 5.19 détaille quant à elle les résultats pour les trois images de la base. Cette
figure permet ainsi d’évaluer l’impact du contenu des images sur les résultats.
55%
Proportion des préférences
50%
45%
40%
35%
30%
Caps
25%
House
20%
Monarch
15%
10%
5%
0%
Bien
meilleure
Meilleure
Légèrement Qualité
Légèrement Meilleure
meilleure équivalente meilleure
Décodage JPWL
classique
Bien
meilleure
Stratégie de décodage
avec QIP
Figure 5.19. Détail des scores moyens par image pour tous les observateurs
On constate globalement que la nature du contenu influence relativement peu le choix
des observateurs. On retrouve ainsi un comportement similaire au comportement moyen pour
les images « House » et « Monarch ». La seule différence avec le comportement moyen
concerne l’image « Caps » qui présentent un peu plus de cas « légèrement meilleur » en
faveur du décodage classique JPWL à savoir 9,48% des cas (environ deux fois plus que pour
139
CHAPITRE 5. ANALYSE DU CONTENU DANS L’APPRECIATION DE LA QUALITE DE L’EXPERIENCE
les autres images). De la même manière, on dénombre plus de cas présentant une qualité
équivalente pour cette image (27,24%). L’augmentation de ces deux catégories se fait au
détriment des cas jugés meilleurs pour la stratégie de décodage avec QIP (14% des cas).
Toutefois malgré ces variations, la stratégie de décodage basé sur QIP va dans le sens des
observateurs dans 61,22% des cas (88,46% en comptant les cas équivalents). Bien que ces
résultats soit encourageants, les tests mériteraient d’être confirmées sur un plus grand nombre
d’images.
5.7 Synthèse et conclusion
A l’issue du chapitre précédent, nous disposions d’une stratégie de transmission
optimale du point de vue de la QoS, relativement aux paramètres considérés. Néanmoins,
nous avons mis en évidence des cas de figure ne maximisant pas la qualité de l’expérience de
l’utilisateur. Ce dernier chapitre constitue donc une ouverture vers le concept de QoE.
Après avoir décrit la problématique qui se pose en réception d’une image hiérarchisée
en couches de qualité, nous avons suggéré d’employer la métrique à référence réduite QIP qui
intègre des contraintes psychovisuelles afin d’évaluer la qualité des différentes configurations
de décodage en réception. La référence réduite nécessaire à l’évaluation des images en
réception présente l’avantage d’avoir un coût relativement minime (seulement 22 octets) et
peut donc être transmise avec la couche de base. Les résultats de simulation sur le canal
réaliste avec la stratégie d’adaptation de lien, ont montré que QIP est efficace afin d’écarter
les cas de figure aberrants au sens du PSNR ou du score SSIM. Nous avons également vu que
la stratégie de décodage permet de préserver la structure des images (amélioration globale
suivant le score SSIM) mais que du point de vue de l’erreur quadratique moyenne (PSNR), les
gains ou les pertes sont à relativiser. Toutefois, l’analyse visuelle a mis en évidence que les
critères objectifs utilisés (PSNR et SSIM) montrent des limites et ne reflètent pas toujours la
qualité visuelle perçue par l’utilisateur. Par conséquent, nous avons mené une campagne de
tests subjectifs permettant de vérifier que la stratégie de décodage proposée sélectionne des
configurations de décodage corroborées par le jugement humain. Les conclusions de ces tests
ont montré de manière significative que la stratégie de décodage mise en œuvre va dans le
sens de la QoE de l’utilisateur dans plus de 93% des cas.
Ainsi, cette étude contribue à montrer qu’il est possible de prendre en compte
l’expérience de l’utilisateur dans une chaîne de communications numériques pour un coût
négligeable. De plus, le concept de QoE pousse à relativiser l’utilisation des critères objectifs
usuels qui peuvent facilement être pris en défaut.
Quelque soient les résultats, ils seront bons.
140
CONCLUSION ET PERSPECTIVES
Cette thèse traite de la robustesse des transmissions d’images dans des environnements
de transmission difficiles caractérisés par le phénomène de multitrajets (environnements
urbains et suburbains), la mobilité et le bruit radioélectrique. Nous avons proposé d’exploiter
la diversité spatiale du canal de transmission par le biais de la technologie MIMO, afin
d’apporter de la robustesse au schéma de transmission. Nous avons considéré l’hypothèse de
la connaissance de la CSI du côté de l’émetteur (MIMO en boucle fermée), ce qui permet de
décomposer le canal de transmission en sous-canaux SISO virtuels, indépendants et
hiérarchisés par niveau de RSB. Cette configuration permet, en outre, d’intégrer des
précodeurs qui agissent comme des pré-égaliseurs, en faisant varier la puissance allouée sur
chacun des sous-canaux, dans le but d’optimiser un critère pertinent. Dans le cadre de cette
thèse et du projet CAIMAN, les images transmises sont issues du codeur JPWL qui intègre
des outils de robustesse pour la transmission d’images sur canal sans fil. Ce codeur permet, en
outre, de décomposer une image en couches de qualité hiérarchisées. La stratégie de
transmission proposée repose alors sur la correspondance entre la hiérarchie des couches de
qualité JPWL et celle des sous-canaux SISO. Les précodeurs MIMO permettent alors de
fournir des stratégies UPA pour la transmission des couches de qualité JPWL.
Après avoir évalué les performances des différents précodeurs dans le chapitre 2, nous
avons pu mettre en évidence que la définition de leur problème d’optimisation respectif est
incompatible avec la notion de hiérarchie de l’image. Nous avons également mis en avant le
fait que qu’il n’y a pas de corrélation entre le TEB global et la qualité des images reçues. De
plus, nous avons vu que les précodeurs MIMO classiques s’adaptent mal à un changement de
l’ordre de la modulation ou de la capacité de correction d’un CCE.
A partir de ce constat, nous avons proposé dans le chapitre 3, une méthode
d’allocation de la puissance, appelé CBP, permettant de faire le lien entre la puissance, le
codage canal, la modulation et les conditions sur le canal de transmission, sous une contrainte
de TEB cible. Cette méthode permet en particulier de s’adapter à la sensibilité du contenu aux
erreurs de transmission. Une série de simulations sur canal statistique et sur canal réaliste a
permis de mettre en évidence la robustesse du schéma pour garantir une bonne qualité en
réception, au regard des conditions imposées par le canal de transmission. Nous avons
également monté la grande flexibilité dont fait preuve l’algorithme d’allocation de puissance
face aux variations des paramètres liés à la modulation ou au codage canal.
Par la suite, nous avons proposé dans le chapitre 4, une stratégie d’adaptation de lien
reposant sur le précodeur CBP. L’idée était d’intégrer conjointement des stratégies UEP,
UPA, de la modulation adaptative et du codage source adaptatif, en fonction de l’état du
canal. Après avoir formulé le problème de minimisation de la distorsion ainsi que les
contraintes du système, nous avons proposé une méthode de résolution basée sur une
représentation arborescente des différentes configurations de codage/transmission. La
configuration optimale correspond alors au chemin minimisant la distorsion de la source.
Nous avons montré que cette méthode permettait d’améliorer, d’une part, la stabilité des
141
CONCLUSION
résultats lorsque les conditions de transmission étaient mauvaises et, d’autre part,
d’augmenter significativement la qualité des images reçues dans de bonnes conditions de
transmission.
Enfin, dans le chapitre 5, nous avons proposé d’intégrer des contraintes
psychovisuelles dans la stratégie de transmission. En effet, nous avons montré que bien que la
stratégie d’adaptation de lien est optimale du point de vue de la QoS, il n’en demeure pas
moins que certains cas de figures ne vont pas dans le sens de la qualité de l’expérience de
l’utilisateur. Nous avons ainsi présenté une stratégie de décodage basée sur l’usage de la
métrique à référence réduite QIP afin d’évaluer les différentes configurations de décodage qui
se présentent à l’utilisateur en réception. Une campagne de tests subjectifs devant un panel
d’observateurs vient finalement corroborer les décisions prises par la stratégie de décodage
dans plus de 93% des cas. A l’issue de ces tests, nous pouvons donc affirmer que la stratégie
de transmission va dans le sens de la qualité de l’expérience de l’utilisateur.
Différentes perspectives peuvent être suggérées à partir des travaux décrits dans ce
manuscrit de thèse.
Concernant le précodeur CBP, il pourrait être intéressant d’intégrer d’autres types de
codes correcteurs d’erreurs comme les codes LDPC par exemple. De la même manière, on
pourrait envisager d’autres hypothèses que l’hypothèse gaussienne dans la définition du
précodeur CBP, sous réserve que la probabilité d’erreur de ces lois puisse s’exprimer en
fonction des différents paramètres.
La stratégie proposée a été conçue essentiellement pour assurer la robustesse via des
techniques de codage conjoint. Néanmoins, des travaux intéressants sur le décodage conjoint
source/canal itératif [5] [138] [139] ont permis d'améliorer notablement la qualité d'images
JPEG 2000 en réception. Ces travaux pourraient être exploités de façon complémentaire avec
notre stratégie, afin d'améliorer encore la robustesse du schéma global. L'association de ces
stratégies pourraient aboutir, en outre, à une diminution du TEB cible ainsi qu’une
augmentation de la qualité des images reçues.
Une autre piste de réflexions concernent des travaux de l’équipe SYSCOM au
laboratoire XLIM-SIC, qui ont commencé à aborder les problématiques liés à l’optimisation
théorique de paramètres à la fois discrets (puissance) et continus (modulation, codage canal)
ainsi que les problèmes liés au minimums locaux. Ces travaux pourraient alimenter l’étude
théorique de la stratégie proposée.
La connaissance de la CSI du côté de l’émetteur est une contrainte forte qui a mené
beaucoup de travaux de recherche à limiter la taille des informations sur la voie de retour. Il
serait particulièrement intéressant d’étudier l’impact d’un retour de la CSI quantifiée. Dans un
tel schéma, la définition des paramètres s’effectuerait au niveau du récepteur qui ne renverrait,
par exemple, que la configuration de codage/transmission ainsi qu’une CSI quantifiée.
Il serait également intéressant d’évaluer la pertinence de cette stratégie pour de la
transmission vidéo en temps réel. Cette évaluation nécessiterait évidemment de redéfinir
certaines contraintes telles que par exemple, le délai de transmission. De plus, d’autres
paramètres devraient être introduit telle que la taille des GOP72.
Concernant l’aspect lié à la QoE, on pourrait dans un premier temps étendre les tests
subjectifs sur une base d’images plus importante. De plus des travaux menés en parallèle de
cette thèse dans le cadre du projet CAIMAN, ont mis en avant l’usage de cartes de saillance
72
Group Of Pictures
142
CONCLUSION
hiérarchisées. L’idée est de décomposer l’image en plusieurs zones d’intérêt hiérarchisées au
sens du SVH. La stratégie de transmission pourrait alors être adaptée pour transmettre ces
zones d’intérêt à la place des couches de qualité classiques.
A moyen terme, il serait intéressant d’étendre la stratégie proposée à une approche
multi-utilisateurs et muli-services, faisant intervenir d’autres couches du modèle OSI73 telles
que la sous-couche MAC. On aboutirait ainsi au développement d’une stratégie
d’optimisation conjointe selon le concept cross-layer PHY/MAC/APPLICATION
suffisamment générique, efficace, économique et compatible avec les différents services
hétérogènes utilisés dans les systèmes de communications présents et à venir.
73
Open System Interconnection
143
BIBLIOGRAPHIE
[1] J. G. Proakis, “Digital communications”, New-York: McGraw-Hill, 4th edition, 2000.
[2] C. E. Shannon, “A Mathematical Theory of Communication”, Bell System Technical
Journal, vol. 27, pp. 379-423, 623-656, Jul., Oct. 1948.
[3] S. C. Chan, K. L. Ho, “A new two-dimensional cosine transform algorithm”, IEEE
Transactions on Signal Processing, vol. 39, no. 2, pp. 481-485, 1993.
[4] S. Mallat, “A theory for multiresolution signal decomposition: The wavelet
representation”, IEEE Transactions on Pattern Analysis and Machine Intelligence, vol.
11, no. 2, pp. 674-693, 1989.
[5] A. Zribi, “Décodage conjoint source/canal des codes entropiques. Application à la
transmission d’images”, Thèse de doctorat de l’Université Telecom Bretagne, Dec. 2010.
[6] D. A. Huffman, “A method for the construction of minimum-redundancy codes”,
Proceedings of the Institute of Radio Engineering, vol. 40, no. 9, pp. 1098-1102, 1952.
[7] J. J. Rissanen, G. G. Langdon, “Arithmetic coding”, IBM J. Res. Develop., vol. 23, pp.
149-162, 1979.
[8] ISO/IEC DIS 10918-1. “Digital Compression and Coding of Continuous-Tone Still
Image (JPEG)”, Technical report, CCITT Recommendation T.81, 1992.
[9] ISO/IEC 15444-1 / ITU-T T.800, “JPEG 2000 Image Coding System: Core Coding
System”, 2002.
[10] ISO/IEC 15444-11:2007, “JPEG 2000 Image Coding System – part11: Wireless JPEG
2000”, May 2007.
[11] F. Dufaux, “JPWL - JPEG 2000 Wireless (Part 11)”, in P. Schelkens, A. Skodras and T.
Ebrahimi, editors, The JPEG 2000 Suite, Wiley, 2009.
[12] F. Dufaux, G. Baruffa, F. Frescura, D. Nicholson, “JPWL - an Extension of JPEG 2000
for Wireless Imaging”, in IEEE Proc. Int. Symp. on Circuits and Systems(ISCAS),
Island of Kos, Greece, May 2006.
[13] F. Dufaux, G.J. Sullivan and T. Ebrahimi, “The JPEG XR Image Coding Standard”, in
IEEE Signal Processing Magazine, vol. 26, no. 6, pp. 195-199, 204-204, Nov. 2009.
145
BIBLIOGRAPHIE
[14] S. Lin, D. J. Costello, Jr., “Error Control Coding: Fundamentals and Applications”, 2nd
edition, Prentice Hall: Englewoods Cliffs, NJ, 2004.
[15] P. Elias, “Coding for noisy channels”, Proceedings of the IRE National Convention
Record, vol. 3, no. 4, pp. 37-46, Mar. 1955.
[16] C. Berrou, A. Glavieux, P. Thitimajhima, “Near shannon limit error correcting coding
and decoding: Turbo-codes”, Proceedings of IEEE International Conference on
Communications ICC’93, pp. 1067-1070, Geneva, Switzerland, May 1993.
[17] A. Goldsmith, “Wireless Communications”, Cambridge, University Press, 2005.
[18] B. Vrigneau, “Systèmes MIMO précodés optimisant la distance minimale : étude des
performances et extension du nombre de voies”, Thèse de doctorat de l’Université de
Bretagne Occidentale, Nov. 2006.
[19] W. Hamidouche, “Stratégies de transmission vidéo sur un canal MIMO”, Thèse de
doctorat de l’Université de Poitiers, Nov. 2010.
[20] M. Paetzold, “Mobile fading channels”, Wiley, 2002.
[21] J. D. Parsons, “The mobile radio propagation channel”, Wiley, 2000.
[22] J. Gibson, “The communications handbook”, CRC Press, 1997.
[23] R. G. Kouyoumjian, “Asymptotic high-frequency methods”, Proceedings of the IEEE,
no. 53, pp. 864-876, Aug. 1965.
[24] M. F. Catedra, J. Perez, F. S. Adana, O. Gutierrez, “Efficient ray-tracing techniques for
three-dimensional analyses of propagation in mobile communications. Application to
picocell and microcell scenarios”, IEEE Antennas Propagation Magazine, vol. 40, no.
2, pp. 15-28, Apr. 1998.
[25] L. Aveneau, Y. Pousset, R. Vauzelle, M. Mériaux, “Development and Evaluations of
Physical and Computer Optimizations for the UTD 3D Model”, IEEE Antennas and
Propagation, Davos, Suisse, Apr. 2000.
[26] G. Madi, “Optimisation d’un réseau de capteurs par techniques MIMO coopératives.
Applications possibles : Smart Grid, télédetection, …”, Thèse de doctorat de
l’Université de Poitiers, Mar. 2012.
[27] Y. Chartois, Y. Pousset, R. Vauzelle, “A spatio-temporel radio channel characterization
with 3D ray tracing propagation model in urban environment”, Proceedings of the IEEE
International Symposium on Personal, Indoor and Mobile Radio Communications
PIMRC’04, Barcelona, Spain, 2004.
[28] F. Mora, L. Aveneau, “Optimized scanning of a visibility graph data structure for
efficient ray-tracing, in ECWT’05, Paris, France, Oct. 2005.
[29] IEEE Standard for Information Technology Part11. Wireless LAN Medium Access
Control (MAC) and Physical Layer (PHY) Specifications Amendment: Enhancements
for Higher Throughput (802.11n), 2009.
146
BIBLIOGRAPHIE
[30] P. Bello, “Characterization of randomly time-variant linear channels”, IEEE
Transactions on Communications, vol. 11, no. 4, pp. 360-393, 1963.
[31] H. Bölcskei, A. Paulraj, “The Communications Handbook”, CRC Press, 2002.
[32] B. L. Floch, M. Alard, C. Berrou, “Coded Orthogonal Frequency Division Multiplex”,
IEEE Proceedings, vol. 83, no. 6, pp. 982-996, 1995.
[33] O. Berder, C. Bouder, G. Burel, “Identification of frequency hopping communications”,
in Proceedings of WSEAS Conference on Circuits, Systems, Communications and
Computers (CSCC), pp. 3851-3856, Vouliagmeni, Greece, Jul. 2000.
[34] G. Burel, C. Bouder, O. Berder, “Detection of direct sequence spread spectrum
transmission without prior knowledge”, in IEEE Global Telecommunications
Conference GLOBECOM’01, pp. 236-239, San Antonio (Texas), USA, Nov. 2001.
[35] R. G. Vaughan, “Polarization diversity in mobile communications”, in IEEE
Transactions on Vehicular Technology, vol. 39, pp. 177-186, 1990.
[36] C. Pereira, Y. Pousset, R. Vauzelle, P. Combeau, “Sensitivity of the MIMO Channel
Characterization to the Modeling of the Environment”, IEEE Transactions on Antennas
and Propagation, vol. 57, no. 4, pp. 1218-1227, Mar. 2009.
[37] I. E. Telatar, “Capacity of multi-antenna Gaussian channels”, European Transactions
on Telecommunications, vol. 10, no. 6, pp. 585-595, 1999.
[38] G. J. Foschini, M. J. Gans, “On limits of wireless communications in a fading
environment when using multiple antennas”, Wireless Personal Communications, vol.
6, no. 3, pp. 311-335, Mar. 1998.
[39] IEEE Standard for a Local and Metropolitan area networks Part16: Amendment for
Physical and Medium Access Control Layers for Combined Fixed and Mobile
Operation (802.11e), 2005.
[40] S. Sesia, I. Toufik, M. Baker, “LTE – The UMTS Long Term Evolution – From Theory
to Practice”, John and Wiley Sons, 2009.
[41] A. Stanley, Y. Sun, “Space-time coding for wireless communications: an overview”,
IEEE Proceedings Communications, vol. 153, no. 4, pp. 509-518, Aug. 2006.
[42] V. Tarokh, N. Seshadri, A. R. Calderbank, “Space-time codes for high data rate wireless
communications: Performance criterion and code construction”, IEEE Transactions on
Information Theory, vol. 44, no. 2, pp. 744-765, Mar. 1998.
[43] S. M. Alamouti, “A simple diversity technique for wireless communications”, IEEE
Journal on Selected Areas in Communications, vol. 16, no. 8, pp. 1452-1458, Oct. 1998.
[44] V. Tarokh, H. Jafarkhani, A. R. Calderbank, “Space-time block codes from orthogonal
designs”, IEEE Transactions on Information Theory, vol. 45, no. 5, pp. 1456-1467, Jul.
1999.
147
BIBLIOGRAPHIE
[45] M. O. Damen, K. Abed-Meraim, J.-C. Belfiore, “Diagonal algebraic space-time block
codes”, IEEE Transactions on Information Theory, vol. 48, pp. 628-636, Mar. 2002.
[46] H. E. Gamal, M. O. Damen, “Universal Space-Time Coding”, IEEE Transactions on
Information Theory, vol. 49, no. 5, pp. 1097-1119, May 2003.
[47] J.-C. Belfiore, G. Rekaya, E. Viterbo, “The Golen Code: A 2 × 2 Full-Rate Space-Time
Code with Non-Vanishing Determinants”, in Proceedings of IEEE International Symposium on
Information Theory, Chicago, USA, Jul. 2004.
[48] G. Rekaya, “Nouvelles constructions algébriques de codes spatio-temporels atteignant
le compromis multiplexage-diversité”, Thèse de doctorat de l’Ecole Nationale
Supérieure des Télécommunications, Dec. 2004.
[49] O. Berder, “Optimisation et stratégies d’allocation de puissance des systèmes de
transmission multi-antennes”, Thèse de doctorat de l’Université de Bretagne
Occidentale, Dec. 2002.
[50] L. Collin, “Optimisation de systèmes multi-antennes basées sur la distance minimale”,
Thèse de doctorat de l’Université de Bretagne Occidentale, Dec. 2002.
[51] H. Lee, S. Park, I. Lee, “Orthogonalized spatial multiplexing for closed-loop MIMO
systems”, IEEE Transactions on Communications, vol. 55, pp. 1044-1052, 2007.
[52] Y. Kim, H.Lee, S. Park, I. Lee, “Optimal precoding for orthogonalized spatial
multiplexing in closed-loop MIMO systems”, IEEE Journal on Selected Areas in
Communication, vol. 26, no. 8, 2008.
[53] W. Hamidouche, C. Perrine, Y. Pousset, C. Olivier, “A solution to efficient power
allocation for H.264/SVC video transmission over a realistic MIMO channel using
precoder designs”, Journal of Visual Communication and Image Representation, vol.
22, no. 6, pp. 563-574, Aug. 2011.
[54] H. Sampath, P. Stoica, A. Paulraj, “Generalized Linear Precoder and Decoder Design
for MIMO Channels Using the Weighted MMSE Criterion”, IEEE Transactions on
Communication, vol. 49, no. 12, pp. 2198-2206, Dec. 2001.
[55] S. Hara, R. Parasad, “OFDM for wireless communications systems”, Artech House,
2003.
[56] W. Xiang, S. A. Barbulescu, S. S. Pietrobon, “Unequal Error Protection applied to
JPEG Image Transmission using Turbo Codes”, Proc. 2001 IEEE Information Theory
Workshop, Cairns, Australia, Sep. 2001.
[57] T. P. Fowdur, Y. Beni, “An Unequal Error Protection Scheme for JPEG Image
Transmission Using Enhanced Duo-Binary Turbo Codes”, in the 5th International
Conference on Communications Theory, Reliability, and Quality of Service CTRQ’12,
Chamonix/Mont Blanc, France, 2012.
[58] C. Pouillat, D. Nicholson, P. Vila, “Sensibilité de JPEG 2000 aux erreurs”, CORESA
2001, Dijon, France, Nov. 2001.
148
BIBLIOGRAPHIE
[59] D. Nicholson, C. Lamy-Bergot, X. Naturel, C. Pouillat, “JPEG 2000 backward
compatible error protection with Reed-Solomon codes”, IEEE Transactions on
Consumer Electronics, vol. 49, no. 4, pp. 855-860, Nov. 2003.
[60] A. Natu, D. Taubman, “Unequal Protection of JPEG 2000 Codestreams in Wireless
Channels”, Proccedings of IEEE GLOBECOM’02, vol. 1, pp. 534-538, Taipei, China,
Nov. 2002.
[61] C. Pouillat, D. Nicholson, “Impact and Efficiency of Error Resilience Tools for Mobile
Applications”, ISO/IEC JTC1 SC29 WG1 N2176, Stockholm, Sweden, Jul. 2001.
[62] V. Sanchez, M. K. Mandal, “Robust Transmission of JPEG 2000 Images over Noisy
Channels”, Proccedings of IEEE ICCE’02, pp. 80-81, 2002.
[63] F. Dufaux, D. Nicholson, “JPWL : JPEG 2000 for Wireless Applications”, SPIE Proc.
Appl. Of Digital Image Proc. XXVII, Denver, CO, Aug. 2004
[64] W. Xiang, A. Clemence, J. Leis, Y. Wang, “Error Resilience Analysis of Wireless
Image Transmission Using JPEG, JPEG 2000 and JPWL”, in 7th International
Conference on Information, Communications and Signal Processing ICICS’09, Macau,
Dec. 2009.
[65] Y. M. Targali, E. V. Jones, “Unequal error protection for image transmission over GSM
networks”, in Proceedings of the IEEE European Workshop on Distributed Imaging,
London, England, 1999.
[66] Y. Zhang, Y. Liu, R. Pickholtz, “Layered image transmission over cellular radio
channels”, IEEE Transactions on Vehicular Technology, vol. 43, no. 3, pp. 786-794,
Aug. 1994.
[67] H. Liu, M. El Zarki, “Transmission of video telephony images over wireless channel”,
Wireless Networks, vol. 2, no. 3, pp. 219-228, 1996.
[68] C.-L. Huang, S. Liang, “Unequal Error Protection for MPEG-2 video transmission over
wireless channels”, Signal Processing: Image Communication, vol. 19, no. 1, pp. 67-79,
2004.
[69] N. Thomos, N. V. Boulgouris, M. G. Strintzis, “Transmission of Images Over Noisy
Channels Using Error-Resilient Wavelet Coding and Forward Error Correction”, IEEE
Trans. Circuits Syst. Video Tech., vol. 13, no. 12, pp. 1170-1181, Dec. 2003.
[70] N. Thomos, N. V. Boulgouris, M. G. Strintzis, “Wireless Image Transmission Using
Turbo Codes and Optimal Unequal Error Protection”, IEEE Transactions on Image
Processing, vol. 14, no. 11, Nov. 2005.
[71] N. Thomos, N. V. Boulgouris, M. G. Strintzis, “Optimized Transmission of JPEG2000
Streams Over Wireless Channels”, IEEE Transactions on Image Processing, vol. 15,
no. 1, pp. 54-67, Jan. 2006.
[72] A. Said, W. A. Pearlman, “A New Fast and Efficient Image Codec Based on Set
Partitionning in Hierarchical Trees”, IEEE Trans. Circuits and Systems for Video
Technology, vol. 6, no. 3, pp. 243-250, Jun. 1996.
149
BIBLIOGRAPHIE
[73] M. Agueh, J.-F. Diouris, M. Diop, F.-O. Devaux, “Dynamic channel coding for efficient
Motion JPEG 2000 video streaming over Mobile Ad Hoc Networks”, in Proceedings of
the 3rd International Mobile Multimedia Communications Conference, Nafpaktos,
Greece, Aug. 2007.
[74] M. Agueh, J.-F. Diouris, M. Diop, F.-O. Devaux, C. De Vleeschouwer, B. Macq,
“Optimal JPWL Forward Error Correction Rate Allocation for Robust JPEG 2000
Images and Video Streaming over Mobile Ad Hoc Networks”, EURASIP Journal on
Advances in Signal Processing, May 2008.
[75] M. Agueh, S. Ataman, C. Mairal, H. Soude, “Scalable and Robust Wireless JPEG 2000
Images and Video Transmission with Adaptive Bandwidth Estimation”, International
Journal on Advances in Telecommunications, vol. 3, no. 1-2, pp. 49-58, 2010.
[76] G. Baruffa, P. Micanti, F. Frescura, “Error Protection and Interleaving for Wireless
Transmission of JPEG 2000 Images and Video”, IEEE Transactions on Image
Processing, vol. 18, no. 2, pp. 346-356, Feb. 2009.
[77] M. F. Sabir, R. W. Heath, Jr., A. C. Bovik, “An Unequal Error Protection for Multiple
Input Multiple Output Systems”, in Proc. Record of the 36th Asilomar Conf. on Sig.,
Syst., and Comp., vol. 1, pp. 575-579, Nov. 2002.
[78] W. Yu, Z. Safar, K. J. Ray Liu, “Rate Efficient Wireless Image Transmission using
MIMO-OFDM”, Technical Report, Institute of Systems Research, University of
Maryland, TR 2003-30, August 2003.
[79] R. Colda, C. Perrine, J. Cances, R. Vauzelle, T. Palade, “Content-Based Image Unequal
Error Protection Strategies for an Open Loop MIMO System”, International Journal of
Communications, Network and System Sciences, vol. 5, no. 1, pp. 72-80, 2012.
[80] M. Padmaja, K. Prasuna, “Optimized RMSE Power Allocation for Wireless Image
Transmission Using binary DPSK Over Rayleigh Fading Channel”, International
Journal of Electronics and Computer Science Engineering, vol. 1, no. 2, pp. 572-577,
2012.
[81] L. Atzori, “Transmission of JPEG2000 Images over Wireless Channels with Unequal
Power Distribution”, IEEE Trans. Cons. Electron., vol. 49, no. 11, pp. 883-888, Nov.
2003.
[82] L. Atzori, M. Murroni, V. Popescu, “JPEG2000 Images Transmission over Noisy
Wireless Channels with Unequal Power Distribution Wavelet Transmultiplexing”,
International Conference on Optimization of Electrical and Electronic Equipment,
2006.
[83] A. Bin Sediq, M. El Tarhuni, “MMSE Power Allocation for Image and Video
Transmission Over Wireless Channels”, in Proceedings of the 16th IEEE International
Symposium on Personal, Indoor and Mobile Radio Communications PIRMC’05, 2005.
[84] M. El-Tarhuni, M. Assan, A. Bin Sediq, “A Joint Power Allocation and Adaptive
Channel Coding Scheme for Image Transmission over Wireless Channels”, Journal of
Computer Networks and Communications (IJCNC), vol. 2, no. 3, May 2010.
150
BIBLIOGRAPHIE
[85] V. Lecuire, C. Duran-Faundez, N. Krommenacker, “Energy-efficient image
transmission in sensor networks”, International Journal of Sensor Networks, vol. 4, no.
1-2, pp. 37-47, 2008.
[86] S. Appadwedula, M. Goel, N. Shanbhag, D. Jones, K. Ramchandran, “Total system
energy minimization for wireless image transmission”, The Journal of VLSI Signal
Processing, vol. 27, no. 1-2, pp. 99-117, 2004.
[87] G. H. Hakonsen, T. A. Ramstad, A. Gjendemsj, “Image Transmission With Adaptive
Power and Rate Allocation over Flat Fading Channels Using Joint Source Channel
Coding”, Communications in Computer and Information Science, vol. 9, pp. 312-321,
Jul. 2008.
[88] M. Sabir, R. Heath, H. Sheikh, A. Bovik, “A joint source-channel distortion model for
JPEG compressed image”, IEEE Transactions on Image Processing, vol. 15, no. 6, pp.
1349-1364, Feb. 2006.
[89] M. Torki and A. Hajshirmohammadi, “Unequal Power Allocation for Transmission of
JPEG2000 Images over Wireless Channels”, IEEE Global Telecom. Conference,
GLOBCOM, 2009.
[90] M. Shayegannia, A. Hajshirmohammadi, S. Muhaidat, M. Torki, “An OFDM Based
System for Transmission of JPEG2000 Images Using Unequal Power Allocation”, IEEE
Wireless Communications and Networking Conference, WCNC, Apr. 2012.
[91] M. Shayegannia, S. Muhaidat, A. Hajshirmohammadi, “Transmission of JPEG2000
Images in an Uplink Cellular Network with UPA and SCFDE: A System Description”,
the 8th International Conference on Wireless and Mobile Communications ICWMC
2012, pp. 154-158, Venice, Italy, Jun. 2012.
[92] N. Al-Dhahir, ”Single Carrier Frequency Domain Equalization for Space-Time BlockCoded Transmissions over Frequency-Selective
Fading Channels”, IEEE
Communications Letters , vol. 5, no. 7, pp. 304-306, 2001.
[93] M. F. Sabir, A. C. Bovik, R. W. Heath, Jr., “Unequal Power Allocation for JPEG
Transmission Over MIMO Systems”, IEEE Transactions on Image Processing, vol. 19,
no. 2, pp. 410-421, Feb. 2010.
[94] R. Deepa, K. Baskaran, “MIMO Based Efficient JPEG Image Transmission and
Reception by Multistage Receivers”, International Journal of Computer Applications,
vol. 1, no. 15, pp. 13-23, 2010.
[95] R. Deepa, K. Baskaran, “An Adaptive Power Allocation Scheme for Robust
Transmission of JPEG Compressed Images Over MIMO-OFDM Systems”,
International Journal of Engineering Science and Technology (IJEST), vol. 2, no. 7, pp.
3120-3127, 2010.
[96] A. Schertz, C. Weck, “Modulation hiérarchique”, UER – Revue Technique – Sélection
2003, Apr. 2003.
151
BIBLIOGRAPHIE
[97] Y. Noh, H. Lee, I. Lee, “Design of Unequal Error Protection for MIMO-OFDM
Systems”, in the 61st IEEE Vehicular Technology Conference VTC’05-Spring, vol. 2,
pp. 1058-1062, Jun. 2005.
[98] Y. Noh, H. Lee, W. Lee, I. Lee, “Design of Unequal Error Protection for MIMO-OFDM
Systems with Hierarchical Signal Constellations”, Journal of Communications and
Networks, vol. 9, no. 2, pp. 167-176, Jun. 2007.
[99] F.-X. Coudoux, P. Corlaix, M. Gazalet, D. Bueche, M. Slachciak, “On the use of
hierarchical modulation for robust video transmission over power line medium”,
International Symposium on Power Line Communications ISPLC 2007, pp. 471-475,
Pise, Italie, Mar. 2007.
[100] S. S. Arslan, P. C. Cosman, L. B. Milstein, “Coded Hierarchical Modulation for
Wireless Progressive Image Transmission”, IEEE Transactions on Vehicular
Technology, vol. 60, no. 9, pp. 4299-4313, Nov. 2011.
[101] S. Catreux, V. Erceg, D. Gesbert, R. W. Heath, Jr., “Adaptive Modulation and MIMO
Coding for Broadband Wireless Data Networks”, IEEE Communications Magazine, ,
vol. 40, no. 6, pp. 108-115, Jun. 2002.
[102] C.-B. Chae, A. Forenza, R. W. Health, Jr. M. R. Mckay, I. B. Collings, “Adaptive
MIMO Transmission Techniques for Broadband Wireless Communications Systems”,
IEEE Communications Magazine, vol. 48, no. 5, pp. 112-118, May 2010.
[103] M. El-Tarhuni, M. Hassan, A. Bin Sediq, “A Jointly Variable M-QAM and Power
Allocation Scheme for Image Transmission”, Journal of Computer Networks and
Communications, vol. 2012, Article ID 642649, 2012.
[104] S. S. Tan, M. J. Rim, P. C. Cosman, L. B. Milstein, “Adaptive Modulation for OFDMbased Multiple Description Progressive Image Transmission”, IEEE Global
Telecommunications Conference GLOBECOM’08, Dec. 2008.
[105] S. S. Tan, M. J. Rim, P. C. Cosman, L. B. Milstein, “Variance-Aware Adaptive
Modulation for OFDM-Based Multiple Description Progressive Image Transmission”,
IEEE International Conference on Communications ICC’10, Cape Town, South
Africa, May. 2010.
[106] V. K. Goyal, Multiple Description Coding: Compression meets the network, IEEE
Signal Processing Magazine, vol. 18, no. 5, pp. 74-93, Sep. 2011.
[107] Y. Sun, Z. Xiong, “Progressive Image Transmission Over Space-Time Coded OFDMbased MIMO Systems With Adaptive Modulation”, IEEE Trans. Mobile Comp., vol.
4, no. 8, pp. 1016-1028, Aug. 2006.
[108] E. Ohlmer, G. Fettweis, “Link Adaptation in Linearly Precoded Closed-Loop MIMOOFDM Systems with Linear Receivers”, IEEE International Conference on
Communications ICC’09, Dresden, Germany, 2009.
[109] H. Houas, C. Barras, I. Fijalkow, “Ressources Allocation Optimization For Scalable
Multimedia Data Subject To Quality Of Service Constraints”, IEEE Signal Processing
Advances in Wireless Communications SPAWC, Cannes, France, 2006.
152
BIBLIOGRAPHIE
[110] H. Houas, C. Barras, I. Fijalkow, “Allocation de ressources pour la transmission de
données scalables sous contrainte de QoS sur canal OFDM”, GRETSI 2007, Troyes,
France, Sep. 2007.
[111] H. Houas, C. Barras, I. Fijalkow, “A New Transmission Strategy for Scalable
Multimedia Data on OFDM Systems”, the 15th European Signal Processing
Conference EUSIPCO’07, Poznan, Poland, Sep. 2007.
[112] H. Houas, C. Baras, I. Fijalkow, “Resources allocation for the transmission of scalable
images on OFDM systems”, IEEE International Conference on Communications
ICC’09, Dresden, Germany, 2009.
[113] C. Cozzo, B. Hughes, “Joint channel estimation and data detection in space-time
communications”, IEEE Transactions on Communications, vol. 51, no. 8, pp. 12661270, Aug. 2003.
[114] M. Dong, T. Long, “Optimal design and placement of pilot symbols for channel
estimation”, in Proceedings of the IEEE International Conference on Acoustics,
Speech, and Signal Processing ICASSP’11, USA, May 2011.
[115] Y. G. Li, “Simplified channel estimation for OFDM systems with multiple transmit
antennas”, Transactions on Wireless Communications, vol. 1, no. 1, pp. 67-75, Jan.
2002.
[116] J. Letessier, “Performances théoriques de systèmes MIMO pré-égalisés et applications
avec un simulateur de propagation 3D”, Thèse de doctorat de l’Université de Bretagne
Occidentale, Nov. 2005.
[117] L. Collin, O. Berder, P. Rostaing, G. Burel, “Optimal minimum distande-based
precoder for MIMO spatial multiplexing systems”, in IEEE Transactions on Signal
Processing, vol. 52, no. 3, pp. 617-627, 2004.
[118] S. Boyd, L. Vandenberghe, “Convex Optimization”, Cambridge University Press,
2004.
[119] P. Rostaing, O. Berder, L. Collin, G. Burel, “Minimum BER Diagonal Precoder for
MIMO Digital Transmissions”, Signal Processing, vol. 82, no. 10, pp. 1477-1480,
2002.
[120] R. M. Corless, G. H. Gonnet, D. E. G. Hare, D. J. Jeffrey, D. E. Knuth, “On the
Lambert W Function”, Advances in Computational Mathematics, vol. 5, pp. 329-359,
1996.
[121] Q. Tuong, O. Berder, B. Vrigneau, O; Sentieys, “Minimum distance based precoder
for MIMO-OFDM systems using a 16-QAM modulation”, IEEE International
Conference on Communications ICC’09, Germany, 2009.
[122] B. Vrigneau, J. Letessier, P. Rostaing, L. Collin, G. Burel, “Extension of the MIMO
Precoder based on the Minimum Euclidean Distance : a cross-form matrix”, IEEE
Signal Processing, vol. 2, no. 2, pp. 135-146, May 2008.
153
BIBLIOGRAPHIE
[123] M. Nauge, M.-C. Larabi, C. Fernandez, “Benchmark de métriques de qualité sur bases
de données d’images compressées”, dans Codage et Représentation des Signaux
Audiovisuels CORESA 2010, Lyon, France, Oct. 2010.
[124] Z. Wang, A. C. Bovik, H. R. Sheikh, E. P. Simoncelli, “Image quality assessment:
From error visibility to structural similarity”, IEEE Transactions on Image Processing,
vol. 13, no. 4, pp. 600-612, Apr. 2004.
[125] P. J. Smith, L. M. Garth, M. Shafi, “Performance Analysis of Multiple-Input Multiple
Output Singular Value Decomposition Transceivers During Fading and Other Cells
Interference”, IET Microwaves, Antennas and Propagation, vol. 1, no. 6, pp. 11111119, 2007.
[126] B. Vrigneau, P. Rostaing, L. Collin, K. Yao, “Comparaison du précodeur Max-dmin
avec les OSTBC et le précodeur Max-SNR pour les systèmes MIMO”, GRETSI 2005,
Louvain-La-Neuve, Belgique, Sep. 2005.
[127] P. Ubaidulla, A. Chockalingam, “Relay Precoder Optimization in MIMO-Relay
Networks With Imperfect CSI”, in IEEE Transactions on Signal Processing, vol. 59,
no. 11, Nov. 2011.
[128] Y. Lu, Y. Zhao, F. Kuipers, P. V. Mieghem, “Measurement Study of Multi-party
Video Conferencing”, Lecture Notes in Computer Science NETWORKING 2010, vol.
6091, pp. 96-108, 2010.
[129] F. De Moor, W. Joseph, I. Ketyko, E. Tanghe, T. Deryckere, L. Martens, L. De Marez,
“Linking Users’ Subjective QoE Evaluation to Signal Strength in an IEEE 802.11b/g
Wireless LAN Environment”, in EURASIP Journal on Wireless Communications and
Networking, volume 2010, article ID 541568, 2010.
[130] F. De Simone, M. Naccari, M. Tagliasacchi, F. Dufaux, S. Tubaro, T. Ebrahim,
“Subjective Quality Assessment of H.264/AVC Video Streaming with Packet Losses”,
EURASIP Journal on Image and Video Processing, (special issue on Quality of
Multimedia Experience), vol. 2011.
[131] S. Winkler, F. Dufaux, D. Barba, V. Baroncini, “Editorial - Special Issue on Image
and Video Quality Assessment”, Signal Processing: Image Communication, vol. 25,
no. 7, pp. 467-468, Aug. 2010.
[132] P. Marziliano, F. Dufaux, S. Winkler, T. Ebrahimi, “Perceptual Blur and Ringing
Metrics: Application to JPEG2000”, Signal Processing: Image Communication, vol.
19, no. 2, pp. 163-172, Feb. 2004.
[133] F. De Simone, D. Ticca, F. Dufaux, M. Ansorge and T. Ebrahimi, “A Comparative
Study of Color Image Compression Standards using Perceptually-driven Quality
Metrics”, in SPIE Proc. Applications of Digital Image Processing XXXI, San Diego,
CA, August 2008.
[134] F. De Simone, F. Dufaux, T. Ebrahimi, C. Delogu, V. Baroncini, “A Subjective Study
of the Influence of Color Information on Visual Quality Assessment of High
Resolution Pictures”, in Proc. 2009 International Workshop on Video Processing and
Quality Metrics (VPQM 2009), Scottsdale, AZ, Jan. 2009.
154
BIBLIOGRAPHIE
[135] F. Marini, “Content Based No-Reference Image Quality Metrics”, Thèse de doctorat
de l’Université de Milan, 2011.
[136] M. Nauge, M.-C. Larabi, C. Fernandez, “A reduced-reference metric based on the
interest points in color images”, in PCS’2010, pp. 610-613, Nagoya, Japan, 2010.
[137] “ITU-R recommendation BT.500-12: Methodology for the subjective assessment of
the quality of television picture (PEVQ)”, Aug. 2009.
[138] A. Zribi, R. Pyndiah, S. Zaibi, F. Guilloud, A. Bouallegue, “Low-Complexity Soft
Decoding of Huffman Codes and Iterative Joint/Source Channel Decoding”, in IEEE
Transactions on Communications, vol. 60, no. 6, pp. 1669-1679, Jun. 2012.
[139] S. Zaibi, A. Zribi, R. Pyndiah, N. Aloui, “Joint source/channel iterative arithmetic
decoding with JPEG 2000 image transmission application”, in EURASIP Journal on
Advances in Signal Processing 2012, 2012:114.
155
LISTE DE PUBLICATIONS
Articles dans des revues internationales à comité de lecture
[1]
J. Abot, C. Olivier, C. Perrine, Y. Pousset, “A Link Adaptation Scheme Optimized for
Wireless JPEG 2000 Transmission over Realistic MIMO Systems”, in Signal
Processing: Image Communication, 2012, DOI: 10.1016/j.image.2012.08.003.
Communications dans des conférences internationales à comité de lecture
[1]
J. Abot, Y. Pousset, C. Olivier, C. Perrine, “A Content-based Precoding Solution
Designed for Wireless JPEG 2000 Transmission”, in European Signal Processing
Conference EUSIPCO 2012, Bucarest, Romania, Aug. 2012.
[2]
J. Abot, C. Perrine, Y. Pousset, C. Olivier, “An Unequal Power Allocation Designed
For Wireless JPEG 2000 Transmission Over MIMO Systems”, in IEEE International
Symposium on signal, Image, Video and Communications ISIVC 2012, Valenciennes,
France, Jul. 2012.
[3]
J. Abot, M. Nauge, C. Perrine, M.-C. Larabi, C. Bergeron, Y. Pousset, C. Olivier, “A
Robust Content-based JPWL Transmission Over a Realistic MIMO Channel Under
Perceptual Constraints”, in IEEE International Conference on Image Processing ICIP
2011, pp. 3241-3244, Belgium, Brussel, Sep. 2011.
Communications dans des conférences nationales à comité de lecture
[1]
J. Abot, M. Nauge, C. Perrine, M.-C. Larabi, C. Bergeron, C. Olivier, Y. Pousset,
“Maximisation Perceptuelle de la Qualité de Transmission JPWL via un Canal MIMO
Réaliste”, dans Groupement de Recherche en Traitement du Signal et de l’Image
GRETSI 2011, Bordeaux, France, Sep. 2011.
[2]
J. Abot, C. Perrine, C. Olivier, Y. Pousset, “Transmission robuste de vidéo basée
ondelette à travers un canal MIMO”, dans Codage et Représentation des Signaux
Audiovisuels CORESA 2010, Lyon, France, Oct. 2010.
157
Résumé : Ce travail de thèse présente une stratégie de transmission exploitant la
diversité spatiale pour la transmission d’images sur canal sans fil. On propose
ainsi une approche originale mettant en correspondance la hiérarchie de la source
avec celle des sous-canaux SISO issus de la décomposition d’un canal MIMO. On
évalue les performances des précodeurs usuels dans le cadre de cette stratégie via
une couche physique réaliste, respectant la norme IEEE802.11n, et associé à un
canal de transmission basé sur un modèle de propagation à tracé de rayons 3D. On
montre ainsi que les précodeurs usuels sont mal adaptés pour la transmission d’un
contenu hiérarchisé. On propose alors un algorithme de précodage allouant
successivement la puissance sur les sous-canaux SISO afin de maximiser la
qualité des images reçues. Le précodeur proposé permet d’atteindre un TEB cible
compte tenu du codage canal, de la modulation et du SNR des sous-canaux SISO.
A partir de cet algorithme de précodage, on propose une solution d’adaptation de
lien permettant de régler dynamiquement les paramètres de la chaîne en fonction
des variations sur le canal de transmission. Cette solution détermine la
configuration de codage/transmission maximisant la qualité de l’image en
réception. Enfin, on présente une étude sur la prise en compte de contraintes
psychovisuelles dans l’appréciation de la qualité des images reçues. On propose
ainsi l’intégration d’une métrique à référence réduite basée sur des contraintes
psychovisuelles permettant d’assister le décodeur vers la configuration de
décodage offrant la meilleure qualité d’expérience. Des tests subjectifs confirment
l’intérêt de l’approche proposée.
Mot clés : Codage conjoint source-canal, canal MIMO réaliste, précodage
MIMO, Wireless JPEG 2000, Qualité de Service, Qualité d’Expérience.
Abstract : This thesis presents a transmission strategy for exploiting the spatial
diversity for image transmission over wireless channel. We propose an original
approach based on the matching between the source hierarchy and the SISO subchannels hierarchy, resulting from the MIMO channel decomposition. We
evaluate common precoder performance in the context of this strategy via a
realistic physical layer respecting the IEEE802.11n standard and associated with a
transmission channel based on a 3D-ray tracer propagation model. It is shown that
common precoders are not adapted for the transmission of a hierarchical content.
Then, we propose a precoding algorithm which successively allocates power over
SISO sub-channels in order to maximize the received images quality. The
proposed precoder achieves a target BER according to the channel coding, the
modulation and the SISO subchannels SNR. From this precoding algorithm, we
propose a link adaptation scheme to dynamically adjust the system parameters
depending on the variations of the transmission channel. This solution determines
the optimal coding/transmission configuration maximizing the image quality in
reception. Finally, we present a study for take into account some psychovisual
constraints in the assessment of the received images quality. We propose the
insertion of a reduced reference metric based on psychovisual constraints, to assist
the decoder in order to determine the decoding configuration providing the highest
quality of experience. Subjective tests confirm the interest of the proposed
approach.
Keywords : Joint Source Channel Coding, realistic MIMO channel, MIMO
precoding, Wireless JPEG 2000, Quality of Service, Quality of Experience.