Analyse par ondelettes - Institut de Mathématiques de Bordeaux

Transcription

Analyse par ondelettes
Notes de cours
Master 2 Professionnel IMAT
Université Paul Sabatier - Toulouse III
Jérémie BIGOT
Septembre 2009
2
Introduction
Ces notes de cours sont une présentation succinte des méthodes d’analyse tempséchelles basées sur des décomposition en ondelettes. Ces techniques ont de très nombreuses applications dans les sciences physiques et les sciences de l’ingénieur en particulier pour l’estimation et la compression de signaux. Ces notes de cours s’inspire
largement du livre de Stéphane Mallat [7] qui est l’une des meilleures références
sur l’analyse de signaux par ondelettes. Les ouvrages suivants, dont on peut trouver les références dans la bibliographie, peuvent également être consultés pour des
applications plus spécificiques de l’analyse par ondelettes ou pour des compléments
mathématiques :
–
–
–
–
–
[1] : applications des ondelettes en statistique,
[2] : applications des ondelettes en médecine et biologie,
[3] : applications des ondelettes pour l’analyse des turbulences en physique,
[4] : applications des ondelettes en analyse numérique
[5] : un des ouvrages de référence en mathématiques appliquées sur la théorie
des ondelettes
– [6] : analyse de Fourier et applications au filtrage, calcul numérique et ondelettes,
– [7], [8] : un des ouvrages de référence sur l’analyse en ondelettes qui présente
de nombreux développements théoriques et pratiques, il s’agit d’un livre très
complet.
– [9] : analyse continue par ondelettes.
3
4
Table des matières
1 Représentations temps-fréquence
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 La transformée de Fourier . . . . . . . . . . . . . . . . . . . . .
1.2.1 Rappel de quelques propriétés . . . . . . . . . . . . . . .
1.2.2 Transformée de Fourier Inverse . . . . . . . . . . . . . .
1.2.3 Produit de convolution . . . . . . . . . . . . . . . . . . .
1.2.4 Quelques exemples de transformée de Fourier . . . . . .
1.2.5 Limitations de la transformée de Fourier . . . . . . . . .
1.2.6 Principe d’incertitude d’Heisenberg . . . . . . . . . . . .
1.3 La transformée de Gabor . . . . . . . . . . . . . . . . . . . . . .
1.3.1 Inversion de la transformée de Gabor . . . . . . . . . . .
1.3.2 Redondance et noyau reproduisant . . . . . . . . . . . .
1.3.3 Taille des boı̂tes d’Heisenberg . . . . . . . . . . . . . . .
1.3.4 Quelques exemples de transformée de Gabor . . . . . . .
1.3.5 Le problème du choix de la fenêtre . . . . . . . . . . . .
1.4 La transformée en ondelettes continue . . . . . . . . . . . . . . .
1.4.1 Inversion de la transformée en ondelettes continue . . . .
1.4.2 Redondance et noyau reproduisant . . . . . . . . . . . .
1.4.3 Taille des boı̂tes d’Heisenberg . . . . . . . . . . . . . . .
1.4.4 Quelques exemples de transformée en ondelettes continue
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2 Transformée en ondelette continue et régularité d’un signal
2.1 Analyse de la régularité d’un signal unidimensionnel . . . . . . . . . .
2.1.1 Régularité Lipschitzienne . . . . . . . . . . . . . . . . . . . . .
2.1.2 Ondelette et nombre de moments nuls . . . . . . . . . . . . .
2.1.3 Amplitude des coefficients d’ondelettes et régularité d’un signal
2.1.4 Maxima d’ondelettes . . . . . . . . . . . . . . . . . . . . . . .
2.2 Analyse de la régularité d’une image . . . . . . . . . . . . . . . . . .
2.2.1 Extension de la transformée en ondelette pour des images . . .
2.2.2 Transformée en ondelette dyadique bidimensionnelle . . . . . .
2.2.3 Régularité Lipschitzienne . . . . . . . . . . . . . . . . . . . . .
2.2.4 Détecteur de Canny . . . . . . . . . . . . . . . . . . . . . . . .
2.2.5 Maxima d’ondelette pour des images . . . . . . . . . . . . . .
5
7
7
8
8
9
10
10
11
12
13
14
15
15
16
18
18
20
20
21
21
25
25
25
26
27
28
31
31
31
33
33
34
6
3 Bases d’ondelettes
3.1 Bases orthonormées d’ondelettes . . . . . . . . . . . . . . . . . . . .
3.1.1 Quelques rappels sur les bases hilbertiennes . . . . . . . . .
3.1.2 Analyse multirésolution de L2 (R) . . . . . . . . . . . . . . .
3.1.3 Filtres mirroirs conjugués . . . . . . . . . . . . . . . . . . .
3.1.4 Ondelettes orthogonales . . . . . . . . . . . . . . . . . . . .
3.2 Construction de bases d’ondelettes . . . . . . . . . . . . . . . . . .
3.2.1 Liens entre filtres, nombre de moments nuls et régularité de
l’ondelette . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.2 Quelques exemples classiques d’ondelettes . . . . . . . . . .
3.2.3 Ondelettes sur un intervalle borné . . . . . . . . . . . . . . .
3.2.4 Ondelettes et bancs de filtres . . . . . . . . . . . . . . . . .
3.3 Bases d’ondelettes pour des images . . . . . . . . . . . . . . . . . .
3.3.1 Bases d’ondelettes séparables et multirésolution en 2D . . .
3.3.2 Algorithme rapide de transformée en ondelettes 2D . . . . .
3.3.3 Quelques exemples de décomposition en ondelettes pour des
images . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4 Approximation, estimation et compression dans des bases
lettes
4.1 Propriétés d’approximation des bases d’ondelettes . . . . . .
4.1.1 Décroissance des coefficients d’ondelettes . . . . . . .
4.1.2 Approximation linéaire de fonctions régulières . . . .
4.1.3 Approximation linéaire de fonctions non-régulières . .
4.1.4 Approximation non-linéaire . . . . . . . . . . . . . .
4.1.5 Quelques exemples d’approximation de fonctions . . .
4.1.6 Approximation d’images . . . . . . . . . . . . . . . .
4.1.7 Quelques exemples d’approximation d’images . . . .
4.2 Débruitage de fonctions 1D . . . . . . . . . . . . . . . . . .
4.3 Compression d’images . . . . . . . . . . . . . . . . . . . . .
4.4 Problèmes inverses . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
37
37
37
38
41
42
44
.
.
.
.
.
.
.
44
46
47
51
53
53
54
. 55
d’onde.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
59
59
59
60
61
62
63
63
64
64
67
70
Chapitre 1
Représentations temps-fréquence
1.1
Introduction
Que ce soit en mathématiques ou en physique, la transformée de Fourier a été
pendant longtemps un des outils les plus utilisés pour le traitement du signal. Cette
représentation, basée sur la notion physique de fréquence, est bien adaptée pour
traiter des signaux stationnaires c’est à dire des signaux qui possèdent certaines
propriétés invariantes dans le temps. Par contre, la transformée de Fourier n’est pas
optimale pour la description de phénomènes transitoires et se révèle donc imparfaite
pour l’analyse de la plupart signaux rencontrés en pratique.
La principale limitation de la transformée de Fourier est qu’elle ne permet pas
une description locale (sur une partie finie) d’un signal. Pour remedier à ces limitations, des représentations dites temps-fréquence ont été proposées afin d’analyser un
signal à l’aide d’une transformation paramétrée par deux variables : le temps (ou la
position) et la fréquence (ou échelle). Tout au long de ce cours, nous considérerons
qu’un signal f (t) est une fonction réelle du temps (e.g. R 7→ R) ou bien de l’espace (e.g. R2 7→ R). Une représentation temps-fréquence est une transformation qui
associe à un signal f (t) une fonction réelle de deux variables Tf (x, ξ), où x est le
paramètre de temps ou de position et ξ est le paramètre de fréquence ou d’échelle.
Les représentations temps-fréquence que nous verrons dans ce cours, consistent à
projeter une fonction f sur des fonctions analysantes gx,ξ , ce qui revient à calculer
le produit scalaire :
Tf (x, ξ) = hf, gx,ξ i =
Z
f (t)gx,ξ (t)dt.
Les représentations qui nous intéressent sont celles qui permettent :
– d’avoir des propriétés d’invariance par rapport à des transformations simples
d’un signal (translation, dilatation, modulation...)
– d’obtenir des informations sur la structure locale (en temps et en fréquence)
d’un signal
– la reconstruction (exacte) du signal à partir des coefficients Tf (x, ξ)
7
8
Dans le cas uni-dimensionnel (x ∈ R) les valeurs de la fonction Tf (x, ξ) seront
représentées dans le plan temps-échelle. Il s’agit d’une représentation graphique qui
permet de visualiser le contenu temporel (axe des abcisses) et fréquentiel (axe des
ordonnées) des signaux étudiés.
Dans ce chapitre, nous rappelerons quelques propriétés de la transformée de Fourier, puis nous introduirons la transformée de Gabor et la transformée en ondelettes
continue. Quelques exemples simulés seront utilisés pour illustrer les limitations et
les avantages de chaque transformation.
1.2
La transformée de Fourier
Dans ce chapitre, nous travaillerons essentiellement avec des fonctions unidimensionnelles. L’espace L1 (R) Rest l’ensemble des fonctions (réelles ou complexe) qui sont
+∞
intégrables i.e. telles que −∞ |f (t)|dt < +∞. De même L2 (R) est l’ensemble des
R +∞
fonctions de carré intégrable i.e. telles que −∞ |f (t)|2dt < +∞. Nous rappelons que
L2 (R) est un espace de Hilbert pour le produit scalaire :
Z +∞
f (t)g(t)dt,
−∞
pour f, g ∈ L2 (R), et où g(t)qdénote le conjugué de g(t). La norme d’une fonction
R +∞
|f (t)|2dt.
f ∈ L2 (R) sera notée kf k =
−∞
1.2.1
Rappel de quelques propriétés
En 1807, Fourier présente un mémoire à l’Institut de France qui propose de
représenter toute fonction périodique comme une somme de sinusoı̈des à différentes
fréquences. C’est le début de l’analyse de Fourier qui va avoir une importance
déterminante en analyse mathématique, en physique et dans les sciences de l’ingénieur.
Définition 1.1 La transformée de Fourier d’une fonction f ∈ L1 (R) est définie
par :
Z +∞
ˆ
f (ω) =
f (t)e−iωt dt.
−∞
Elle mesure la “vitesse” des oscillations de la fonction f à la fréquence ω ∈ R.
Cette transformation peut être vue comme la projection de f sur des fonctions
analysantes qui sont des “ondes pures” : gx,ξ (t) = e−iξt qui ne dépendent pas du
paramètre de temps x. Celle-ci permet donc d’analyser le contenu fréquentiel d’un
signal. Le théorème de Rieman-Lebesgue assure que :
– f 7→ fˆ est une application linéaire, continue de L1 (R) dans L∞ (R).
– si f ∈ L1 (R) alors fˆ est continue sur R et limω→±∞ fˆ(ω) = 0
9
Parmi les principales propriétés de la transformée de Fourier qui sont souvent
utilisées dans les calculs, on peut citer :
Propriété
Fonction Transformée de Fourier
ˆ
Translation
f (t − t0 )
e−iωt0 f(ω)
iω0 t
Modulation
fˆ(ω − ω0 )
e f (t)
f (t/a)
|a|fˆ(aω)
Dilatation/Contraction
(p)
Derivation
f (t)
(iω)p fˆ(ω)
ˆ
Symétrie Hermitienne
f(−ω)
= fˆ(ω)
f (t) ∈ R
Si f ∈ L1 (R), f ′ ∈ L1 (R), . . . , f (p) ∈ L1 (R) alors fˆ(ω) = oω→±∞ ( ω1p ). De plus si
Z +∞
|fˆ(ω)|(1 + |ω|)p dω < +∞,
−∞
alors f est p fois continûment différentiable et bornée. La décroissance de fˆ en l’infini
est donc caractéristique de la régularité de f .
1.2.2
Transformée de Fourier Inverse
Il n’est pas évident de définir la transformée de Fourier inverse, car l’espace
L1 (R) n’est pas invariant par cette transformation. L’espace qui est bien adaptée
pour définir et inverser la transformée de Fourier est l’espace L2 (R). Toutefois, il n’est
pas possible de définir “directement” la transformée
fonction dans L2 (R). Il est
T d’une
2
1
nécessaire de se restreindre tout d’abord à L (R) L (R) pourT
définir correctement
2
la transformée de Fourier, puis d’utiliser la densité de L (R) L1 (R) dans L2 (R)
pour étendre cette transformation et son inverse à L2 (R). Le théorème fondamental
de la transformée de Fourier dans L2 (R) est le suivant (pour de plus amples détails
on pourra se référer à [6]) :
Théorème 1.1 Soit f ∈ L2 (R), on définit alors formellement la transformée de
Fourier et son inverse par :
Z +∞
ˆ
f (ω) =
f (t)e−iωt dt
−∞
Z +∞
1
f (t) =
fˆ(ω)eiωt dω
2π −∞
Soit f, g ∈ L2 (R), on obtient alors la formule de Parseval
Z +∞
Z +∞
1
f (t)h(t)dt =
fˆ(ω)ĥ(ω)dω,
2π
−∞
−∞
et la formule de Plancherel
Z +∞
−∞
1
|f (t)| dt =
2π
2
Z
+∞
−∞
2
ˆ
|f(ω)|
dω.
10
Remarque : pour f ∈ L2 (R)\L1 (R), la transformée de Fourier et son inverse sont
définies au sens d’une limite dans L2 (convergence forte dans L2 ) :
Z +∞
ˆ
f (ω) =
f (t)e−iωt dt
−∞
Z +T
f (t)e−iωt dt
lim
T →∞
1.2.3
−T
Produit de convolution
Définition 1.2 Pour f ∈ L1 (R) et h ∈ L1 (R) le produit de convolution de f et g,
noté f ⋆ h, est défini par :
Z +∞
f ⋆ h(t) =
f (t − u)h(u)du.
−∞
Alors, f ⋆ h ∈ L1 (R) est défini presque partout et tel que :
– f ⋆ h = h ⋆ f : commutativité
– dtd (f ⋆ h)(t) = df
⋆ h(t) = f ⋆ dh
(t) : dérivabilité
dt
dt
– f ⋆ δt0 (t) = f (t − t0 ) : convolution avec une masse de Dirac en t0 .
De plus, si l’on note g = f ⋆ h alors :
ˆ ĥ(ω).
ĝ(ω) = f(ω)
Cette propriété est à la base du filtrage linéaire en traitement du signal. En effet,
tout processus de filtrage du type Lf = f ⋆ h où h est la réponse impulsionnelle du
filtre L, peut s’écrire sous la forme d’un filtrage fréquentiel à partir de la transformée
de Fourier inverse :
Z +∞
1
iωt
ˆ
Lf (t) =
ĥ(ω)f(ω)e
dω.
2π −∞
Chaque composante fréquentielle eiωt d’amplitude fˆ(ω) est en effet modulée par
le filtre ĥ(ω). Ainsi, décomposer une fonction comme une intégrale de fonctions sinusoidales complexes eiωt permet de calculer directement la réponse d’un filtre Lf
à partir de la donnée des coefficients ĥ(ω).
Remarque : tous ces résultats pour le produit de convolution sont également valables pour l’extension de la transformée de Fourier à L2 (R).
1.2.4
Quelques exemples de transformée de Fourier
• Soit f (t) = 11[−T,T ] (t) la fonction indicatrice de l’intervalle [−T, T ]. Il s’agit d’une
fonction discontinue en −T et +T qui vaut 1 sur [−T, T ] et zéro en dehors de cet
intervalle. Sa transformée de Fourier est une fonction non intégrable :
2 sin(T ω)
.
fˆ(ω) =
ω
11
• Une masse de Dirac δt0 (t) au point t0 associe à une fonction sa valeur au point
tR = t0 (une “intégration” d’une fonction régulière par rapport à un Dirac est telle que
+∞
f (t)δt0 (t)dt = f (t0 )). La masse de Dirac δt0 (t) est une fonction “très localisée”
−∞
dans le temps (son support se réduit à t = t0 ) dont la transformée de Fourier est
définie comme (voir [6] pour une définition rigoureuse à partir de la théorie des
distributions) :
δ̂t0 (ω) = e−iωt0 .
• Cosinus et Sinus. Posons cosω0 (t) = cos(ω0 t) et sinω0 (t) = sin(ω0 t). Il s’agit
de fonctions oscillantes à une fréquence unique ω0 ce qui se traduit par deux Dirac
dans la transformée de Fourier en ω0 et −ω0 :
cos
ˆ ω0 (ω) = π δ̂ω0 (ω) + δ̂−ω0 (ω)
ˆ ω0 (ω) = π δ̂ω0 (ω) − δ̂−ω0 (ω) .
sin
i
• Un filtre passe-bas idéal a une fonction de transfert du type : ĥ(ω) = 11[−ω0 ,ω0 ] (ω)
qui sélectionne les fréquences comprises entre −ω0 et ω0 . Sa réponse inpulsionelle
est donnée par la transformée de Fourier inverse :
sin(ω0 t)
.
πt
Comme expliqué précédemment, la transformée de Fourier d’un signal permet
d’obtenir des informations sur son contenu fréquentiel. La Figure 1.1 représente une
sinusoı̈de de fréquence 200 Hz (i.e. ω0 = 400π) observée avec un bruit aléatoire qui
correspond au défaut des instruments de mesure et à la présence de parasites. La
transformée de Fourier de ce signal permet de retrouver la fréquence de la sinusoı̈de
malgrè la présence de ce bruit.
h(t) =
5
500
4
450
3
400
2
350
1
300
0
250
−1
200
−2
150
−3
100
−4
−5
50
0
0.1
0.2
0.3
0.4
0.5
(a)
0.6
0.7
0.8
0.9
1
0
0
50
100
150
200
250
300
350
400
450
500
(b)
Fig. 1.1 – (a) Signal : sinus à 200 Hz + bruit et (b) sa transformée de Fourier pour
les fréquences positives (l’axe des abscisses donne ν = ω/2π)
1.2.5
Limitations de la transformée de Fourier
Le principal inconvénient de la transformée de Fourier est qu’elle ne permet pas
une analyse du comportement local d’une fonction. En effet, les fonctions analysantes sont de support infini et il est donc nécessaire de connaı̂tre l’ensemble des
12
valeurs d’une fonction pour pouvoir calculer sa transformée de Fourier. De plus,
cette transformation ne permet pas d’avoir une localisation temporelle du contenu
fréquentiel d’un signal. Par exemple, la Figure 1.2 représente un signal constitué
de deux sinusoı̈des successives de fréquence 10 et 30 Hz (penser à deux notes de
musiques). La transformée de Fourier de ce signal permet de retrouver ces deux
fréquences, mais ne nous informe pas sur la localisation temporelle du changement
de régime dans le signal. De la même façon, la présence d’une discontinuité dans
un signal affecte le comportement de sa transformée de Fourier sur l’ensemble des
fréquences. Par exemple, la transformée de Fourier de la fonction indicatrice de l’intervalle [−T, T ] décroit en 1/ω mais ceci ne permet pas de retrouver la localisation
des deux discontinuités du signal en T et −T .
1
300
0.8
250
0.6
0.4
200
0.2
0
150
−0.2
100
−0.4
−0.6
50
−0.8
−1
0
0.1
0.2
0.3
0.4
0.5
(a)
0.6
0.7
0.8
0.9
1
0
0
50
100
150
200
250
(b)
Fig. 1.2 – (a) Signal : sinus à 10 Hz suivi d’un sinus à 30 Hz et (b) sa transformée
de Fourier pour les fréquences positives (l’axe des abscisses donne ν = ω/2π)
1.2.6
Principe d’incertitude d’Heisenberg
Il semble donc raisonnable de se demander s’il est possible de construire une
fonction f qui soit bien localisée en temps et dont la transformée de Fourier fˆ soit
concentrée dans un petit intervalle de fréquences. Une masse de Dirac au point t0
est une fonction très localisée en temps (son support se réduit à t = t0 ). Toutefois, sa transformée de Fourier e−iωt0 est uniformément répartie sur l’ensemble des
fréquences. La décroissance de la transformée de Fourier fˆ dépend de la régularité
de la fonction f . Ainsi, pour construire une fonction f telle que fˆ soit bien localisée en fréquence, il est nécessaire que f soit suffisamment régulière. Toutefois, les
deux observations suivantes montrent qu’un compromis doit être trouvé entre bonne
localisation temporelle et bonne localisation fréquentielle :
– pour réduire la location temporelle d’une fonction f , il est possible de la
contracter par un facteur s < 1 tout en conservant son énergie (norme L2 )
constante. En effet, si on pose :
1
t
fs (t) = √ f
,
s
s
R +∞
R +∞
√ ˆ
alors −∞ |fs (t)|2 dt = −∞ |f (t)|2dt. Toutefois, fˆs (t) = sf(st)
ce qui montre
13
que la transformée de Fourier de fs est dilaté d’un facteur s. Ainsi, lorqu’on
gagne en location temporelle, on perd en localisation fréquentielle.
– il n’est pas possible de construire une fonction qui soit à support compact et
dont la transformée de Fourier soit également à support compact.
Ces deux remarques illustrent le principe d’incertitude d’Heisenberg qui limite la
possibilité d’une bonne résolution en temps et en fréquence. Le théorème suivant est
une formulation du principe d’incertitude pour le cas unidimensionnel.
1.2 Principe d’incertitude d’Heisenberg : soit f ∈ L2 (R) et kf k2 =
RThéorème
+∞
2
|f (t)| dt. On définit la position moyenne temporelle f¯ et la position fréquentielle
−∞
moyenne ω̄ de f par :
Z +∞
1
¯
f =
t|f (t)|2 dt,
kf k2 −∞
Z +∞
1
2
ˆ
ω|f(ω)|
dω.
ω̄ =
2
2πkf k −∞
Les variances autour de ces moyennes sont définies par :
Z +∞
1
2
(t − f¯)2 |f (t)|2 dt,
σt =
kf k2 −∞
Z +∞
1
2
(ω − ω̄)2 |fˆ(ω)|2dω.
σω =
2
2πkf k −∞
Alors,
1
σt σω ≥ ,
(1.1)
2
et cette inégalité est une égalité si et seulement si f est une Gaussienne i.e de la
2
forme f (t) = Aeiω0 t−B(t−m0 ) .
Les variances temporelles et fréquentielles permettent de quantifier l’étalement
(i.e. la localisation) de f et fˆ autour de leur position moyenne. Ainsi, la relation
(1.1) montre que lorsque la précision temporelle augmente, l’incertitude pour la
localisation en fréquence augmente et réciproquement. Pour remedier aux limitations
de la transformée de Fourier, il est donc nécessaire de projeter un signal sur des
fonctions analysantes qui sont bien localisées en temps et en fréquence. Toutefois,
la résolution temps-fréquence de ces fonctions sera nécessairement limitée par le
principe d’Heisenberg.
1.3
La transformée de Gabor
Afin de remedier au problème de la location temporelle de la transformée de
Fourier, Gabor a proposé en 1946 d’utiliser une transformée de Fourier à fenêtre
14
glissante. Cette transformation consiste à calculer la transformée de Fourier sur
une partie du signal sélectionnée à l’aide d’une fenêtre bien localisée en temps. Des
translations successives de cette fenêtre permettent d’analyser localement le comportement temps-fréquence du signal. La transformée de Gabor revient à projeter
un signal sur des fonctions analysantes de la forme :
gx,ξ (t) = eiξt g(t − x),
où g ∈ L2 (R) est une fenêtre réelle et symmétrique (i.e. g(t) = g(−t)) qui est
translatée dans le temps par x et modulée par la fréquence ξ. Afin de simplifier les
notations, nous supposerons que kgk = 1 ce qui implique que kgx,ξ k = 1.
Définition 1.3 Pour f ∈ L2 (R) et (x, ξ) ∈ R2 , la transformée de Fourier à fenêtre
glissante est définie par
Z +∞
Gf (x, ξ) = hf, gx,ξ i =
f (t)g(t − x)e−iξt dt.
−∞
La fenêtre g(t−x) permet de localiser la transformée de Fourier de f au voisinage
du point x. Lorsque la fenêtre g est une Gaussienne, il s’agit de la transformée de
Gabor. Toutefois, dans ce qui suit, la transformée de Fourier à fenêtre glissante sera
appelée transformée de Gabor (TG) même si g n’est pas une Gaussienne.
1.3.1
Inversion de la transformée de Gabor
La TG est une transformation inversible qui conserve l’énergie du signal comme
le montre le théorème suivant.
Théorème 1.3 Si f ∈ L2 (R) alors (le sens de la formule de reconstruction suivante
dépend des conditions sur f et g) :
Z +∞ Z +∞
1
f (t) =
Gf (x, ξ)g(t − x)eiξt dxdξ,
2π −∞ −∞
et
Z
+∞
−∞
1
|f (t)| dt =
2π
2
Z
+∞
−∞
Z
+∞
−∞
|Gf (x, ξ)|2 dxdξ.
En utilisant la formule de Parseval, on peut remarquer que la TG peut également
s’écrire sous la forme :
Z +∞
1 ˆ
1
Gf (x, ξ) =
hf , ĝx,ξ i =
fˆ(ω)ĝ(ω − ξ)ei(ω−ξ)x dω.
2π
2π −∞
La TG peut donc également s’interpréter comme une transformée de Gabor (à un
facteur de phase prêt) de la transformée de Fourier fˆ. Cett remarque montre que
si la fenêtre g est bien localisée en temps autour de t = 0 et si ĝ est bien localisée
15
en fréquence autour de ω = 0, alors les coefficients de la TG peuvent s’interpréter
comme une analyse locale du comportement de f au voisinage du temps x et de la
fréquence ξ. Il faut donc choisir pour la fenêtre g une fonction suffisamment régulière
afin d’avoir à la fois une bonne localisation en temps et en fréquence. Ceci exclue donc
d’utiliser pour g une fonction indicatrice 11[−T,T ] qui est bien localisée en temps autour
de t = 0, mais donc la localisation en fréquence est très mauvaise (décroissance en
1/ω). A l’inverse, les propriétés temps-fréquences de la Gaussienne sont optimales
car celle-ci “sature” l’inégalité d’Heisenberg, ce qui justifie son utilisation pour la
TG.
1.3.2
Redondance et noyau reproduisant
La TG associe à une fonction f ∈ L2 (R) une fonction à deux variables. D’après
la propriété de conservation de l’énergie Gf (x, ξ) ∈ L2 (R2 ). Toutefois, toute fonction
dans L2 (R2 ) n’est pas nécessairement la TG d’une fonction dans L2 (R). Le théorème
suivant montre que ceci provient de la redondance de la TG.
Théorème 1.4 Soit F ∈ L2 (R2 ). Alors il existe une fonction f ∈ L2 (R) telle que
F (x, ξ) = Gf (x, ξ) si et seulement si :
1
F (x, ξ) =
2π
Z
+∞
−∞
Z
+∞
K(x, ξ, x′ , ξ ′)F (x′ , ξ ′ )dx′ dξ ′,
−∞
où est le noyau reproduisant
K(x, ξ, x′ , ξ ′ ) = hgx,ξ , gx′ ,ξ ′ i,
Le noyau K(x, ξ, x′ , ξ ′ ) mesure la corrélation temps-fréquence entre les fonctions
analysantes gx,ξ et gx′ ,ξ ′ . On peut montrer que l’amplitude de K(x, ξ, x′ , ξ ′) est une
fonction décroissante de x − x′ et ξ − ξ ′ qui dépend uniquement de la localisation
en temps et en fréquence (et donc de l’énergie) de g et ĝ. Plus les distances |x − x′ |
et |ξ − ξ ′ | sont grandes, plus l’amplitude de K(x, ξ, x′ , ξ ′ ) diminue. La redondance
peut donc s’interpréter comme le “taux de répétition” de la même information dans
une transformation.
1.3.3
Taille des boı̂tes d’Heisenberg
On définit la variance temporelle σt2 et la variance fréquentielle σω2 de la fonction
gx,ξ par
σt2
σω2
Z
+∞
2
2
Z
+∞
t2 |g(t)|2dt,
−∞
−∞
Z +∞
Z +∞
1
1
2
2
(ω − ξ) |ĝx,ξ (ω)| dω =
ω 2 |ĝ(ω)|2dω.
=
2π −∞
2π −∞
=
(t − x) |gx,ξ (t)| dt =
16
Etant donné la symmétrie de g et ĝ, on peut facilement remarquer que σt2 et σω2
sont indépendantes de x et ξ. La représentation dans le plan temps-fréquence de la
fonction gx,ξ correspond à une boı̂te d’Heisenberg centrée au point (x, ξ) et d’aire
σt σω (voir Figure 1.3). La taille de cette boı̂te est indépendante de la position x et
de la fréquence ξ, ce qui implique que la résolution temps-fréquence de la TG est la
même dans tout le plan temps-fréquence. La TG correspond donc à des translations
successives en temps et en fréquence d’une boı̂te d’Heisenberg de taille constante.
L’aire minimale de cette boı̂te est limitée par le principe d’incertitude d’Heisenberg :
σt σω ≥ 1/2. Rappelons qu’il y a égalité si la fenêtre g est une Gaussienne, ce qui
justifie ce choix en pratique.
Insérer Figure
Fig. 1.3 – Boı̂tes d’Heisenberg pour la TG dans le plan temps-fréquence pour deux
fonctions analysantes gx,ξ et gx′ ,ξ ′
1.3.4
Quelques exemples de transformée de Gabor
L’intérêt de la TG est de permettre une analyse du comportement local d’une
fonction. Les exemples suivants, pour lesquels la TG peut être calculée explicitement,
illustrent les avantages cette transformation par rapport à la transformée de Fourier.
• Sinusoı̈de : soit f (t) = sin(ω0 t), on peut facilement calculer que :
Gf (x, ξ) =
1 −i(ξ−ω0 )x
e
ĝ(ξ − ω0 ) − e−i(ξ+ω0 )x ĝ(ξ + ω0 ) .
2i
Etant donnée que ĝ est localisée autour de ω = 0, l’équation ci-dessus montre que
le maximum de l’amplitude de Gf (x, ξ) se situe au voisinage de ξ = ω0 et ξ = −ω0 .
La phase de la TG permet également de retrouver la fréquence du signal. Toutefois, du fait de l’introduction d’une fenêtre d’analyse, la localisation du comportement temps-fréquence du signal n’est pas parfaite. La TG diminue nécessairement
la résolution alors que pour la transformée de Fourier d’un sinus, on obtient deux
masses de Dirac en ξ = ω0 et ξ = −ω0 . Par contre, la TG permet de repérer les
changements de la fréquence d’un signal au cours du temps. La Figure 1.4 donne la
TG d’un signal constitué de deux sinusoı̈des successives de fréquence 10 et 30 Hz.
L’analyse de l’amplitude et de la phase de la TG permet clairement de mettre en
évidence le changement de fréquence au point t = 0.5.
• Chirps : un chirp est un signal sinusoı̈dale, non-stationnaire dont la fréquence et
l’amplitude sont des fonctions qui sont dépendantes du temps. Ce type de signaux
peut s’écrire sous la forme :
f (t) = A(t) sin(φ(t)).
17
1
100
100
0.8
90
90
0.6
80
80
0.4
70
70
0.2
60
60
0
50
50
−0.2
40
40
−0.4
30
30
−0.6
20
20
−0.8
10
−1
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0
10
0
0.1
0.2
0.3
(a)
0.4
0.5
0.6
0.7
0.8
0.9
1
0
0
0.1
0.2
0.3
0.4
(b)
0.5
0.6
0.7
0.8
0.9
1
(c)
Fig. 1.4 – (a) Signal : sinus à 10 Hz suivi d’un sinus à 30 Hz, (b) module et (c)
phase de sa transformée de Gabor Gf (x, ξ). L’axe des abscisses donne la position
x et l’axe des ordonnées représente les fréquences positives pour ν = ξ/2π. Le noir
représente les coefficients de la TG d’amplitude maximale, et le blanc les coefficients
d’amplitude minimale.
Si les fonctions A(t) et φ(t) sont suffisamment régulières et sous certaines hypothèses
sur la fenêtre g, alors on peut montrer que pour ξ ≥ 0
1
Gf (x, ξ) ≈ A(x)ei(φ(x)−ξx) ĝ(ξ − φ′ (x))).
2
Etant donnée la bonne localisation en fréquence de g, l’expression précédente montre
que dans le plan temps-fréquence, les valeurs de Gf (x, ξ) se concentrent autour de
courbes d’équation ξ = φ′ (x). Ces courbes qui sont appelées les arêtes de la TG permettent de retrouver l’expression de φ. La Figure 1.5 illustre ce comportement pour
un Chirp linéaire i.e. dont la fréquence est une fonction linéaire du temps. L’analyse
de signaux qui peuvent se modéliser comme une somme de chirps, d’amplitude et
fréquence variables, est particulièrement utilisée pour le traitement de la parole.
1
100
100
0.8
90
90
0.6
80
80
0.4
70
70
0.2
60
60
0
50
50
−0.2
40
40
−0.4
30
30
−0.6
20
20
−0.8
10
−1
0
0.1
0.2
0.3
0.4
0.5
(a)
0.6
0.7
0.8
0.9
1
0
10
0
0.1
0.2
0.3
0.4
0.5
(b)
0.6
0.7
0.8
0.9
1
0
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
(c)
Fig. 1.5 – (a) Chirp linéaire (b) module et (c) phase de sa transformée de Gabor
Gf (x, ξ). L’axe des abscisses donne la position x et l’axe des ordonnées représente
les fréquences positives pour ν = ξ/2π
18
1.3.5
Le problème du choix de la fenêtre
Le choix d’une bonne fenêtre est d’une importance cruciale pour l’interprétation
de la TG. Nous avons déjà mentionné qu’une fenêtre Gaussienne permet de réaliser
le meilleur compromis temps-fréquence. La taille des boı̂tes d’Heisenberg qui correspondent aux fonctions Gf (x, ξ) étant constante, la résolution temps-fréquence
de la TG est entièrement déterminée par la résolution de la fenêtre d’analyse g. En
définissant gs (t) = √1s g( st ), il est possible de modifier la résolution de la fenêtre d’analyse en contractant ou dilatant la fonction g d’un facteur s > 0 tout en conservant
l’énergie des fonctions analysantes. Le choix du facteur s dépend des phénomènes
que l’on soufaite observer. D’après le principe d’incertitude, un compromis s’impose nécessairement entre bonne localisation en fréquence et mauvaise localisation
en temps (et réciproquement). Par exemple, prenons le cas d’un signal composé de
deux sinusoı̈des successives de fréquence ω1 et ω2 . Si le facteur d’échelle s est suffisamment grand par rapport à ω1 − ω2 , alors ĝs est bien localisée autour de ω = 0
et la transformée de Gabor permet de bien séparer les deux composantes du signal.
A l’inverse si s est petit par rapport à ω1 − ω2 , alors ĝs est faiblement localisée en
fréquence et la TG ne permet plus de distinguer les deux composantes du signal.
Le signal de la Figure 1.6 est composé de deux sinusoı̈des successives de fréquences
5 Hz et 15 Hz, et de deux masses de Dirac aux points t = 0.3 et t = 0.7. Le choix
s = 0.1 permet de rendre compte du comportement fréquentiel des deux sinusoı̈des,
mais ne nous renseigne pas sur la présence de deux masses de Dirac. A l’inverse, le
choix s = 0.01 permet de localiser précisemment les deux masses de Dirac, mais la
caractérisation du comportement sinusoı̈dal du signal n’est plus satisfaisante.
50
200
45
180
3
40
160
2.5
35
140
2
30
120
1.5
25
100
1
20
80
0.5
15
60
0
10
40
−0.5
5
4
3.5
−1
0
0.1
0.2
0.3
0.4
0.5
(a)
0.6
0.7
0.8
0.9
1
0
20
0
0.1
0.2
0.3
0.4
0.5
(b)
0.6
0.7
0.8
0.9
1
0
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
(c)
Fig. 1.6 – Limitatons de la TG : (a) Signal : sinus à 5 Hz suivi d’un sinus à 15 Hz
+ deux masses de Dirac, (b) module de sa transformée de Gabor pour s = 0.1, (c)
module de sa transformée de Gabor pour s = 0.01
1.4
La transformée en ondelettes continue
Le but de l’analyse par ondelettes est de construire un outil qui permet de s’affranchir du problème du choix de la fenêtre dans la TG, en utilisant des fonctions
analysantes pour lesquelles la taille de la boı̂te d’Heisenberg varie avec la fréquence.
19
Nous verrons par la suite que l’analyse par ondelettes est un outil puissant pour
caractériser simultanément les différentes composantes temps-fréquence d’un signal.
Les premiers travaux sur les ondelettes remontent au début des années 1980.
Grossmann qui travaillait en physique théorique et Morlet un chercheur en traitement du signal ont été parmi les premiers scientifiques à étudier les propriétés de la
transformée en ondelettes continue. Dès leur début, les travaux sur la théorie des ondelettes sont donc caractérisés par la collobaration entre des scientifiques provenant
aussi bien des mathématiques, de la physique que du traitement du signal. C’est
encore le cas des travaux en cours sur les ondelettes, ce qui explique le succès de cet
outil et sa très large diffusion dans la communauté scientifique.
Une ondelette est une fonction ψ ∈ L2 (R) de moyenne nulle i.e. telle que :
Z +∞
ψ(t)dt = 0.
−∞
Nous supposerons de plus que l’ondelette est normalisée : kψk = 1.Dans l’analyse
par ondelettes, les fonctions analysantes sont définies à partir de translations et
dilatations/contractions de l’ondelette “mère” ψ :
1
t−x
ψx,s (t) = √ ψ(
),
s
s
où x ∈ R définit la translation temporelle et s > 0 est l’échelle de dilatation/contraction.
Par définition, l’énergie des fonctions analysantes est constante : kψx,s k = kψk = 1.
Définition 1.4 La transformée en ondelettes continue d’une fonction f ∈ L2 (R)
au point x ∈ R et à l’échelle s > 0 est définie par :
Z +∞
t−x
1
)dt.
Wf (x, s) = hf, ψx,s i =
f (t) √ ψ(
s
s
−∞
• Ondelettes réelles et complexes : dans ce cours, nous nous limiterons à l’étude
des ondelettes à valeurs réelles dans un souci de simplification. Les ondelettes réelles
sont bien adaptées pour la détection de changements brusques dans un signal. Les
ondelettes complexes, appelées également ondelettes analytiques, sont utilisées pour
séparer la phase et l’amplitude des composantes d’un signal. Elles sont en particulier
bien adaptées pour la détection de fréquences instantanées. Pour plus de précisions
sur les ondelettes analytiques, nous renvoyons à [7]. Ainsi, dans tout ce qui suit,
nous supposerons que ψ(t) ∈ R pour tout t ∈ R.
• Relation entre échelle et fréquence : la transformée en ondelettes continue est
une analyse temps-échelle. Elle permet d’avoir des informations sur le comportement
d’une fonction au voisinage du point x et à l’échelle s. Une transformée en ondelettes
peut s’écrire sous la forme d’un filtrage par convolution :
Wf (x, s) = f ⋆ ψs∗ (x),
20
). Etant donné que la transformée de Fourier de ψs∗ est égale
où ψs∗ (t) = √1s ψ( −t
s
R +∞
√
à sψ̂(sω) et que ψ̂(0) = −∞ ψ(t)dt = 0, la transformée en ondelettes continue
(abrégée TOC par la suite) peut s’interpréter comme un filtre passe bande. La
largeur du filtre est déterminée par le facteur d’échelle s.
1.4.1
Inversion de la transformée en ondelettes continue
Le théorème suivant montre que la TOC est une transformation inversible qui
conserve l’énergie du signal si l’ondelette vérifie la condition d’admissibilité suivante :
Z +∞
|ψ̂(ω)|2
< +∞.
Cψ =
ω
0
Si ψ vérifie la condition ci-dessus, alors l’ondelette est dite admissible. OnRpeut re+∞
marquer que la condition d’admissibilité impose nécessairement que ψ̂(0) = −∞ ψ(t)dt =
0 c’est à dire que l’ondelette soit de moyenne nulle.
Théorème 1.5 Soit ψ ∈ L2 (R) une ondelette admissible, alors pour tout f ∈ L2 (R)
on a (au sens de la convergence forte dans L2 (R))
Z +∞ Z +∞
1
1
t − x dxds
) 2 .
Wf (x, s) √ ψ(
f (t) =
Cψ 0
s
s
s
−∞
De plus, la TCO conserve l’énergie du signal
Z +∞
Z +∞ Z +∞
1
dxds
2
|f (t)| dt =
|Wf (x, s)|2 2 .
Cψ 0
s
−∞
−∞
1.4.2
Redondance et noyau reproduisant
Comme la transformée de Gabor, la TOC est une transformation très redondante.
La TOC associe à une fonction f ∈ L2 (R) une fonction Wf (x, s) de deux variables
). Comme pour la TG, l’ensemble des fonctions de
appartenant à L2 (R × R+ , dxds
s2
2
+ dxds
L (R × R , s2 ) qui sont des TOC de fonctions de L2 (R) est caractérisé par un
noyau reproduisant qui mesure la corrélation entre les fonctions analysantes.
). Alors il existe une fonction f ∈ L2 (R)
Théorème 1.6 Soit F ∈ L2 (R × R+ , dxds
s2
telle que F (x, s) = Wf (x, s) si et seulement si :
Z +∞ Z +∞
1
dx′ ds′
F (x, s) =
K(x, s, x′ , s′ )F (x′ , s′ ) 2 ,
Cψ −∞ −∞
s
où K est le noyau reproduisant
K(x, s, x′ , s′ ) = hψx,s , ψx′ ,s′ i,
Le noyau K(x, s, x′ , s′ ) mesure la corrélation temps-fréquence entre les ondelettes
ψx,s et ψx′ ,s′ .
21
1.4.3
Taille des boı̂tes d’Heisenberg
Supposons que l’ondelette ψ est centrée en zéro, ce qui implique que ψx,s est
centrée au point t = x. La variance temporelle de ψx,s s’écrit alors comme :
Z +∞
(t − x)2 |ψx,s (t)|2 dt = s2 σt2 ,
−∞
où σt2 =
par :
R +∞
−∞
t2 |ψ(t)|2 dt. De même, on peut définir la “fréquence moyenne” de ψ̂
1
ξ=
2π
Z
+∞
ω|ψ̂(ω)|2dω.
−∞
√
La transformée de Fourier de ψx,s s’écrit comme : ψ̂x,s = sψ̂(sω)e−iωx . La fréquence
moyenne de ψ̂x,s est donc ξ/s et sa variance fréquentielle est par conséquent égale à
Z +∞
ξ 2
σω2
1
2
(ω − ) |ψ̂x,s (ω)| dω = 2 ,
2π −∞
s
s
R +∞
1
(ω − ξ)2 |ψ̂(ω)|2dω. L’énergie temps-fréquence de l’ondelette ψx,s
où σω2 = 2π
−∞
correspond donc à une boı̂te d’Heisenberg centrée au point (x, ξ/s) de taille sσt
selon l’axe temporel et de taille σω /s selon l’axe fréquentiel. L’aire de cette boı̂te σt σω
reste constante à toutes les échelles, mais la résolution temps-fréquence de l’ondelette
ψx,s dépend du niveau de résolution s (voir Figure 1.7). Contrairement à la TG qui
correspond à un pavage régulier du plan temps-fréquence, la TCO permet d’ajuster
le niveau d’analyse. Il s’agit d’une procédure de “zoom” qui permet d’inspecter le
comportement local d’un signal en réduisant progressivement le paramètre d’échelle
s : de petites valeurs de s diminue l’étalement temporel de ψx,s mais augmente le
support fréquentiel de ψ̂x,s dont le centre est décalé vers de plus hautes fréquences.
Insérer Figure
Fig. 1.7 – Boı̂tes d’Heisenberg pour la TOC dans le plan temps-fréquence pour deux
fonctions analysantes ψx,s et ψx′ ,s′ avec s < s′ .
1.4.4
Quelques exemples de transformée en ondelettes continue
La TG et la TOC se comportent essentiellement de la même façon pour l’analyse
temps fréquence des signaux. La TOC peut également être utilisée pour caractériser
les fréquences instantanées des chirps, et cette technique a été largement employée
en traitement de la parole. L’intérêt de la TOC est de permettre une analyse locale
des signaux et en particulier de mettre en évidence des comportements irréguliers
(ou singuliers). Elle est en particulier bien adaptée pour caractériser le degré de
régularité d’une fonction. Les deux exemples suivants illustrent les bonnes propriétés
22
des ondelettes pour la détection de singularités dans des signaux (dans les deux cas,
l’ondelette choisie est la dérivée première d’une Gaussienne).
• Deux sinusoı̈des successives + masses de Dirac. La Figure 1.8 donne les valeurs
de la TCO du signal constitué de deux sinusoı̈des successives de fréquences 5 Hz et
15 Hz, et de deux masses de Dirac aux points t = 0.3 et t = 0.7. Ce signal a déjà
été étudié pour illustrer les limitations de la TG. La TCO permet de rendre compte
de toutes les composantes du signal. Les grandes échelles permettent d’analyser la
partie sinusoı̈dale du signal, alors que l’analyse aux fines échelles met en évidence la
présence des deux masses de Dirac.
• Le signal de la Figure 1.9 présente 3 singularités aux points t = 0.3, t = 0.5
et t = 0.8. On peut constater sur la Figure 1.9 que les coefficients d’ondelettes de
grande amplitude se concentrent au voisinage des trois singularités quand l’échelle
s diminue.
4
10
3.5
9
3
8
2.5
7
2
6
1.5
5
1
4
0.5
3
0
2
−0.5
−1
1
0
0.1
0.2
0.3
0.4
0.5
(a)
0.6
0.7
0.8
0.9
1
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
(b)
Fig. 1.8 – (a) Signal : sinus à 5 Hz suivi d’un sinus à 15 Hz + deux masses de Dirac,
(b) module de sa transformée en ondelettes continue : l’axe des abscisses représente
la position x, et l’axe des ordonnées l’échelle s en coordonnée logarithmique i.e.
− log2 (s)
23
35
10
9.5
30
9
8.5
25
8
20
7.5
7
15
6.5
6
10
5.5
5
5
0
0.1
0.2
0.3
0.4
0.5
(a)
0.6
0.7
0.8
0.9
1
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
(b)
Fig. 1.9 – (a) Signal présentant 3 singularités (b) module de sa transformée en ondelettes continue : l’axe des abscisses représente la position x, et l’axe des ordonnées
l’échelle s en coordonnée logarithmique i.e. − log2 (s)
24
Chapitre 2
Transformée en ondelette continue
et régularité d’un signal
La transformée en ondelette continue permet d’analyser le comportement local
d’un signal en réduisant progressivement le paramètre d’échelle s. Cette procédure de
zoom est un outil puissant pour détecter et caractériser les irrégularités d’un signal.
Dans ce chapitre, nous montrons que la décroissance des coefficients d’ondelettes
le long des échelles est caractéristique de la régularité Lipschitzienne d’un signal.
Les singularités d’un signal unidimensionnel (discontinuité, dirac, cusp...) ainsi que
les contours dans une image (zones où l’intensité des pixels change brutalement)
peuvent être détectés en suivant la propagation aux fines échelles des coefficients de
grande amplitude de la transformée en ondelette continue. Dans tout ce chapı̂tre,
nous supposerons que les signaux analysés sont des fonctions réelles de L2 (R) ou
L2 (R2 ).
2.1
2.1.1
Analyse de la régularité d’un signal unidimensionnel
Régularité Lipschitzienne
Définition 2.1 Une fonction f ∈ L2 (R) est ponctuellement Lipschitzienne d’ordre
α ≥ 0 au point x0 , s’il existe une constante Cx0 et un polynôme P de degré m = ⌊α⌋
tels que pour tout t ∈ R
|f (t) − P (t)| ≤ Cx0 |t − x0 |α .
(2.1)
De plus,
– la régularité Lipschitizienne de f au point x0 est le supremum des α pour
lesquels f est ponctuellement Lipschitzienne d’ordre α en x0 .
– une fonction est dite uniformément Lipschitzienne d’ordre α, si elle satisfait
l’équation (2.1) pour tout x0 ∈ [a, b] avec une constante C qui est indépendante
de x0 .
25
26
Les exposants de Lipschitz permettent de caractériser la régularité d’une fonction. Si 0 ≤ α < 1, alors P (t) = f (x0 ) et l’équation (2.1) devient :
|f (t) − f (x0 )| ≤ Cx0 |t − x0 |α .
Si la régularité Lipschitzienne de f au point x0 est 0 ≤ α < 1, alors f n’est
pas dérivable au point x0 . Une fonction discontinue au point x0 est de régularité
Lipschitzienne 0 en x0 . De même si f est m = ⌊α⌋ fois continûment dérivable au
voisinage de x0 , alors P correspond au développement de Taylor de f d’ordre m au
point x0 i.e.
m−1
X f k (x0 )
P (t) =
(t − x0 )k .
k!
k=0
On peut également montrer que si f est uniformément Lipschitzienne d’ordre α > m
sur un intervalle [a, b], alors f est nécessairement m fois continûment dérivable sur
]a, b[.
2.1.2
Ondelette et nombre de moments nuls
L’exposant de Lipschitz permet de décomposer une fonction f au voisinage d’un
point x0 comme la somme d’un polynôme plus un terme d’erreur dont on peut
contrôler l’amplitude
f (t) = P (t) + ǫ(t),
avec |ǫ(t)| ≤ |t − x0 |α .
Une ondelette est une fonction oscillante de moyenne nulle. Le degré d’oscillation
de l’ondelette permet d’ignorer les parties régulières d’un signal lorsque l’on calcule
sa TOC. Cette propriété se traduit par le nombre de moments nuls de l’ondelette.
Définition 2.2 Une ondelette ψ ∈ L2 (R) a r ∈ N∗ moments nuls si pour tout entier
0≤k<r
Z
+∞
tk ψ(t)dt = 0.
−∞
Ainsi, une transformée en ondelette permet d’ignorer les polynomes de degré
strictement inférieur à r. En effet, si P est un polynôme de degré m < r alors
pour tout x ∈ R et pour tout s > 0, WP (x, s) = 0. Ainsi, si une fonction est
ponctuellement Lipschitzienne d’ordre α au point x0 et si l’ondelette ψ a r ≥ ⌊α⌋+ 1
moments nuls, alors au voisinage de x0
Wf (x, s) = Wǫ (x, s).
La TOC est donc caractéristique de la régularité Lipschtizienne d’une fonction car
elle permet de supprimer sa composante polynomiale.
27
Pour pouvoir mesurer la régularité Lipschitzienne d’une fonction, il est nécessaire
d’utiliser des ondelettes qui soient suffisamment régulières et qui ont de bonnes propriétés de décroissance en l’infini. Nous dirons qu’une fonction f est à décroissance
rapide si pour tout m ∈ N, il existe une constante Cm telle que pour tout t ∈ R
|f (t)| ≤
Cm
.
1 + |t|m
Il s’agit de fonctions qui décroissent en l’infini plus rapidement que n’importe quel
polynôme. Dans ce qui suit, nous utiliserons des ondelettes à décroissance rapide
avec exactement r moments nuls. Dans ce cas, on montre que ψ peut s’écrire comme
la dérivée d’ordre r d’une fonction θ, appelée noyau i.e.
ψ(t) = (−1)r
dr θ(t)
.
dtr
R +∞
telle que θ est à décroissance rapide et −∞ θ(t)dt 6= 0. Pour ce choix particulier
de l’ondelette ψ et à une échelle s donnée, la TOC peut s’interpréter comme une
) suivi d’un opérateur différentiel
convolution du signal f par le noyau θs∗ (t) = √1s θ( −t
s
1
−t
∗
d’ordre r. En effet, si on pose ψs (t) = √s ψ( s ) alors on a
Wf (x, s) = f ⋆ ψs∗ (x).
r
r ∗
∗
r d θs (t)
et donc en
Etant donné, que ψ(t) = (−1)r d dtθ(t)
r , on a alors que ψs (t) = s
dtr
permutant les opérateurs de convolution et de dérivation
r
dr θ∗ (t)
r d
(x)
=
s
(f ⋆ θs∗ )(x).
dtr
dtr
Afin d’avoir une ondelette suffisamment régulière, nous supposerons également
que ψ est r fois continûment dérivable telle que ses dérivées ψ (k) soient des fonctions
à décroissance rapide pour 1 ≤ k ≤ r. Un exemple classique pour la fonction θ est
le noyau Gaussien, et dans ce cas on dira que ψ est une ondelette Gaussienne.
Wf (x, s) = sr f ⋆
2.1.3
Amplitude des coefficients d’ondelettes et régularité
d’un signal
Les théorèmes suivants montrent que l’évolution de l’amplitude des coefficients
d’ondelettes quand s → 0 est caractéristique de la régularité Lipschitzienne d’un
signal.
Théorème 2.1 Soit une fonction f ∈ L2 (R) uniformément Lipschitzienne d’ordre
α ≤ r sur un intervalle [a, b], alors il existe une constante A telle que pour tout
x ∈ [a, b] et pour tout s > 0
|Wf (x, s)| ≤ Asα+1/2
(2.2)
Réciproquement, si f est bornée et si Wf (x, s) satisfait (2.2) pour un α < r qui n’est
pas un entier, alors f est uniformément Lipschitzienne d’ordre α sur [a + ǫ, b − ǫ]
pour tout ǫ > 0.
28
Théorème 2.2 Soit une fonction f ∈ L2 (R) ponctuellement Lipschitzienne d’ordre
α ≤ r au point x0 , alors il existe une constante A telle que pour tout x ∈ R et pour
tout s > 0
x − x0 α
α+1/2
.
(2.3)
1 + |Wf (x, s)| ≤ As
s Réciproquement, si α < r n’est pas un entier et s’il existe une constante A et α′ < α
tels que pour tout x ∈ R et pour tout s > 0
α′ !
x
−
x
0
|Wf (x, s)| ≤ Asα+1/2 1 + (2.4)
s alors f est Lipschtizienne d’ordre α en x0 .
Lorsque que l’ondelette ψ est à support compact égal à [−C, C], les conditions
(2.3) et (2.4) sont plus faciles à interpréter. Le cone d’influence de l’ondelette ψ au
point x0 est défini comme l’ensemble des points (x, s) dans le plan temps-échelle tels
que |x − x0 | ≤ Cs (voir Figure 2.1). Ils correspondent aux points tels que le support
des fonctions analysantes ψx,s (t) = √1s ψ( t−x
) contient le point x0 . Si (x, s) est dans
s
le cone d’influence de f au point x0 alors les valeurs de Wf (x, s) sont influencées par
le comportement de f au voisinage de x0 . De plus, si (x, s) est tel que |x − x0 | ≤ Cs
alors les conditions (2.3) et (2.4) peuvent s’écrire
Wf (x, s)| ≤ A′ sα+1/2 .
Le comportement de la TCO dans le cone d’influence de x0 est donc caractéristique
du comportement de f au voisinage de ce point. Dans la Figure 2.2, on peut remarquer que les coefficients d’ondelettes de grande amplitude sont inclus dans le cone
d’influence de chacune des 3 singularités.
1
0.9
0.8
|x-x0| < Cs
0.7
s
0.6
|x-x0| > Cs
0.5
|x-x0| > Cs
0.4
0.3
0.2
0.1
0
0
0.1
0.2
0.3
0.4
0.5
x
0.6
0.7
0.8
0.9
1
Fig. 2.1 – Zone grise : cone d’influence de l’ondelette ψ au point x0 = 0.5.
2.1.4
Maxima d’ondelettes
Le théorème 2.2 montre que la régularité d’une fonction peut être mesurée à
partir de la décroissance de ses coefficients d’ondelettes quand s → 0. Toutefois, il
n’est pas nécessaire de considérer l’ensemble des coefficients Wf (x, s). La régularité
d’une fonction peut en effet contrôlée par la décroissance le long des échelles des
maxima en module de la TOC.
29
10
11
8
10
6
4
9
2
8
0
7
−2
−4
6
−6
−8
5
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0
0.1
0.2
0.3
0.4
(a)
0.5
0.6
0.7
0.8
0.9
1
(b)
Fig. 2.2 – (a) Signal présentant 3 singularités (b) Module de sa TOC pour la dérivée
seconde d’une Gaussienne : l’axe des abscisses représente la position x, et l’axe des
ordonnées − log2 (s)
Définition 2.3 Le terme maxima d’ondelette est utilisé pour décrire tout point
(m0 , s0 ) dans le plan temps-échelle tels que x 7→ |Wf (x, s0 )| est locallement maximum
au point x = m0 . Ce maximum local doit être strict à droite ou à gauche de m0 . On
appelle ligne de maxima d’ondelette toute courbe continue m(s) dans le plan
temps-échelle telle que les points (m(s), s) soient des maxima d’ondelette.
Le théorème suivant prouve que la propagation des maxima d’ondelettes dans le
plan temps-échelle est reliée à la régularité Lipschitzienne d’une fonction.
Théorème 2.3 Supposons que l’ondelette ψ est à support compact. S’il existe une
échelle s0 > 0 telle que |Wf (x, s)| n’a pas de maximum local pour x ∈ [a, b] et pour
tout s < s0 , alors f est uniformément Lipschitizienne d’ordre r sur ]a, b[.
Ce théorème montre que si la régularité de f au point x0 est d’ordre α < r, alors
il existe nécessairement une séquence de maxima d’ondelette (mp , sp ) telle que
lim mp = x0 et lim sp = 0.
p→+∞
p→+∞
Cette propriété est illustrée dans la Figure 2.3 qui représente les lignes de maxima
d’ondelettes d’une fonction contenant 3 singularités aux points x = 0.1, x = 0.5 et
x = 0.8, où la TOC a été calculée pour la dérivée seconde d’une Gaussienne i.e. pour
r = 2. On peut constater que plusieurs lignes de maxima d’ondelettes convergent
vers les singularités de la fonction. Il existe également d’autres lignes de maxima qui
convergent vers des parties régulières du signal. Ces lignes sont dues à la présence de
zéros dans la dérivée troisième du signal. En effet, si f est C r+2 dans un intervalle
[a, b] et si f (r+1) a zero au point x0 telle que f (r+2) (x0 ) 6= 0, on peut montrer qu’il
existe une ligne de maxima d’ondelettes qui converge vers x0 quand s tend vers zéro.
Pour cela, on peut tout d’abord remarquer que si f est r fois continûment
dérivale
R +∞
Wf (x0 ,s)
(r)
au voisinage de x0 , alors lims→0 sr+1/2 = Kf (x0 ) où K = −∞ θ(t)dt, et que
30
∂W (m(s),s)
par définition, si m(s) est une ligne de maxima d’ondelettes alors f ∂x
= 0. A
l’aide du théorème des fonctions implicites, on montre alors que si f (r+1) (x0 ) = 0 et
∂Wf (m(s),s)
f (r+2) (x0 ) 6= 0, il existe m(s) → x0 quand s → 0 telle que
= 0.
∂x
10
8
8
7
6
6
4
5
2
4
0
3
−2
2
−4
1
−6
−8
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0
0
0.1
0.2
0.3
(a)
0.4
0.5
0.6
0.7
0.8
0.9
1
(b)
Fig. 2.3 – (a) Signal présentant 3 singularités (b) Lignes de maxima d’ondelette
pour la dérivée seconde d’une Gaussienne : l’axe des abscisses représente la position
x, et l’axe des ordonnées − log2 (s)
Mesure de la régularité d’un signal : la régularité Lipschitzienne d’une fonction
peut être mesurée à partir de la décroissance du module des maxima d’ondelettes.
Soit f une fonction de régularité Lipschitzienne d’ordre α < r en x0 . Supposons qu’il
existe une échelle s0 à partir de laquelle tous les maxima d’ondelette (m(s), s) qui
convergent vers le point x0 sont inclus dans un cone du type |x − x0 | ≤ Cs. Alors, on
peut utiliser les théorèmes 2.2 et 2.3 pour montrer que f est Lipschitzienne d’ordre
α au point x0 si et seulement s’il existe une constante A > 0 telle que pour tout
s < s0 et pour tous les maxima d’ondelette inclus dans le cone défini précédemment
|Wf (m(s), s)| ≤ Asα+1/2
ce qui est équivalent à
log2 |Wf (m(s), s)| ≤ log2 A + (α + 1/2) log2 (s).
Pour chaque ligne de maxima d’ondelettes m(s), la régularité Lipchitzienne de f au
point x0 peut donc être estimée en calculant aux fines échelles la pente maximale
de la courbe de log2 |Wf (m(s), s)| considérée comme une fonction de log2 (s).
Remarque : les points pour lesquels toutes les lignes de maxima d’ondelettes se
concentrent dans un cone dans le plan temps-échelle sont des singularités dites
isolées. Les lignes de maxima sont bien adaptées pour mesurer l’exposant Lipschitz
de ce type de singularités. Toutefois, nous verrons en TP qu’il existe des fonctions
pour lesquelles il n’est pas possible d’estimer la régularité ponctuelle de certains
points à partir de cette technique.
31
2.2
2.2.1
Analyse de la régularité d’une image
Extension de la transformée en ondelette pour des
images
La TOC peut être étendue au cas bidimensionnel de plusieurs façons. L’extension
naturelle par rapport à ce que nous avons vu en 1D consiste à prendre une ondelette
réelle et isotrope i.e. une fonction ψ ∈ L2 (R2 ) qui s’écrit pour x = (x1 , x2 ) sous la
forme
ψ(x) = h(kxk),
p
où kxk = x21 + x22 et h est une fonction unidimensionnelle à valeurs réelles. Dans
ce cas, l’ondelette est dite isotrope car ses propriétés sont les mêmes dans toutes les
directions du plan 2D. La TOC d’une fonction f ∈ L2 (R) à l’échelle s > 0 est alors
définie par
Z
u−x
1
du.
Wf (x, s) =
f (u) ψ
s
s
R2
Si l’ondelette ψ vérifie une condition d’admissibilité similaire à celle du cas 1D,
alors on peut montrer que cette transformation est inversible et qu’elle converse
l’énergie du signal. Comme ψ est de moyenne nulle, Wf (x, s) permet de mesurer les
variations de l’image f dans un voisinage du point x dont la taille est proportionnelle
à s.
Un exemple classique pour l’ondelette ψ est le Laplacien d’une Gaussienne i.e.
pour u = (u1 , u2 ) ∈ R2
θ(u) =
∂2θ
1 − u21 +u22
∂2θ
+
.
e 2 et ψ =
2π
∂u21 ∂u22
Ce filtre est couramment utilisé en vision par ordinateur. Un exemple d’utilisation du
Laplacien de la Gaussienne est donné dans la Figure 2.4. A une échelle s donnée, on
peut constaster que les contours significatifs d’une image correspondent aux points
où x 7→ Wf (x, s) s’annule. Il s’agit des zero-crossing du Laplacien.
2.2.2
Transformée en ondelette dyadique bidimensionnelle
Pour pouvoir étendre la notion de maxima d’ondelettes pour la détection de
contours dans des images, nous allons considérer une transformée en ondelette directionnelle selon les axes verticaux et horizontaux d’une image. Une version bidimensionnelle de la TOC peut être implémentée à l’aide d’un noyau de convolution
θ ∈ L2 (R2 ) qui doit être une fonction suffisamment lisse. Un exemple classique pour
θ est le noyau Gaussien.
La TOC 2D est ensuite calculée à partir de deux ondelettes qui sont les dérivées
partielles de θ dans les directions verticales et horizontales
ψ1 = −
∂θ
∂θ
et ψ 2 = −
∂u1
∂u2
32
(a)
(b)
(c)
(d)
Fig. 2.4 – (a) Image d’un caméraman. TOC en 2D pour le Laplacien d’une Gaussienne : (b) s = 1, (c) s = 2, (d) s = 3. Le noir représente les pixels d’intensité
maximale et le blanc ceux d’intensité minimale.
Il s’agit donc d’une tranformée en ondelette avec r = 1 moment nul. Afin de simplifier
les calculs numériques il est possible de d’échantillonner le paramètre de résolution
s selon une échelle dyadique i.e. de prendre s = 2j pour j ∈ Z. Dans les deux
directions indexées par k = 1, 2 et pour s = 2j , on définit alors la transformée en
ondelette dyadique 2D (abrégée TOD 2D) d’une fonction f ∈ L2 (R) comme
Z
1 k u−x
k
j
Wf (x, 2 ) =
f (u) j ψ
du.
2
2j
R2
La TOD 2D peut également s’écrire comme la convolution de f par le noyau θ au
niveau de résolution j ∈ Z suivie d’une dérivée partielle dans les directions verticales
et horizontales i.e. pour k = 1, 2
Wfk (x, 2j ) = 2j
où θ2∗j (u) =
1
θ( −u
).
2j
2j
∂
(f ⋆ θ2∗j )(x),
∂xk
Les composantes horizontales et verticales de la TOD 2D sont
33
donc proportionnelles au gradient de l’image f lissée par le noyau θ à l’échelle 2j :
1
∂
∗
(f
⋆
θ
)(x)
Wf (x, 2j )
j
j
2
∂x1
=2
= 2j ∇(f ⋆ θ2∗j )(x)
∂
∗
Wf2 (x, 2j )
(f
⋆
θ
)(x)
2j
∂x2
2.2.3
Régularité Lipschitzienne
La décroissance des coefficients de la TOD 2D est reliée à la régularité d’une
image. Pour 0 ≤ α < 1, une fonction f ∈ L2 (R2 ) est dite ponctuellement Lipschitzienne d’ordre α au point x0 s’il existe une constante C telle que pour tout
u ∈ R2
|f (u) − f (x0 )| ≤ Cku − x0 kα .
Une fonction est dite uniformément Lipchitizienne d’ordre α sur un domaine Ω de
R2 , si f est ponctuellement Lipschitzienne d’ordre α pour tout x ∈ Ω avec une
constante C qui est indépendante de x0 . Comme dans le cas 1D, on peut montrer
que la décroissance des coefficients d’ondelettes est caractéristique de la régularité
Lipschitzienne d’une image. En particulier si on définit le module de la TOD 2D
comme
q
j
Mf (x, 2 ) = |Wf1(x, 2j )|2 + |Wf2 (x, 2j )|2 ,
alors on peut montrer que f est uniformément Lipchitizienne d’ordre α sur Ω si et
seulement s’il existe une constante A telle que pour tout x ∈ Ω et pour tout j ∈ Z
Mf (x, 2j ) ≤ A2j(α+1/2) .
La Figure 2.5 donne un exemple de TOD 2D. On peut constater que les grandes
valeurs de Mf (x, 2j ) se concentrent au niveau des contours de l’image.
2.2.4
Détecteur de Canny
Les contours dans une image peuvent être définis comme les points où l’intensité
de l’image varie brutalement. Le détecteur de Canny est un algorithme adapté à la
détection de ce type de contours. Le gradient d’une image permet de quantifier les
variations d’intensité de ses pixels. La dérivée partielle d’une fonction f ∈ L2 (R)
→
dans une direction donnée par un vecteur unité −
n = (cos α, sin α) dans le plan 2D
→
est égale au produit scalaire du gradient de f et de −
n
∂f
∂f
∂f
→
cos α +
sin α.
= ∇f . −
n =
−
→
∂n
∂x1
∂x2
La dérivée partielle d’une fonction permet de mesurer le taux de variation de
→
→
l’intensité de f dans la direction −
n . Or, le module de ∂∂f→
est maximum si ∇f et −
n
−
n
sont colinéaires. Ceci montre donc que le vecteur ∇f (x) est parallèle à la direction de
changement maximum de l’intensité de f au point x. Nous dirons alors qu’un point
y ∈ R2 fait partie d’un contour dans une image, si x 7→ k∇f (x)k est localement
maximum au point x = y pour x = y + λ∇f (y) et |λ| suffisamment petit. Ceci
34
signifie que la dérivée partielle de f au voisinage de y dans une direction donnée
par le gradient ∇f (y) est locallement maximum en y. Cette définition des contours
correspond donc aux points d’inflexion dans une image.
2.2.5
Maxima d’ondelette pour des images
Rappelons que le module de la TOD 2D à l’échelle s = 2j est défini par
q
Mf (x, 2j ) = |Wf1(x, 2j )|2 + |Wf2 (x, 2j )|2 .
Nous avons montré précédemment que cette quantité est proportionnelle au module
du gradient de l’image f lissée par le noyau θ à l’échelle 2j i.e.
Mf (x, 2j ) = 2j k∇(f ⋆ θ2∗j )(x)k.
Définissons Af (x, 2j ) comme l’angle entre la composante horizontale Wf1 (x, 2j ) et la
composante verticale Wf2 (x, 2j ) de la TOD 2D par
j
Af (x, 2 ) =
α(x)
π − α(x)
où
α(x) = tan−1
si Wf1 (x, 2j ) ≥ 0,
si Wf1 (x, 2j ) < 0,
Wf2 (x, 2j )
Wf1 (x, 2j )
!
.
→
Le vecteur unitaire −
n j (x) = (cos Af (x, 2j ), sin Af (x, 2j )) est donc colinéaire au
gradient ∇(f ⋆ θ2∗j )(x). Un point d’un contour à l’échelle 2j est alors défini comme
un point y tel que x 7→ Mf (x, 2j ) est localement maximum au point x = y pour x =
→
y + λ−
n j (y) et λ suffisamment petit. Ces points sont également appelés les maxima
d’ondelettes de l’image f à l’échelle 2j . Ainsi, la détection des contours dans une
image via les maxima d’ondelettes est équivalente à un détecteur de Canny multiéchelles. La Figure 2.5 donne un exemple de détection de contours dans une image à
partir des maxima d’ondelettes pour un noyau θ Gaussien. On peut constater qu’il
est possible de détecter uniquement les contours significatifs en garder les maxima
d’ondelettes tels que le module de la TOD 2D en ces points est suffisamment grand
par rapport à un seuil bien choisi.
35
(a)
(b)
(c)
Fig. 2.5 – Détection multi-échelles de contours pour l’image du caméraman pour s =
2−j , j = −1, 0, 1, 2 : (a) Mf (x, 2j ) le noir représente les pixels d’intensité maximale et
le blanc ceux d’intensité minimale, (b) Maxima d’ondelette, (c) Maxima d’ondelette
dont l’amplitude est supérieure à un seuil fixé.
36
Chapitre 3
Bases d’ondelettes
Dans les chapitres précédents, nous avons introduit la TOC qui permet une
représentation temps-fréquence d’un signal. Nous avons montré que cette transformation est inversible et qu’elle conserve l’énergie du signal. Toutefois, il s’agit d’une
représentation très redondante qui nécessite de connaı̂tre l’ensemble des coefficients
d’ondelettes pour pouvoir reconstruire un signal. Dans ce chapitre, nous allons nous
intéresser à des représentations discrètes d’une fonction qui permettent de résumer
l’information contenue dans un signal avec peu de coefficients. En particulier, nous
allons montrer qu’il est possible de construire des ondelettes ψ telle que la famille
1
t − 2j k
ψj,k (t) = √ ψ
2j
2j
(j,k)∈Z2
soit une base orthonormée de L2 (R). Pour une fonction f ∈ L2 (R), les produits
scalaires hf, ψj,k i sont appellés les coefficients d’ondelettes dans la base {ψj,k }(j,k)∈Z2 ,
P+∞
P
et tout signal pourra donc s’écrire sous la forme f = +∞
k=−∞ hf, ψj,k iψj,k . Les
j=−∞
coefficients d’ondelettes au niveau de résolution j caractérisent les variations d’un
signal à l’échelle 2j . Nous allons en particulier montrer que la construction de telle
bases permet d’établir un lien entre l’analyse multi-échelle de signaux (largement
utilisée en vision par ordinateur), la théorie du filtrage discret en traitement du
signal et les mathématiques appliquées.
3.1
3.1.1
Bases orthonormées d’ondelettes
Quelques rappels sur les bases hilbertiennes
Définition 3.1 Un espace de Hilbert est un R espace vectoriel muni d’un p
produit
scalaire noté hx, yi (pour x, y ∈ H) qui est complet pour la norme kxk = hx, xi
(norme associée au produit scalaire).
Proposition 3.1 L’ensemble L2 (R), qui est l’espace des fonctions
de carré intégrable,
R
de norme asest un espace de
Hilbert
pour
le
produit
scalaire
hf,
gi
=
f
(t)g(t)dt
R
R
2
2
2
sociée kf k = R |f (t)| dt pour f, g ∈ L (R).
37
38
Soit H un espace de Hilbert. Nous rappelons les définitions et propriétés suivantes
– deux vecteurs x et y de H sont orthogonaux si hx, yi = 0
– soit A une partie non vide de H. On note A⊤ l’orthogonal de A dans H défini
par
A⊤ = {x ∈ H, ∀y ∈ A, hx, yi = 0},
– A⊤ est un sous-espace vectoriel fermé de H
– si A est un sous-espace vectoriel de H, alors Ā = (A⊤ )⊤ .
Proposition 3.2 Soit H un espace de Hilbert et F un sous-espace vectoriel fermé
de H. Pour tout x ∈ H, on note PF x la projection orthogonale de x sur F qui est
caractérisée comme l’unique point de F tel que kx − PF xk = inf y∈F kx − yk. De plus,
– pour tout y ∈ F , hx − PF x, yi = 0
– PF : H L
→ F est une application linéaire et continue,
– H=F
F ⊤.
Définition 3.2 Soit H un espace de Hilbert et soit (Hn )n≥0 une suite de sousespaces vectoriels fermés de H. On dit que H est une somme hilbertienne des Hn
si
– ∀m 6= n, ∀(x, y) ∈ Hm × Hn , hx, yi = 0
– l’espace vectoriel
L engendré par les Hn est dense dans H.
On note alors, H = n≥0 Hn .
L
Proposition 3.3 Soit H = n≥0 Hn . Si x ∈ H, on pose pour tout n ∈ N, xn =
a alors
PHn x. On P
PN
– x = n≥0
x
,
i.e.
lim
n
N
→∞
n=0 xn = x
P
– kxk2 = n≥0 kxn k2 (égalité de Bessel-Parseval)
Réciproquement, soit (xn )Pune suite dans H telle que pour tout n, xn ∈ Hn et
P
N
2
n=0 xn converge vers un point x ∈ H tel que pour tout
n≥0 kxn k < +∞, alors
n ∈ N, xn = PHn x.
Définition 3.3 On appelle base hilbertienne (ou base orthonormée) une suite (en )n≥0
d’éléments de H telle que
– hen , em i = δn,m
– l’espace vectoriel engendré par les (en )n≥0 est dense dans H.
D’après ce qui précède, si (en )n≥0 est une base orthonormée
P d’un espace de
Hilbert P
H, alors tout x ∈ H s’écrit de manière unique x =
n≥0 hx, en ien avec
kxk2 = n≥0 |hx, en i|2.
3.1.2
Analyse multirésolution de L2(R)
La décomposition d’un signal à différents niveaux de résolution est largement utilisée en vision par ordinateur. Une analyse multirésolution correspond au calcul d’un
ensemble de coefficients qui constituent une représentation plus ou moins précise
39
d’un signal. Par exemple, l’approximation d’une fonction f au niveau de résolution
j peut être définie par la donnée d’une suite de coefficients qui correspondent à une
moyenne locale de f sur des intervalles disjoints de longueur 2j . Lorsque que l’on
passe de la résolution j à la résolution j + 1 le niveau d’approximation est plus
grossier, alors que lorsque l’on passe du niveau j au niveau j − 1 on affine la qualité de l’approximation (voir Figure 3.1). De façon plus formelle, l’approximation
d’une fonction f à la résolution j correspond à la projection orthogonale de f sur
un sous-espace Vj ⊂ L2 (R) ce qui conduit à la définition suivante :
Définition 3.4 Une analyse multirésolution (AMR) de L2 (R) est une succession
de sous-espaces fermés (Vj )j∈Z qui satisfait les 6 propriétes suivantes
∀j ∈ Z,
∀j ∈ Z,
Vj+1 ⊂ Vj ⊂ . . . ⊂ L2 (R),
t
f (t) ∈ Vj ⇐⇒ f ( ) ∈ Vj+1 ,
2
\
Vj = {0},
(3.1)
(3.2)
(3.3)
j∈Z
[
Vj = L2 (R),
(3.4)
j∈Z
∀(j, k) ∈ Z2 , f (t) ∈ Vj =⇒ f (t − 2j k) ∈ Vj
(3.5)
il existe φ ∈ V0 telle que {φ(t − k), k ∈ Z} soit une base orthonormée de V0 .
Au niveau de résolution j, l’approximation d’une fonction f ∈ L2 (R) correspond
à la projection orthogonale PVj f de f sur Vj . Intuitivement, on peut interpréter les
6 propriétés d’une AMR de la façon suivante
– l’inclusion (3.1) des espaces Vj signifie qu’une approximation d’un signal au
niveau de résolution j est plus précise que l’approximation au niveau j + 1,
– la multirésolution est définie par la propriété (3.2) : l’espace Vj+1 définit une
approximation deux fois plus grossière que la représentation dans l’espace Vj ,
– lorsque que le niveau de résolution devient de plus en plus grossier i.e. j → +∞,
la propriété (3.3) implique que l’approximation de f se dégrade et que l’on perd
tous les détails sur f i.e limj→+∞ kPVj f k = 0,
– lorsque l’échelle d’analyse 2j tend vers zéro (i.e. j → −∞), la propriété (3.4)
impose que l’approximation du signal converge vers le signal original i.e.
limj→−∞ kf − PVj f k = 0,
– la propriété (3.5) signifie que l’espace Vj est invariant par des translation proportionnelles à l’échelle d’analyse 2j ,
– φ est la fonction d’échelle de l’AMR, également appelée fonction génératrice
de l’espace V0 .
Des propriétés d’une AMR, on déduit immédiatement la proposition suivante
j k
Proposition 3.4 Posons φj,k (t) = √12j φ t−2
. Alors pour tout j ∈ Z, {φj,k , k ∈
2j
Z} est une base orthonormée de Vj .
40
Dans ce qui suit, nous allons montrer que l’on peut entièrement spécifier une
AMR à partir de la donnée d’une fonction d’échelle φ. Les deux fonctions suivantes
sont des exemples classiques d’une AMR de L2 (R)
– Approximation constante par morceaux : si φ(t) = 11[0,1] (t) est la fonction
indicatrice de l’intervalle [0, 1], alors Vj est le sous-espace de fonctions f ∈
L2 (R) telles que f (t) est constante sur chaque intervalle {Ij,k = [2j k, 2j (k +
1)[, k ∈ Z}. L’AMR est alors constituée de l’ensemble des fonctions constantes
par morceaux sur les intervalles Ij,k , (j, k) ∈ Z2 i.e. φj,k (t) = 2−j/211Ij,k (t). Au
niveau de résolution j, l’approximation d’un signal f ∈ L2 (R) est une fonction
en escalier qui est la moyenne de f sur chaque intervalle Ij,k (voir Figure 3.1).
, alors
– Approximation de Shannon. On peut montrer que si φ(t) = sin(πt)
πt
{φ(t − k), k ∈ Z} est une base orthonormée de l’espace V0 des fonctions de
L2 (R) dont la transformée de Fourier est à support inclus dans [−π, π]. En
définissant les espaces Vj comme l’ensemble des fonctions dont la transformée
de Fourier est à support inclus dans [−2−j π, 2−j π], on peut vérifier que ceci
définit bien une AMR de L2 (R). L’approximation de f ∈ L2 (R) au niveau de
résolution j correspond à un filtre fréquentiel. On peut en effet montrer que
PVˆj f(ω) = fˆ(ω)11[−2−j π,2−j π] (ω).
Généralement, l’approximation au niveau de résolution j correspond à un filtrage
passe-bas dont la largeur de bande est inversement proportionnelle à l’échelle 2j .
25
17
22
16
20
15
18
14
16
13
14
12
12
11
10
24
22
20
20
18
15
16
14
10
12
10
5
8
0
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
10
0
0.1
0.2
0.3
(a)
0.4
0.5
0.6
0.7
0.8
0.9
1
8
0
0.1
0.2
0.3
(b)
3
0.4
0.5
0.6
0.7
0.8
0.9
1
0
0.1
0.2
0.3
(c)
5
0.5
0.6
0.7
0.8
0.9
1
0.6
0.7
0.8
0.9
1
3
2.5
4
0.4
(d)
2
2
2
3
1.5
2
1
1
0.5
0
0
−1
−0.5
−2
−1
1
0
1
0
−1
−1
−3
−1.5
−2
−2
−4
−3
6
0
0.1
0.2
0.3
0.4
0.5
(e)
0.6
0.7
0.8
0.9
1
−5
−2
0
0.1
0.2
0.3
0.4
0.5
(f)
0.6
0.7
0.8
0.9
1
−2.5
0
0.1
0.2
0.3
0.4
0.5
(g)
0.6
0.7
0.8
0.9
1
−3
0
0.1
0.2
0.3
0.4
0.5
(h)
Fig. 3.1 – (a) Signal présentant 2 singularités. Approximation constante par morceaux au niveau : (b) j = 1, (c) j = 2 et (d) j = 3. Projection du signal sur les
sous-espaces d’ondelettes (e) W0 , (f) W1 , (g) W2 et (h) W3 .
41
3.1.3
Filtres mirroirs conjugués
Dans cette section, nous étudions les caractéristiques que doit vérifier une fonction d’échelle φ pour générer une base orthonormée de chaque espace Vj et garantir
toutes les propriétés d’une AMR. Nous montrons en particulier que toute fonction
d’échelle est entièrement spécifiée par un filtre discret appelé filtre mirroir conjugué.
Supposons que l’on ait construit une AMR de L2 (R). La propriété (3.2) impose
que 2−1/2 φ(t/2) ∈ V1 ⊂ V0 et comme {φ(t − k), k ∈ Z} est une base orthonormée
de V0 , on obtient que :
k=+∞
X
1
t
√ φ( ) =
hk φ(t − k)
2 2
k=−∞
où
hk = h2−1/2 φ(t/2), φ(t − k)i.
La suite hk s’interprète
un filtre discret dont la transformée de Fourier est
P+∞comme−ikω
définie par ĥ(ω) = n=−∞ hk e
ce qui permet d’obtenir l’expression suivante :
1
φ̂(2ω) = √ ĥ(ω)φ̂(ω).
2
L’équation précédente implique que l’on peut écrire φ̂ sous la forme :
!
p
−i
Y
ĥ(2 ω)
√
φ̂(ω) =
φ̂(2−p ω).
2
i=1
Et en prenant la limite quand p → +∞, il est alors tentant d’écrire que :
!
+∞
Y
ĥ(2−i ω)
√
φ̂(ω) =
φ̂(0).
2
i=1
Le théorème suivant (dû à S. Mallat et Y. Meyer) donne les conditions nécessaires
et suffisantes sur le filtre ĥ(ω) pour que le produit ci-dessus permette de définir une
AMR.
Théorème 3.1 Soit φ ∈ L2 (R) une fonction d’échelle d’une AMR, alors la transformée de Fourier du filtre défini par hk = h2−1/2 φ(t/2), φ(t − k)i vérifie
√
(3.6)
∀ω ∈ R, |ĥ(ω)|2 + |ĥ(ω + π)|2 = 2, et ĥ(0) = 2.
Réciproquement, si ĥ(ω) est une fonction 2π-périodique et continûment dérivable au
voisinage de ω = 0, alors si ĥ vérifie les propriétés (3.6) et si
inf
ω∈[−π/2,π/2]
|ĥ(ω)| > 0,
42
alors le produit
φ̂(ω) =
+∞
Y
ĥ(2−iω)
√
2
i=1
!
,
est la transformée de Fourier d’une fonction d’échelle φ ∈ L2 (R) qui définit une
AMR.
Le théorème précédent montre qu’il est donc équivalent de connaı̂tre le filtre
(hk )k∈Z ou la fonction d’échelle φ, et que la construction d’une AMR de L2 (R) peut
se faire à partir d’un filtre qui vérifie les propriétés énoncées ci-dessus. En effet, si
on connait la fonction φ, on construit une AMR en définissant :
Vj = V ect {2−j/2φ(2−j x − k), k ∈ Z}.
La caractérisation des fonctions d’échelles à partir de la donnée des filtres (hk )k∈Z
permet donc d’établir un lien entre les mathématiques appliquées et la théorie du
filtrage discret en traitement du signal. Ceci va se révéler particulièrement utile pour
le calcul des coefficients d’ondelettes d’un signal discret comme nous le verrons par
la suite. Nous avons vu précédemment que pour l’
– Approximation constante par morceaux, φ(t) = 11[0,1] (t) et que φj,k (t) =
2−j/2 11Ij,k (t), (j, k) ∈ Z2 . On obtient alors que
hk =
√1
2
0
si k = 0, 1
sinon
– Approximation de Shannon, φ̂(ω) = 11[−π,π](ω) ce qui implique que pour
√
tout ω ∈ [−π, π], ĥ(ω) = 211[−π/2,π/2] (ω). En utilisant le fait que la famille de
fonctions {e−ikω }k∈ZR est une base orthonormée de L2 ([−π, π]) pour le produit
π ˆ
1
scalaire hfˆ, ĝi = 2π
f (ω)ĝ(ω)dω, on obtient alors que
−π
√ Z π/2
√ sin( π2 k)
2
hk =
eikω dω = 2
.
2π −π/2
πk
3.1.4
Ondelettes orthogonales
L’approximation d’une fonction f aux échelles 2j et 2j−1 est définie par la projection orthogonale de f sur les espaces Vj et Vj−1 respectivement. Etant donné que
Vj ⊂ Vj−1, on définit l’espace Wj comme l’espace complémentaire orthogonal de Vj
dans Vj−1 i.e.
M
Vj−1 = Vj
Wj .
L’approximation de f à l’échelle 2j−1 peut donc se décomposer sous la forme
M
PVj−1 f = PVj f
PWj f.
43
L’espace Wj permet de calculer les détails PWj f pour la fonction f qui permettent
de passer de l’approximation à l’échelle 2j à une approximation plus fine à l’échelle
2j−1 . De la définition d’une AMR, on déduit les propriétés suivantes (S. Mallat et
Y. Meyer) qui permettent de construire une base orthornormée de Wj à partir de
contractions et dilatations d’une ondelette ψ :
–
–
–
–
–
∀(j, j ′ ) ∈ Z2 , j 6= j ′ ⇒ Wj ⊥Wj ′ ,
L
2
j∈Z Wj = L (R),
f (t) ∈ Wj ⇐⇒ f ( 2t ) ∈ Wj+1
∀(j, k) ∈ Z2 , f (t) ∈ Wj =⇒ f (t − 2j k) ∈ Wj
soit
1
ω
ω
ψ̂(ω) = √ ĝ( )φ̂( ), avec ĝ(ω) = e−iω ĥ(ω + π),
2
2 2
j k
et posons ψj,k (t) = √12j ψ t−2
. Alors pour tout j ∈ Z, {ψj,k , k ∈ Z} est une
2j
base orthonormée de Wj , et donc {ψj,k , (j, k) ∈ L2 (R)} est une base orthonormée de L2 (R). La fonction ψ est appelée ondelette mère ou plus simplement
ondelette de l’AMR.
Les espaces Wj sont appelés les sous-espaces de détail ou sous-espaces d’ondelettes. Ils caractérisent la différence d’information entre les projections sur les espaces
Vj et Vj−1 . De ce qui précède, on obtient que si l’on dispose d’une AMR de L2 (R)
alors toute fonction f ∈ L2 (R) peut s’écrire sous la forme d’une décomposition en
ondelettes
+∞
+∞ X
+∞
X
X
hf, ψj,k iψj,k ,
PW j f =
f=
j=−∞ k=−∞
j=−∞
et pour tout j0 ∈ Z,
f = PVj0 f +
j0
X
j=−∞
PW j f =
+∞
X
hf, φj0 ,k iφj0 ,k +
k=−∞
j0
+∞
X
X
hf, ψj,k iψj,k .
j=−∞ k=−∞
Comme ψ ∈ V0 , l’ondelette vérifie l’équation
+∞
X
1
t
√ ψ( ) =
gk φ(t − k)
2 2
k=−∞
et on peut alors montrer que la fonction ĝ introduite précédemment est la transformée de Fourier du filtre discret (gk )k∈Z qui est donné par
gk = h2−1/2 ψ(t/2), φ(t − k)i.
On peut également montrer que (gk )k∈Z est un filtre mirroir de (hk )k∈Z i.e.
gk = (−1)1−k h1−k .
44
Cette propriété de filtre en mirroir joue un rôle important dans la mise au point d’algorithmes rapides de transformée en ondelettes. En reprenant les exemples précédents
d’AMR, on obtient que
– Approximation constante par morceaux. Le ondelettes de Haar correspondent au cas d’une AMR constituée des fonctions constates par morceaux
et sont telles que :

 −1 si 0 ≤ t < 1/2
1
si 1/2 ≤ t < 1
ψ(t) =

0
sinon
et
gk =

1
 − √2
√1
2

0
si k = 0
si k = 1
sinon
– Approximation de Shannon, φ̂(ω) = 11[−π,π] (ω) et ĥ(ω) =
ce qui implique que
−iω/2
S
e
si ω ∈ [−2π, −π] [π, 2π]
ψ̂ =
0
sinon,
et
ψ(t) =
√
211[−π/2,π/2] (ω)
sin 2π(t − 1/2) sin π(t − 1/2)
−
.
2π(t − 1/2)
π(t − 1/2)
Généralement, pour les ondelettes orthogonales,
l’énergie de ψ̂ est essentiellement
S
concentrée sur les intervalles [−2π, −π] [π, 2π]. La projection de f sur l’espace Wj
correspond donc à un filtrage passe-bande dont la largeur dépend du niveau de
résolution j. La Figure 3.1 donne un exemple de projection d’une fonction dans
différents espaces de détails Wj , j = 0, 1, 2, 3 pour la base de Haar.
3.2
3.2.1
Construction de bases d’ondelettes
Liens entre filtres, nombre de moments nuls et régularité
de l’ondelette
Les ondelettes de Shanon sont des fonctions C ∞ qui décroissent lentement quand
t tend vers +∞ et −∞, et qui ont un nombre infini de moments nuls. Toutefois,
elles ne sont pas à support compact. L’un des buts d’une décomposition en ondelettes dans une base orthonormée, est de représenter une fonction f avec peu de
coefficients significatifs. Nous allons voir par la suite que les ondelettes à support
compact sont bien adaptées pour obtenir des représentations parcimonieuses (ou
creuses) d’un signal. L’amplitude des coefficients d’ondelettes et le nombre de coefficients significatifs dépend à la fois de
45
– la régularité de f
– du nombre de moments nuls r
– de la taille du support de ψ
Les deux dernières propriétés ainsi que la régularité de l’ondelette ψ peuvent être
reliées aux caractéristiques du filtre (hk )k∈Z .
• Nombre de moments nuls : rappelons que si une ondelette a r moments nuls,
alors elle est orthogonale à tous les polynômes de degré inférieur ou égal r−1. Dans le
chapitre précédent, nous avons montré que si f est suffisamment régulière alors l’amplitude coefficients d’ondelettes |hf, ψj,k i| est d’autant plus petite aux fines échelles
(j → −∞) que r est grand car |hf, ψj,k i| est borné par 2j(r+1/2) . Soient ψ et φ les
fonctions ondelette et d’échelle d’une AMR telles que |ψ(t) = O((1 + t2 )−r/2−1 )|
et |ψ(t) = O((1 + t2 )−r/2−1 )|, alors les trois assertions suivantes suivantes sont
équivalents et montrent que le nombre de moments nuls dépend du nombre de zéros
de ψ̂ et ĥ aux points ω = 0 et ω = π :
– l’ondelette ψ a r moments nuls
– ψ̂(ω) et ses r − 1 dérivées sont nulles au point ω = 0
– ĥ(ω) et ses r − 1 dérivées sont nulles au point ω = π
• Taille du support de l’ondelette : si f a une singularité isolée en point x0 et si le
support de ψj,k contient le point x0 alors l’amplitude de |hf, ψj,k i| peut être élevée. Si
ψ est à support compact de taille K, alors à l’échelle j, il y a K coefficients |hf, ψj,k i|
qui sont influencés par le comportement de f au voisinage de x0 . Pour réduire le
nombre de coefficients de grande amplitude, il est donc nécessaire de minimiser la
taille du support de ψ. La proposition suivante montre que la taille du support de
l’ondelette est relié à la longueur du filtre (hk )k∈Z (nombre de coefficients hk non
nuls) :
Proposition 3.5 Le filtre h et la fonction d’échelle ψ sont à support compact si et
seulement si leurs supports sont égaux. Si le support de h et de la fonction d’échelle
ψ est [N1 , N2 ], alors le support de ψ est [(N1 − N2 + 1)/2, (N2 − N1 + 1)/2].
• Taille du support et nombre de moments nuls : pour de ondelettes orthogonales, la taille du support et le nombre de moments nuls ne sont pas indépendants.
En effet, il est possible de montrer (théorème dû à I. Daubechies) que si ψ a r
moments nuls, alors son support est au moins de taille 2r − 1. Nous verrons par
la suite que les ondelettes de Daubechies sont optimales dans le sens où elles ont
une taille de support minimale pour un nombre de moments nuls donné. Lors d’une
décomposition en ondelettes, il est donc nécessaire de trouver un compromis entre
taille du support et nombre de moments nuls. Si le signal f a quelques singularités isolées et est très régulier entre ces points, on peut choisir une ondelette avec
un nombre de moments nuls élevés de sorte à produire peu de coefficients d’ondelettes |hf, ψj,k i| significiatifs. Si le nombre de singularités augmente, le nombre de
46
fonctions analysantes ψj,k dont le support contient une singularité augmente et il
peut donc être judicieux de réduire la taille du support de ψ même si cela diminue r.
• Régularité de l’ondelette : on peut montrer que la régularité de ψ est reliée au
nombre de zéros de ĥ en ω = π. La régularité de l’ondelette influence
laP
qualité de reP
+∞
construction ou de débruitage d’un signal. En effet, si on a f = +∞
k=−∞ hf, ψj,k iψj,k ,
j=−∞
alors une perturbation de ǫ d’un coefficent hf, ψj,k i ajoute la composante ǫψj,k . Plus
l’ondelette est régulière et moins cette perturbation sera visible.
Enfin, il est important d’insister sur le fait que l’amplitude des coefficients d’ondelettes dépend du nombre de moments nuls et non de la régularité de l’ondelette
ψ.
3.2.2
Quelques exemples classiques d’ondelettes
• Ondelettes de Haar : la base de Haar est obtenue à partir d’une AMR constituée
de fonctions constantes par morceaux. Le filtre (hk )k∈Z a deux coefficients non nuls
aux points k = 0 et k = 1, et l’ondelette de Haar a le plus petit support parmi
toutes les ondelettes orthogonales. Toutefois, il s’agit d’une fonction discontinue qui
n’est pas bien adaptée pour représenter les signaux lisses.
• Ondelettes de Daubechies : une ondelette de Daubechies a un support de taille
minimale égal à [−r + 1, r] pour un nombre de moments nuls r donné. De plus, la
régularité de ces ondelettes augmente avec r. Le support de la fonction d’échelle φ
est [0, 2r − 1].
• Symmlets : les ondelettes de Daubechies sont très assymétriques. Daubechies a
montré que l’ondelette de Haar est la seule ondelette symmétrique. Les ondelettes
Symmlets sont construites de sorte à avoir des fonctions analysantes les moins assymétriques possibles. Il s’agit à nouveau d’ondelettes qui ont un support minimal
égal à [−r + 1, r] avec r moments nuls.
• Coiflets : il s’agit d’une ondelette qui a r moments nuls et une taille de support
minimale, dont la fonction d’échelle φ vérifie
Z +∞
Z +∞
φ(t)dt = 1, et
tk φ(t)dt = 0 pour 1 ≤ k < r.
−∞
−∞
Ces fonctions d’échelles sont très utiles pour établir des formules précises entre l’approximation d’une fonction dans un espace VJ etRl’échantillonnage d’une fonction. En
+∞
effet, pour une ondelette donnée on a toujours −∞ φ(t)dt = 1 et si on suppose que
f est C 1 alors, en utilisant un développement de Taylor, on obtient l’approximation
suivante entre les échantillons de f et sa projection dans le sous-espace VJ :
2−J/2 hf, φJ,k i ≈ f (2J k) + O(2J ).
47
Si on utilise des Coiflets, on augmente la qualité de l’approximation car dans ce cas
on montre que si f est C k avec k < r alors
2−J/2 hf, φJ,k i ≈ f (2J k) + O(2J(k+1) ).
La taille du support des Coiflets est 3r − 1.
La Figure 3.2 donne les graphes des ondelettes de Daubechies et Symmlets pour
différentes valeurs de r. On peut constater que pour ces ondelettes la régularité de
ψ augmente avec r.
2
2
1.5
1.5
1
1
0.5
0.5
0
0
−0.5
−0.5
−1
−1
1.5
1
0.5
0
−0.5
−1.5
−1
−0.5
0
0.5
1
1.5
2
−1.5
−2
−1.5
−1
−0.5
0
(a)
0.5
1
1.5
2
2.5
3
−1
−3
−2
−1
(b)
1.5
0
1
2
3
4
(c)
1.5
1
1
1
0.5
0.5
0.5
0
0
0
−0.5
−0.5
−0.5
−1
−1
−1
−1.5
−4
−3
−2
−1
0
(d)
1
2
3
4
5
−1.5
−5
−4
−3
−2
−1
0
1
2
3
4
5
6
−1.5
−6
(e)
−4
−2
0
2
4
6
(f)
Fig. 3.2 – Ondelettes de Daubechies (a) r = 2, (b) r = 3, (c) r = 4, et Symmlets
(d) r = 5, (e) r = 6, (f) r = 7.
La Figure 3.3 donne un exemple de décomposition dans différentes bases d’ondelettes du signal tracé dans la Figure 3.1(a). On peut remarquer que les coefficients
d’ondelettes de grande amplitude se concentrent au niveau des singularités du signal à mesure que l’échelle diminue (j → −∞) et que le nombre de coefficients
significatifs dépend du nombre de moments nuls r.
3.2.3
Ondelettes sur un intervalle borné
Dans les sections précédentes, nous avons étudié la construction de bases d’ondelettes pour des fonctions de L2 (R). En pratique, les signaux rencontrés sont soit
périodiques, soit définis sur un intervalle bornée, par exemple [0, 1]. Afin de pouvoir
analyser des signaux réels, il est donc nécessaire de pouvoir construire des bases
d’ondelettes pour l’espace L2 ([0, 1]). En effet, il n’est pas judicieux d’utiliser une
AMR de L2 (R) pour une fonction f de L2 ([0, 1]) en imposant f = 0 en dehors de
48
10
−2
8
−2.5
−3
6
−3.5
4
−4
2
−4.5
0
−5
−2
−5.5
−4
−6
−6
−8
−6.5
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
−7
0
0.1
0.2
0.3
0.4
(a)
−2
−2
−2.5
−3
−3
−3.5
−3.5
−4
−4
−4.5
−4.5
−5
−5
−5.5
−5.5
−6
−6
−6.5
−6.5
0
0.1
0.2
0.3
0.4
0.5
(c)
0.6
0.7
0.8
0.9
1
0.6
0.7
0.8
0.9
1
(b)
−2.5
−7
0.5
0.6
0.7
0.8
0.9
1
−7
0
0.1
0.2
0.3
0.4
0.5
(d)
Fig. 3.3 – (a) Signal présentant 3 singularités. Coefficients d’ondelettes au niveau
j = −3, −4, −5, −6 dans la base de (b) Haar, (c) Daubechies r = 2 et (d) Symmlets
r = 4. Les barres verticales représentent l’amplitude de 2−j coefficients d’ondelettes
au niveau de résolution j.
[0, 1], car cette extension crée généralement deux discontinuités en t = 0 et t = 1 qui
génèrent de grands coefficients près des bords. Des bases d’ondelettes de L2 ([0, 1])
sont obtenues en modifiant les ondelettes (ψj,k )(j,k)∈Z2 d’une base de L2 (R). Les ondelettes intérieures (dont le support est inclus dans [0, 1]) ne sont pas modifiées,
alors que les ondelettes aux bords, dont le support contient les points t = 0 ou t = 1,
sont transformée en des fonctions à support dans [0, 1] de sorte à générer une base
orthonormée de L2 ([0, 1]). La principale difficulté de cette construction est d’obtenir
des ondelettes qui conservent leur nombre de moments nuls. Nous citerons deux approches pour construire des ondelettes sur un intervalle bornée et nous détaillerons
uniquement la construction pour des ondelettes périodiques. Les fonctions d’échelle
φj,k sont également modifiées pour avoir un support inclus dans [0, 1]. Si ψ est à
support compact, il existe un nombre constant d’ondelettes incluses dans un intervalle borné à chaque échelle. Une base orthonormée d’ondelettes de L2 ([0, 1]) est
alors constituée de 2−J fonctions d’échelle à une échelle 2J < 1 et de 2−j ondelettes
à chaque échelle 2j ≤ 2J :
o
n
(φ̃J,k )0≤k<2−J , (ψ̃j,k )−∞<j≤J,0≤k<2−j ,
49
et une fonction f ∈ L2 ([0, 1]) se décompose alors sous la forme
f=
−j
2−J
−1
X
J
2X
−1
X
hf, ψ̃j,k iψ̃j,k .
hf, φ̃J,k iφ̃J,k +
k=0
j=−∞ k=0
Sur un intervalle [a, b], une base orthonormée d’ondelettes de L2 ([a, b]) peut alors
se construire par translation de a et dilatation par b − a d’ondelettes sur l’intervalle
[0, 1].
• Ondelettes périodiques : une base d’ondelettes de L2 ([0, 1]) peut être obtenue
en périodisant une AMR de L2 (R) i.e. en posant
φ̃J,k (t) = 2
−J/2
+∞
X
φJ,k (t + l) et ψ̃j,k (t) = 2
−j/2
l=−∞
+∞
X
ψj,k (t + l) .
l=−∞
Pour j ≤ 0, il y a 2−j ondelettes différentes ψ̃j,k indexée par 0 ≤ k < 2−j . Si le
support de ψj,k est inclus dans [0, 1] alors ψ̃j,k = ψj,k . Sinon l’ondelette ψj,k est
transformée en une fonction qui a deux composantes disjointes au voisinage de t = 0
et t = 1 (voir Figure 3.4).
1.5
1
1
0.5
0.5
0
0
−0.5
−0.5
−1
−1
−1.5
0
0.1
0.2
0.3
0.4
0.5
(a)
0.6
0.7
0.8
0.9
1
−1.5
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
(b)
Fig. 3.4 – Ondelettes périodiques sur [0, 1] pour j = −3, k = 0 (a) Daubechies , (b)
Symmlets (r = 6).
n
−j
o
En notant Ṽj et W̃j les sous-espaces vectoriels engendrés par φ̃j,k , 0 ≤ k < 2
n
o
et ψ̃j,k , 0 ≤ k < 2−j respectivement, on montre que les ondelettes périodiques
50
générent une AMR de L2 ([0, 1]) dans le sens où
∀j ≤ 0,
[
Ṽj
Ṽj ⊂ Ṽj−1
=
L2 ([0, 1])
f (t) ∈ Ṽj
φ̃0,0 (t) = 1
dimṼj = 2−j
dimW̃j = 2−j
⇒
et
et
et
Ṽj−1
=
f (t/2) ∈ Ṽj+1
Ṽ0 = {f ∈ L2 ([0, 1]), f = cste}
φ̃j,k (t) = φ̃j,0(t − 2j k) est une base orthonormée de Ṽj ,
ψ̃j,k (t) = ψ̃j,0 (t − 2j k) est une base orthonormée de W̃j
M
Ṽj
W̃j
j≤0
˜ = f (t mod 1)
Pour f ∈ L2 ([0, 1]), on note f˜ la périodisation de f sur R (i.e. f(t)
pour t ∈ R). On peut alors facilement vérifier que
˜ ψj,k i.
hf, φ̃j,k i = hf˜, φj,k i et hf, ψ̃j,k i = hf,
Les coefficients d’ondelettes périodiques peuvent donc s’interpréter comme la décomposition
de f˜ (périodisation de f sur R) dans une base d’ondelettes de L2 (R). Les ondelettes
périodiques composées de deux segments disjoints au voisinage t = 0 et t = 1 n’ont
pas de moments nuls ce qui génére de grands coefficients d’ondelttes au bord de [0, 1]
(voir Figure 3.5). En effet, si f (0) 6= f (1) alors ces ondelettes se comportent comme
si le signal était discontinu en t = 0 et t = 1. Malgré le mauvais comportement des
ondelettes périodiques aux bords de [0, 1], celles-ci sont souvent employées pour la
simplicité de leur implémentation numérique.
2
−2
1.8
−3
1.6
−4
1.4
−5
1.2
−6
1
−7
0.8
0
0.1
0.2
0.3
0.4
0.5
(a)
0.6
0.7
0.8
0.9
1
−8
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
(b)
Fig. 3.5 – (a) Signal régulier f avec une singularité en x = 0.5, (b) Coefficients
d’ondelettes pour une Symmlet avec r = 8 moments nuls. On peut remarquer que
f (0) et f (1) sont très différents, ce qui génére de grands coefficients aux bords de
[0, 1].
51
• Ondelettes sur l’intervalle : comme nous l’avons vu précédedemment, les coefficients d’ondelettes sont de faible amplitude dans les régions où le signal est
régulier si les ondelettes analysantes ont suffisamment de moments nuls. Les ondelettes périodiques localisées au voisinage de t = 0 et t = 1 n’ont pas de moment
nul, et ne peuvent donc pas prendre en compte la régularité d’un signal aux bornes
de [0, 1]. Ce comportement génère des coefficients de grande amplitude qui ne correspondent pas à la présence de singularités. Cohen, Daubechies et Vial ont proposé
une technique pour obtenir des ondelettes sur l’intervalle [0, 1] qui ont autant de moments nuls que l’ondelette orginale ψ. Toutefois, cette construction est plus longue
et plus compliquée à décrire que celle des des ondelettes périodiques, et nous renvoyons à Mallat [7] pour une présentation détaillée. Nous verrons en TP l’intérêt
d’utiliser des ondelettes sur l’intervalle par rapport aux ondelettes périodiques.
3.2.4
Ondelettes et bancs de filtres
Soit f ∈ L2 (R) et φ, ψ les fonctions d’échelle et d’ondelette d’une AMR de
L2 (R). Nous avons vu que la projection orthogonale PVj f de f dans l’espace Vj peut
s’exprimer comme la somme des projections orthogonales de f dans les sous-espaces
Vj+1 et Wj+1 où
PVj f =
X
aj,k φj,k
et
aj,k = hf, φj,k i
aj+1,k φj+1,k
et
aj+1,k = hf, φj+1,k i
dj+1,k ψj+1,k
et
dj+1,k = hf, ψj+1,k i
k∈Z
PVj+1 f =
X
k∈Z
PWj+1 f =
X
k∈Z
Soient (hk )k∈ZZ et (gk )k∈ZZ les filtres conjugués en miroir associés aux fonctions
φ et ψ. On montre alors que
• Formule de décomposition : le cadre de l’AMR conduit naturellement à un
algorithme rapide de calcul des coefficients
d’ondelettes à partir de l’approximation
LL−1
d’une fonction
dans
un
espace
V
=
V
L
J
j=J Wj qui est basée sur la décomposition
L
Vj = Vj+1 Wj+1 et la définition des filtres conjugués en miroir :
aj+1,k =
X
n∈Z
hn−2k aj,n et dj+1,k =
X
gn−2k aj,n
n∈Z
Pour une suite (xk )k∈Z , on note (x̄k )k∈Z la suite obtenue en inversant les éléments
de la suite x i.e. x̄k = x−k . Les formules de décomposition ci-dessus peuvent alors
s’exprimer à l’aide de convolutions discrètes suivies par un sous-échantillonnage d’un
facteur 2 :
aj+1,k = aj ⋆ h̄[2k] et dj+1,k = aj ⋆ ḡ[2k].
52
La décomposition d’un signal dans une base d’ondelettes fait donc intervenir une
succession de convolutions discrètes avec le filtre passe-bas h̄ et le filtre passe-haut ḡ.
La décomposition d’une suite aL = hf, φL,k i, k ∈ Z dans une base orthonormée d’ondelette est donc composée des coefficients d’ondelettes de f aux échelles 2L < 2j ≤ 2J
plus les coefficients d’échelles à l’échelle la plus grossière 2J i.e. l’ensemble de coefficients {(dj )L<j≤J , aJ } qui est calculé à l’aide des formules de décomposition
ci-dessus.
• Formule de reconstruction : la reconstruction ou synthèse des coefficients
d’ondelettes consiste à retrouver la suite aL à partir de l’ensemble de coefficients
{(dj )L<j≤J , aJ }. On utilise alors la récurrence ascendante suivante
aj,k =
X
n∈Z
hk−2n aj+1,n +
X
gk−2n dj+1,n
n∈Z
Pour une suite (xk )k∈Z , on note (x̃k )k∈Z la suite obtenue en insérant un zéro entre
chaque élément de la suite x i.e. x̃k = xp si k = 2p et x̃k = 0 si k = 2p + 1. Les
formules de décomposition ci-dessus peuvent alors s’exprimer à l’aide de convolutions
discrètes
aj,k = ãj+1 ⋆ h[k] + d˜j+1 ⋆ g[k].
• Initialisation de l’algorithme : en pratique, on doit déterminer
les coefficients
d’échelle aL à partir de la discrétisation d’un signal f ( Nk ) k∈Z où 1/N est le pas
d’échantillonnage. On doit donc pouvoir associer à la suite f ( Nk ) k∈Z un ensemble
de coefficients qui soit une bonne approximation de la projection de f dans VL . Nous
avons vu précédemment que si f est C 1 alors 2−L/2 aL,k = f (2L k) + O(2L) et si f
est C k , en utilisant des Coiflets, on obtient que 2−L/2 aL,k = f (2Lk) + O(2L(k+1)).
Donc, si N = 2−L , on pourra considérer que aL,k ≈ N −1/2 f ( Nk ) constitue une bonne
approximation de PVL f pour initialiser l’algorithme de décomposition dans une base
d’ondelettes.
• Complexité de l’algorithme : supposons que les filtres h et g sont de longueur
finie K (cas des ondelettes à support compact). Si aL est une suite de longueur
N = 2−L , alors les suites aj et dj sont de longueur 2−j pour L < j ≤ J. Les formules
de décomposition ci-dessus impliquent donc que aj+1 et dj+1 sont calculées avec au
plus 2−j K additions et multiplications, et les formules de reconstruction montrent
que aj est obtenue à partir de aj+1 et dj+1 avec au plus 2−j K opérations. Le coût de
la décomposition ou de la reconstruction de la suite aL dans une base d’ondelettes
orthogonales est donc en O(n).
• Signaux finis et ondelettes périodiques : supposons que le signal f est observé
sur [0, 1] et que l’on dispose d’un échantillon f ( Nk ), k = 0, . . . , N −1. Notons aL,k , k =
0, . . . , N −1 l’approximation de f dans l’espace VL obtenue à partir de cet échantillon.
Les formules de décomposition impliquent de connaı̂tre les valeurs de aL au delà des
53
bornes k = 0 et k = N − 1. Nous avons vu précédemment que la décomposition
dans une base d’ondelettes périodiques d’une fonction f ∈ L2 ([0, 1]) est équivalente
à la décomposition dans une base d’ondelettes de L2 (R) de la périodisation de f sur
R. Ainsi pour calculer les coefficients d’ondelettes de f dans une base d’ondelettes
périodiques de L2 ([0, 1]), il suffit de périodiser la suite aL,k , k = 0, . . . , N − 1 en
posant ãL,k = aL,k mod N .
3.3
3.3.1
Bases d’ondelettes pour des images
Bases d’ondelettes séparables et multirésolution en 2D
Une base d’ondelettes de L2 (R2 ) peut être construite à partir d’une base d’ondelettes de L2 (R). Soient φ la fonction d’échelle et ψ la fonction d’ondelette d’une
AMR de L2 (R), et notons Vj et Wj les sous-espaces d’approximation et de détails
associés. Une analyse multirésolution séparable de L2 (R2 ) est définie à l’aide du
produit tensoriel des espaces d’approximation 1D
Vj2 = Vj ⊗ Vj
Les espaces Vj2 vérifient les propriétés de l’extension de la définition d’une AMR
de L2 (R) au cas des images (relation d’échelle, suite emboı̂tée, approximation...).
L’espace Vj2 est l’ensemble des fonctions f ∈ L2 (R2 ) qui s’écrivent comme des combinaisons linéaires de fonctions séparables 1D
X
f (x1 , x2 ) =
ak hk (x1 )gk (x2 ) avec hk ∈ Vj , gk ∈ Vj .
k∈Z
L’ensemble de fonctions φ2j,k (x1 , x2 ) = φj,k1 (x1 )φj,k2 (x2 ) k=(k ,k )∈Z2 constitue
1 2
une base orthonormée de Vj2 obtenue en dilatant la fonction d’échelle φ2 (x1 , x2 ) =
φ(x1 )φ(x2 ) d’un facteur 2j et en la translatant sur une grille 2D de côté 2j .
• Approximation constante par morceaux : soient Vj l’espace des fonctions
de L2 (R) qui sont constantes sur les intervalles [2j k, 2j (k + 1)[, k ∈ Z. Une AMR
constituée de fonctions constantes par morceaux en 2D est alors construite à l’aide
des sous-espaces d’approximation Vj2 constitués des images constantes sur les carrés
[2j k1 , 2j (k1 + 1)[×[2j k2 , 2j (k2 + 1)[, (k1 , k2 ) ∈ Z2 .
2
2
Soit Wj+1
le complément orthogonal de Vj+1
dans Vj2 i.e.
M
2
2
Vj2 = Vj+1
Wj+1
.
Une base d’ondelettes orthogonales de Wj2 peut être construite en définissant trois
ondelettes
ψ 1 (x1 , x2 ) = φ(x1 )ψ(x2 )
ψ 2 (x1 , x2 ) = ψ(x1 )φ(x2 )
ψ 3 (x1 , x2 ) = ψ(x1 )ψ(x2 ).
54
p
En posant pour 1 ≤ p ≤ 3 et k = (k1 , k2 ) ∈ Z2 , ψj,k
(x) =
1 p
ψ
2j
x1 −2j k1 x2 −2j k2
, 2j
2j
, on
1
2
3
montre que la famille d’ondelettes {ψj,k
, ψj,k
, ψj,k
}k∈Z2 est une base orthogonale de
2
1
2
3
Wj et que {ψj,k , ψj,k , ψj,k }j∈Z,k∈Z2 est une base d’ondelettes orthogonales de L2 (R2 ).
Nous verrons par la suite que les coefficients d’ondelettes calculés avec
– ψ 1 sont larges le long des contours horizontaux,
– ψ 2 sont larges le long des contours verticaux,
– ψ 3 sont larges le long des contours diagonaux dans une image.
3.3.2
Algorithme rapide de transformée en ondelettes 2D
Les algorithmes de décomposition et de reconstruction pour une base d’ondelettes
de L2 (R) peuvent être étendus au cas des images pour construire des algorithmes
rapides de calculs des coefficients d’ondelettes en 2D. Pour j ∈ Z et k ∈ Z2 , on
définit les coefficients d’approximation et de détails en 2D pour f ∈ L2 (R2 ) par
p
aj,k = hf, φ2j,k i et dpj,k = hf, ψj,k
i, 1 ≤ p ≤ 3.
Soient (hk )k∈Z et (gk )k∈Z les filtres associés à l’ondelette ψ. On a alors les relations suivantes :
• Formule de décomposition : les coefficients d’approximation et de détails à
l’échelle 2j+1 sont obtenus à partir des coefficients d’approximation à l’échelle 2j à
l’aide de six groupes de convolutions discrètes uni-dimensionnelles combinées avec
des sous-echantillonnages d’un facteur 2 le long des colonnes et des lignes de l’image
aj
aj →lignes ⋆h̄ ↓ 2
→colonnes ⋆h̄ ↓ 2 → aj+1
→colonnes ⋆ḡ ↓ 2 → d1j+1
aj →lignes ⋆ḡ ↓ 2
→colonnes ⋆h̄ ↓ 2 → d2j+1
→colonnes ⋆ḡ ↓ 2 → d3j+1
• Formule de reconstruction : de même la reconstruction des coefficients d’ondelettes à l’échelle 2j peut se faire à partir des coefficients d’échelles aj+1 et d’ondelettes d1j+1 , d2j+1, d3j+1 à l’échelle 2j+1 . Cette reconstruction peut également s’exprimer à partir de six groupes de convolutions discrètes uni-dimensionnelles combinées avec des insertions de zéros le long des lignes et des colonnes des images
aj+1 , d1j+1, d2j+1, d3j+1
aj+1 →colonnes↑ 2 ⋆ h
d1j+1 →colonnes ↑ 2 ⋆ g
d2j+1
d3j+1
→colonnes ↑ 2 ⋆ h
→colonnes↑ 2 ⋆ g


⊕ →lignes↑ 2 ⋆ h 






⊕ →lignes ↑ 2 ⋆ g 

⊕ → aj
55
Soit f ∈ L2 (R) une image dont on connaı̂t une discrétisation de pas N −1 = 2L . La
projection de f dans l’espace VL peut être approximée par aL,k = N −1 f ( kN1 , kN2 ) pour
k = (k1 , k2 ) ∈ Z2 . La représentation de f dans une base d’ondelettes est calculée
en itérant la formule de décomposition ci-dessus pour obtenir pour L < j ≤ J
l’ensemble d’images :
{aJ , (d1j , d2j , d3j )L<j≤J }
• Cas des images de taille finie : supposons que l’on dispose d’une image carrée
aL de taille finie contenant N 2 = 2−2L pixels. Comme dans le cas uni-dimensionnels
la décomposition en ondelettes de aL peut être obtenue en utilisant des ondelettes
périodiques 1D ce qui revient à calculer à périodiser l’image aL dans R2 puis à utiliser
les formules de décomposition et reconstruction 2D ci-dessus. Pour L < j ≤ J, les
images aj , d1j , d2j et d3j sont constituées de 2−2j coefficients. Si les filtres h et g sont
de longueur finie, on peut vérifier que le coût des l’algorithmes de décomposition et
de reconstruction en ondelettes 2D est en 0(N 2 ).
3.3.3
Quelques exemples de décomposition en ondelettes
pour des images
• Approximation dans les espaces Vj : la Figure 3.6 donne un exemple de
projection d’une image de taille 256 × 256 dans plusieurs espaces d’approximation
Vj , j = −6, −5, −4 pour des ondelettes de Haar et des Symmlets avec r = 8 moments nuls. On peut constater que la qualité de l’approximation se dégrade plus
rapidement avec les ondelettes de Haar à mesure que l’échelle d’analyse augmente.
Dans les Figures 3.6(b-c-d) l’approximation est constituée d’images constantes par
morceaux sur des carrés de côté 2j , j = −6, −5, −4, alors que les approximations
obtenues avec des Symmlets représentées dans les Figures 3.6(e-f-g) sont nettement
plus lisses.
• Représentation des coefficients d’ondelettes en 2D : l’ensemble des coefficients d’échelle et de détails en 2D est de même taille que le nombre de pixels
de l’image originale et peut se représenter sous la forme d’une image organisée de
façon hiérarchique (voir Figure 3.7) dont les pixels les plus noirs représentent les
coefficients de grande amplitude alors que les pixels blancs représentent les coeffciients d’ondelettes les moins significatifs. La Figures 3.8 donne des exemples de
décomposition en ondelettes de trois images de taille 256 × 256 pixels. On peut
constater qu’aux petites échelles, les coefficients d’ondelettes de grande amplitude
se concentrent au voisinage des points où l’intensité des pixels des images change
rapidement. Ils correspondent soit aux contours horizontaux (d1j ), soit aux contours
verticaux (d2j ) ou soit aux contours diagonaux d’une image (d3j ).
56
(a)
(b)
(c)
(d)
(e)
(f)
(g)
Fig. 3.6 – (a) Image de Lenna, 256 × 256 pixels. Approximation avec des ondelettes
de Haar dans les espaces Vj : (b) j = −6, (c) j = −5, (d) j = −4. Approximation
avec des ondelettes Symmlets avec r = 8 moments nuls dans les espaces Vj : (e)
j = −6, (f) j = −5, (g) j = −4.
Insérer Figure
Fig. 3.7 – Représentation des coefficients de détails et d’échelle en 2D.
57
50
50
100
100
150
150
200
200
250
250
50
100
150
200
250
50
100
(a)
150
200
250
150
200
250
150
200
250
(b)
50
50
100
100
150
150
200
200
250
250
50
100
150
200
250
50
100
(c)
(d)
50
50
100
100
150
150
200
200
250
250
50
100
150
(e)
200
250
50
100
(f)
Fig. 3.8 – Exemples de décomposition en ondelettes 2D pour des images de taille
256×256 pixels et j = −7, −6, −5. (a) Boite avec une croix, (b) Coefficients d’échelle
et de détails, ondelette Symmlet r = 4. (d) Lenna, (d) Coefficients d’échelle et de
détails, ondelette Coiflet r = 8. (e) Scan MRI, (f) Coefficients d’échelle et de détails,
ondelette Daubechies r = 2
58
Chapitre 4
Approximation, estimation et
compression dans des bases
d’ondelettes
Nous avons vu précédemment que la décroissance de l’amplitude de la TOC aux
fines échelles permet de caractériser la régularité globale ou locale d’un signal. De la
même façon, il est possible sous certaines hypothèses, de relier la décroissance des
coefficients dans une base d’ondelettes à la régularité d’un signal. Dans ce chapitre,
nous allons voir que cette propriété permet d’approximer un signal en gardant uniquement les coefficients d’ondelettes qui sont les plus significatifs. Cette propriété
d’approximation permet de représenter efficacement des signaux qui ne sont pas homogènes c’est à dire qui ne sont pas uniformément réguliers. Nous verrons également
que cette propriété a des conséquences importantes sur les qualités d’estimation et
de compression des bases d’ondelettes.
4.1
4.1.1
Propriétés d’approximation des bases d’ondelettes
Décroissance des coefficients d’ondelettes
Définition 4.1 Les espaces de Hölder C α (R) sont définis par :
(x)|
< +∞}
– si 0 < α < 1, C α (R) = {f ∈ L∞ (R); supx∈R,h>0 |f (x+h)−f
|h|α
n
′
– si α = n + α′ , avec 0 < α′ < 1, C α (R) = {f ∈ C n (R); ddxnf ∈ C α (R)
Définition 4.2 Les espaces de Hölder ponctuels C α ({x0 }) sont définis par :
(x0 )|
– si 0 < α < 1, C α ({x0 }) = {f ∈ L∞ (R); suph>0 |f (x0 +h)−f
< +∞}
|h|α
n
′
′
′
α
n
– si α = n + α , avec 0 < α < 1, C ({x0 }) = {f ∈ C ({x0 }); ddxnf ∈ C α ({x0 })
Théorème 4.1 Soit f ∈ C α (R) et ψ une ondelette r fois continûment différentiable
avec r moments nuls, associée à une AMR de L2 (R). Si r > α, on a alors l’équivalence
59
60
suivante
f ∈ C α (R) ⇔ |hf, ψj,k i| ≤ K2−j(α+1/2) pour tout (j, k) ∈ Z2 ,
et localement nous avons l’équivalence suivante
f ∈ C α ({x0 }) ⇔ |hf, ψj,k i| ≤ K2−j(α+1/2) (1 + |2j x0 − k|)α pour tout (j, k) ∈ Z2 ,
où K > 0 est une constante indépendante de j et k.
En pratique, de nombreux signaux analysés sont des fonctions régulières qui
présentent des singularités isolées (par exemple des fonctions C ∞ par morceaux).
Le théorème 4.1 montre alors que pour ce type de signaux de nombreux coefficients
d’ondelettes seront négligeables. Nous allons voir par la suite que les coefficients qui
sont les plus significatifs permettent une bonne reconstruction d’un signal.
4.1.2
Approximation linéaire de fonctions régulières
Il existe de nombreux espaces fonctionnels pour caractériser la régularité d’une
fonction. Le nombre de dérivées d’un signal permet en particulier de mesurer sa
régularité. Afin de caractériser la régularité des fonctions qui sont n − 1 fois continment dérivables mais par n fois, il est possible d’utiliser des espaces de Sobolev
d’ordre s > 0 notés W s (R) et qui sont tels que
Z +∞
s
f ∈ W (R) ⇔
|ω|2s|fˆ(ω)|2dω < +∞.
−∞
Si s > n + 1/2 alors on peut vérifier que si f ∈ W s (R) alors f est nécessairement
n fois continûment dérivable. Dans ce qui suit, nous allons étudier des fonctions
définies sur l’intervalle [0, 1]. L’espace de Sobolev W s ([0, 1]) est alors défini comme
l’ensemble des fonctions de L2 ([0, 1]) qu’on peut étendre en dehors de [0, 1] en des
fonctions de W s (R).
Nous avons vu précédemment qu’il est possible de construire des bases d’ondelettes orthogonales de L2 ([0, 1]). Afin de présenter les propriétés d’approximation des
ondelettes, nous supposerons que l’on dispose d’une AMR de L2 ([0, 1]) constituée de
2−j0 fonctions d’échelles {φj0 ,k }0≤k<2−j0 (avec 2−j0 > 1 et d’un ensemble de fonctions
ondelettes {ψj,k }−∞<j≤j0,0≤k<2−j . Nous supposerons de plus que les ondelettes ψj,k
possèdent r moments nuls (rappelons que la construction de telles ondelettes a été
proposée par Cohen et al). Notons que cette hypothèse exclue l’utilisation des ondelettes périodiques car dans ce cas les ondelettes aux bords de l’intervalle [0, 1] n’ont
pas de moments nuls. Les résultats indiqués dans la suite restent toutefois valable
avec des ondelettes périodiques si on impose que le support du signal analysé est
strictement inclus dans [0, 1] afin d’éviter la création de grands coefficients d’ondelettes aux bords dus à la périodisation du signal.
61
L’approximation de f sur les M = 2−J premières fonctions d’échelles et d’ondelettes (avec J < j0 ) est donnée par la projection orthogonale de f sur VJ :
fM = PVJ f =
0 −1
2−j
X
k=0
j0 2 −1
X
X
hf, ψj,k iψj,k .
hf, φj0,k iφj0 ,k +
−j
j=J+1 k=0
L’erreur d’approximation linéaire correspond alors à l’énergie des coefficients
d’ondelettes aux échelles plus petites que 2−J :
−j
2
ǫ(M) = kf − fM k =
J
2X
−1
X
j=−∞ k=0
|hf, ψj,k i|2
Si 2−J < M < 2−J+1 n’est pas une puissance de deux, on choisit d’inclure
uniquement à l’échelle 2J les coefficients correspondant aux M − 2−J ondelettes
{ψJ,k }0≤k<M −2−J . Une mesure de l’erreur d’approximation linéaire en fonction de la
régularité du signal est alors donnée par le théorème suivant :
Théorème 4.2 Soit 0 < s < r un exposant de Sobolev où r est le nombre de
moments nuls de l’ondelette ψ. Alors, si f ∈ W s ([0, 1])
ǫ(M) = o(M −2s ).
Il s’agit d’un résultat classique pour l’erreur d’approximation linéaire de fonctions
régulières. Les mêmes taux d’erreur peuvent être obtenus à l’aide de séries de Fourier
ou bien avec des Splines.
4.1.3
Approximation linéaire de fonctions non-régulières
Supposons qu’une fonction de L2 ([0, 1]) possède une discontinuité en un point
x0 ∈]0, 1[. Alors, d’après les proprités des espaces de Sobolev, f ne peut pas appartenir à W s ([0, 1]) pour s > 1/2, ce qui implique :
Théorème 4.3 Supposons qu’une fonction f ∈ L2 ([0, 1]) soit discontinue en un
point x0 ∈]0, 1[, alors pour α > 1 on ne peut pas avoir
ǫ(M) = O(M −α ).
Ce résultat nous montre que même si la fonction en très régulière à gauche et à
droite de x0 (par exemple C s ), l’erreur d’approximation se comporte au mieux en
O(M −1 ). Il s’agit d’un des inconvénients majeurs des techniques d’approximation
linéaire.
62
4.1.4
Approximation non-linéaire
Afin de simplifier les notations nous noterons φj0 ,k = ψj0 +1,k pour 0 ≤ k < 2−j0 .
L’approximation non-linéaire d’une fonction f ∈ L2 ([0, 1]) est obtenue à partir des
M plus grands coefficients d’ondelettes i.e.
X
∗
hf, ψj,k iψj,k ,
fM
=
(j,k)∈IM
où IM représentent les indices des M coefficients d’ondelettes de plus grande amplitude |hf, ψj,k i|. Une approximation non-linéaire peut également être calculée à
partir d’une procédure de seuillage. Soit λ ≥ 0 et Tλ la fonction telle que :
x si |x| ≥ λ
Tλ (x) =
0 si |x| < λ
Si l’on choisi le seuil λ de sorte que pour tout (j, k) ∈ IM , |hf, ψj,k i| ≥ λ et pour
tout (j, k) ∈
/ IM , |hf, ψj,k i| < λ alors l’approximation non-linéaire de f peut s’écrire
comme
j0 +1 2−j −1
X X
∗
Tλ (hf, ψj,k i)ψj,k .
fM =
j=−∞ k=0
L’erreur d’approximation non-linéaire est définie par
X
∗ 2
ǫ∗ (M) = kf − fM
k =
|hf, ψj,k i|2
(j,k)∈I
/ M
Une mesure de l’erreur d’approximation non-linéaire pour certaines fonctions
non-régulières est alors donnée par le théorème suivant :
Théorème 4.4 Soit f ∈ L2 ([0, 1]) une fonction qui possède un nombre fini de discontinuités et qui est C s (ou uniformément Lipchitizienne d’ordre s) entre ces discontinuités. Si s < r où r est le nombre de moments nuls de l’ondelette ψ, alors
ǫ∗ (M) = o(M −2s )
Le théorème 4.4 montre que l’erreur d’approximation non-linéaire dépend de la
régularité uniforme de la fonction entre les discontinuités. Ainsi si s > 1/2, alors
l’erreur d’approximation non-linéaire ǫ∗ (M) décroit plus vite que l’erreur d’approximation linéaire ǫ(M) et ceci d’autant plus rapidement que s est grand. En effet,
en présence de discontuités ǫ(M) décroit au mieux en O(M −1 ). Une approximation
non-linéaire correspond à une approximation adaptative. Aux fines échelles, l’approximation se concentre sur les coefficients d’ondelettes de grande amplitude qui
sont localisés au voisinage des discontinuités du signal. Ceci permet une bonne reconstruction des parties irrégulières d’une fonction tout en conservant une bonne
qualité d’approximation des parties régulières du signal.
63
4.1.5
Quelques exemples d’approximation de fonctions
La figure 4.1 donne un exemple d’approximation linéaire et non-linéaire d’un
signal régulier par morceaux qui présentent deux discontinuités. On peut constater
que la qualité de la reconstruction des deux discontinuités du signal est bien meilleure
avec l’approximation non-linéaire. Le taux d’erreur relatif est également bien plus
petit pour une approximation non-linéaire.
4
3
2
1
0
−1
−2
−3
−4
−5
−6
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
(a)
6
4
3
4
2
1
2
0
0
−1
−2
−2
−3
−4
−4
−5
−6
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
−6
(b)
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
(c)
Fig. 4.1 – (a) Signal f de taille n = 1024 régulier par morceaux présentant 2 discontinuités. Pour une ondelette Coiflet avec r = 6 : (b) approximation linéaire dans
l’espace Vj0 pour j0 = −5 i.e. M = 32, kf − fM k/kf k = 0.0537, (c) approximation
∗
non-linéaire pour M = 32, kf − fM
k/kf k = 0.0135
4.1.6
Approximation d’images
Dans le cas bi-dimensionnel, il est plus difficile de trouver des espaces fonctionnels qui permettent de bien caractériser le comportement d’une image. Une image se
compose généralement de parties homogènes où l’intensité des pixels est pratiquement constante, de contours qui correspondent à des changement brusques d’intensité entre deux zones homogènes, ainsi que de parties dites texturées dans lesquelles
l’intensité peut varier fortement et rapidement d’un pixel à un autre.
Nous ne présenterons pas les espaces fonctionnels utilisés pour modéliser les
images. Il est par contre important de noter que les bons résultats de l’approximation
64
non-linéaire obtenus dans le cas 1D ne peuvent pas s’étendre au cas 2D en utilisant
des produits tensoriels de bases d’ondelettes uni-dimensionnelles. En effet, supposons
que l’on ait construit une base d’ondelettes orthogonales adaptées à l’espace L2 (R2 ).
Si f est une image régulière sur deux morceaux qui sont séparés par un contour
Ω de longueur finie L > 0 (e.g. f = C 11Ω ) alors l’erreur d’approximation nonlinéaire ǫ∗ (M) d’ordre M (calculée comme dans le cas 1D à l’aide des M plus grands
coefficients d’ondelettes) est telle que
ǫ∗ (M) ∼ KM −1 ,
où K est une constante qui dépend du contour Ω.
Ainsi, contrairement au cas 1D, une approximation non-linéaire d’une image
dans une base d’ondelettes ne décroit pas en fonction de la régularité uniforme de
l’image sur chacun des morceaux. Il s’agit d’un des désavantages des bases d’ondelettes en deux dimensions. Pour des images, il est nécessaire d’utiliser de nombreuses ondelettes pour représenter un contour ce qui explique la limitation de la
vitesse de convergence de ǫ∗ (M). La recherche de nouvelles réprésentations multiéchelles qui sont adaptées à la géométrie des images fait actuellement l’objet de
nombreux travaux (Donoho [], Candes et Donoho [], Donoho et Huo [], Willet et
Nowak [], Le Pennec et Mallat [], Cohen et Matei [].) . Ceci permetterait d’améliorer
considérablement la qualité de l’approximation de fonctions en 2D ce qui aurait de
nombreux avantages en débruitage et compression d’images.
4.1.7
Quelques exemples d’approximation d’images
La figure 4.2 donne un exemple d’approximation linéaire et non-linéaire de l’image
du caméraman. On peut constater que la qualité de la reconstruction des contours
de l’image est bien meilleure avec l’approximation non-linéaire. Le taux d’erreur
relatif est également plus petit pour une approximation non-linéaire.
4.2
Débruitage de fonctions 1D
Le problème du débruitage de fonctions 1D peut se formuler comme un problème
de régression nonparamétrique en statistique. On suppose que l’on dispose de n = 2J
observations bruitées d’une fonction inconnue f ∈ L2 ([0, 1]) à des instants régulièrement
espacés ti = ni de l’intervalle [0, 1] :
yi = f (ti ) + σǫi , i = 1, . . . , n,
(4.1)
où les ǫi sont des réalisations indépendantes et identiquement distribuées (i.i.d.)
de la loi normale de moyenne 0 et de variance 1 (N(0, 1)), et σ est un paramètre
qui représente le niveau de bruit (σ 2 correspond donc à la variance du bruit dans
ce modèle). L’équation (4.1) correspond au modèle standard de régression nonparamétrique avec un bruit Gaussien. Il s’agit d’un modèle nonparamétrique car,
65
(a)
(b)
(c)
Fig. 4.2 – (a) Image f du caméraman de taille n × n avec n = 256. Pour une
ondelette Symmlet avec r = 8 : (b) approximation linéaire dans l’espace Vj0 pour
j0 = −6 i.e. M = 4096, kf − fM k/kf k = 0.1354, (c) approximation non-linéaire
∗
pour M = 4096, kf − fM
k/kf k = 0.0620
comme nous allons le voir par la suite, aucune hypothèse restrictive n’est faite sur la
forme de la fonction f . Le but du débruitage de fonctions est de trouver un estimateur fˆ qui approche au mieux la fonction f . La qualité du débruitage est mesurée à
partir de l’erreur quadratique empirique :
n
E=
1X ˆ
(f(ti ) − f (ti ))2 ,
n i=1
pour f appartenant à une certaine classe de fonctions (par exemple f ∈ W s ([0, 1])(M) =
{f ∈ L2 ([0, 1]), kf kW s ≤ M}, ou bien pour f appartenant à une classe de fonctions
plus irrégulières).
Rappelons que la décomposition en ondelettes d’une fonction f ∈ L2 ([0, 1]) dans
66
une base d’ondelettes périodiques s’écrit sous la forme
f=
0 −1
2−j
X
k=0
j0 2 −1
X
X
hf, ψ̃j,k iψ̃j,k .
hf, φ̃j0,k iφ̃j0,k +
−j
j=−∞ k=0
Le calcul des coefficients d’échelle et des coefficients d’ondelette empiriques peut
s’exprimer à l’aide d’une matrice W de taille n × n dont les lignes correspondent à la
discrétisation des fonctions d’échelle et d’ondelette à différents niveaux de résolution.
Ainsi, si on note f = [f (t1 ), . . . , f (tn )] le vecteur des valeurs de f aux points du
design, les coefficients d’échelle et d’ondelette empiriques au niveau j0 sont donnés
par
d = W f,
où d = [(αj0 ,k )k=0,...,2−j0 −1 , (βj,k )j=−J+1,...,j0 ,k=0,...,2−j −1 ]. Rappelons toutefois qu’il
s’agit seulement d’une façon formelle d’écrire la transformée en ondelette empirique
car en pratique on utilise l’algorithme pyramidal en O(n) et non pas un produit
matriciel (coût en O(n2 )). De plus, nous avons vu précédemment que :
√
√
αj0 ,k ≈ nhf, φ̃j0,k i et βj,k ≈ nhf, ψ̃j,k i.
On peut montrer que W est une matrice orthogonale i.e. W t W = In ce qui implique
que la transformée en ondelette inverse peut s’exprimer comme
f = W t d.
La matrice W étant une matrice orthogonale, on peut montrer que la transformée
en ondelette d’un vecteur Gaussien est à nouveau un vecteur Gaussien de même
moyenne et de même matrice de covariance. Ainsi, les coefficients d’échelle et d’ondelette bruités peuvent s’écrire comme (avec y = [y1 , . . . , yn ]) :
d̃ = W y,
avec
α̃j0 ,k = αj0 ,k + σzj0 ,k , k = 0, . . . , 2−j0 − 1
β̃j,k = βj,k + σzj,k , j = −J + 1, . . . , j0 , k = 0, . . . , 2j − 1,
où les zj,k sont des variables aléatoires i.i.d. N(0, 1).
Nous avons vu précédemment que pour des fonctions qui sont régulières par
morceaux, la plupart des coefficients d’ondelette sont nuls aux fines échelles, et que
les coefficients d’ondelette de grande amplitude se concentrent aux voisinages des
éventuelles singularités du signal. Aux fines échelles, les coefficients d’ondelette d’une
fonction bruitée correspondent donc principalement au bruit et seuls quelques coefficients correspondent effectivement au signal. Le débruitage par ondelette d’une
fonction est donc obtenu par une procédure de seuillage des coefficients d’ondelettes
bruités pour un seuil λ ≥ 0 bien choisi. On distingue en particulier
67
– le seuillage dur (Hard Thresholding) :
0
H
δλ (β̃j,k ) =
β̃j,k
– le seuillage doux (Soft Thresholding) :

0

δλS (β̃j,k ) =
β̃j,k − λ

β̃j,k + λ
si
si
|β̃j,k | ≤ λ
|β̃j,k | > λ
si
si
si
|β̃j,k | ≤ λ
β̃j,k > λ
β̃j,k < −λ
En général, on choisit de ne pas modifier les coefficients d’échelles α̃j0 ,k car ceuxci sont très peu influencés par le bruit et correspondent au comportement du signal
aux basses fréquences. Prendre j0 = −2 ou j0 = −3 donne généralement de bons
résultats. L’estimation de f est alors donnée par
fˆλ =
0 −1
2−j
X
k=0
j0
2X
−1
X
α̃j0 ,k
δλ (β̃j,k )
√ φ̃j0,k +
√
ψ̃j,k .
n
n
j=−J+1 k=0
−j
Au point du design, on calcule l’estimation de f selon le schéma suivant :
y
F
T
−−W
−→
{α̃j0 ,k , β̃j,k }
Seuillage
−−−−−−→
{α̃j0 ,k , δλ (β̃j,k )}
IW
T
−−−→
f̂λ
Il a été développé de nombreuses techniques pour déterminer un seuil λ optimal.
L’un des méthodes les plus utilisées, car très simple à implémenter, consiste à choisir
le seuillage universel :
p
λ = σ̂ 2 log n,
où σ̂ est une estimation du niveau du bruit à partir des coefficients d’ondelettes à
l’échelle la plus fine :
σ̂ =
median({|β̃−J+1,k |, k = 0, . . . , 2−J+1 − 1})
.
0.6745
La Figure 4.3 donne un exemple de débruitage par ondelettes avec un seuillage
dur universel. On peut constater que la procédure de seuillage conserve uniquement
les coefficients significatifs du signal bruité.
4.3
Compression d’images
Nous présentons ici quelques principes de la compression d’images. Une présentation
détaillée du problème de la compression de signaux dépasse très largement le cadre
de ce cours. Les méthodes de compression des images par ondelettes sont basées sur
le fait que les décompositions en ondelettes permettent des représentations creuses
des images (c’est à dire avec peu de coefficients). C’est l’une des raisons qui explique
le succès du nouveau standard de compression d’images JPEG2000 qui est basé sur
68
4
−2
3
−3
2
1
−4
0
−1
−5
−2
−6
−3
−4
−7
−5
−6
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
−8
0
0.1
0.2
0.3
0.4
(a)
0.5
0.6
0.7
0.8
0.9
1
0.6
0.7
0.8
0.9
1
0.6
0.7
0.8
0.9
1
(b)
6
−2
4
−3
2
−4
0
−5
−2
−6
−4
−7
−6
−8
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
−8
0
0.1
0.2
0.3
0.4
(c)
(d)
4
−2
2
−3
0
−4
−2
−5
−4
−6
−6
−7
−8
0
0.1
0.2
0.3
0.4
0.5
0.5
0.6
0.7
0.8
0.9
1
−8
0
0.1
(e)
0.2
0.3
0.4
0.5
(f)
Fig. 4.3 – (a), (b) Signal HeaviSine et ses coefficients d’ondelette (Symmlet, r = 8,
n = 256, j0 = −3), (c), (d) Signal bruité et coefficients d’ondelette bruités, (e), (f)
estimation du signal par seuillage dur et coefficients d’ondelette seuillés
des décompositions dans des bases d’ondelettes.
Supposons que l’on dispose d’une image f de taille N × N. Le principice de la
compression de signaux est de décomposer cette image dans une base orthonormée de
fonctions gm (x), m = 0, . . . , N 2 −1 (qui ne sont pas nécessairement des ondelettes) :
f (x) =
2 −1
N
X
m=0
fm gm (x), avec fm = hf, gm i
Afin de pouvoir stocker la valeur des coefficients fm , il est nécessaire d’introduire
une fontion de quantification notée Q qui a tout x ∈ R associe un élement Q(x)
69
dans un ensemble de cardinal fini X = {x1 , . . . , xK }. La reconstruction de l’image
est alors définie par
2 −1
N
X
f˜(x) =
Q(fm )gm (x)
m=0
et l’erreur (ou taux de distorsion) qui est introduite par cette quantification est
mesurée par
2 −1
N
X
(fm − Q(fm ))2 .
d(f ) =
m=0
Afin de déterminer une fonction Q qui soit bien adaptée aux données, on peut
2
utiliser la méthode suivante : soit
R p(x) l’histogramme des N coefficients fm . Il s’agit
d’une densité de probabilité ( p(x)dx = 1) qui permet de connaı̂tre la répartition
des coeffcients fm . En particulier,
R y on peut définir la proportion de coefficients dans
l’intervalle [yk , yk+1[ par pk = ykk+1 p(x)dx, où [yk , yk+1[, k = 1, . . . , K correspond à
une partition du support [a, b] de p(x). On définit alors le codage par
1
Q(x) = xk = (yk + yk+1) si x ∈ [yk , yk+1[.
2
Chaque quantité xk est ensuité codée par lk bits, et le nombre total R de bits
nécessaires pour coder l’image est donné par
R = N2
K
X
pk lk .
k=1
Un codage de taille constante correspond à : lk = log2 (K) et dans ce cas R =
N 2 log2 (K). Le nombre minimal de bits est minoré par l’entropie de Shanon qui
correspond au choix lk = − log2 (pk ) :
R ≥ −N
2
K
X
pk log2 (pk ).
k=1
Le problème de la compression d’image est de déterminer une quantification optimale Q qui minimise l’erreur d(f ) lorque l’on se fixe un nombre de bits par pixels
R̄ = R/N 2 . Le choix de Q dépend de la forme de l’histogramme p(x). Si p(x) est
approximativement constant sur les intervalles [yk , yk+1 [, alors on peut montrer que
le quantificateur optimal est donné par [yk , yk+1[= ∆ = b−a
, k = 1, . . . , K : il s’agit
K
du quantificateur uniforme.
Par contre si l’on choisit une base de fonctions gm (x) de sorte que de nombreux
coefficients fm sont nuls (par exemple une base d’ondelettes), alors on ne peut plus
considérer que p(x) est constant au voisinage de zéro, et le quantificateur uniforme
n’est plus optimal, en particulier si R̄ est petit. Il faut donc distinguer les coefficients
significatifs de ceux que l’on peut considérer comme négligeagles pour pouvoir obtenir une bonne compression. Soit λ un seuil bien choisi et M le nombre de coefficients
70
tels que |fm | > λ. Soit R0 le nombre de bits nécessaires pour coder la position de
ces coefficients significatifs et R1 le nombre de bits nécessaires pour coder la valeur
de ces coefficients. Le nombre total de bits pour coder l’image est alors donné par
R = R0 + R1 . Le taux de distorsion est égal à
X
X
d(f ) =
|fm |2 +
(fm − Q(fm ))2
|fm |<λ
|fm |≥λ
Il est alors possible de déterminer une quantification optimale en fonction de la
décroissance en module des plus grands coefficients fm (voir [7] pour plus de détails).
4.4
Problèmes inverses
Lorsqu’un signal ou une image n’est pas directement mesurable, il est courant
de procéder à l’observation d’autres quantités qui sont reliées à la fonction que l’on
voudrait estimer. Le principe d’un problème inverse est la recherche d’une méthode
pour inverser le processus que l’on observe afin de retrouver le signal ou l’image
d’intérêt. Il existe de nombreuses applications qui peuvent se modéliser comme un
problème inverse : tomographie, déconvolution d’image, estimation de la dérivée
d’une fonction...
Formellement, un problème inverse peut se formuler à l’aide d’un opérateur K
qui représente le processus que l’on voudrait inverser et où les données qu’on observe
sont de la forme
g = Kf + ǫ,
où f est le signal ou l’image que l’on voudrait estimer et ǫ représente un bruit de mesure. Par exemple si l’on suppose que l’on se place dans un modèle de régression nonparamétrique, le problème de l’estimation de la dérivée d’une fonctionR peut s’écrire
t
sous la forme (dans ce cas, K est l’opérateur d’intégration : Kf (t) = 0 f (u)du) :
gi =
Z
ti
f (u)du + ǫi , i = 1, . . . , n.
0
Dans la plupart des applications, le problème est mal-posé dans le sens où il n’est
pas possible d’estimer f en inversant directement l’opérateur K. En effet, l’opérateur
inverse K −1 n’est en général pas borné ce qui entraı̂ne une amplification du bruit et
implique que l’estimateur fˆ = K −1 ĝ n’est pas une bonne estimation de f .
Lorque les fonctions que l’on souhaite estimer sont irrégulières (ce qui est le cas
des images par exemple), les ondelettes sont un outil bien adapté pour estimer la
fonction f . L’estimation est basée sur une décomposition temps-échelle des observations g, puis sur un seuillage bien adapté des coefficients et une méthode d’inversion
à base d’ondelettes (qui prend en compte l’amplification du bruit par le processus
d’inversion). Le lecteur intéressé pourra consulter [7], pour de plus amples détails.
Bibliographie
[1] Antoniadis, A. et Oppenheim, G. (Eds.) (1995) Wavelets and Statistics, Lect.
Notes Statist., New York : Springer-Verlag.
[2] Aldroudi, A. et Unser, M. (1996) Wavelets in Medecine and Biologoy, CRC
Press.
[3] Abry, P. (1997) Ondelettes et turbulences, Nouveaux essais, arts et sciences,
Diderot.
[4] Cohen, A. (2003) Numerical Analysis of Wavelet Methods, Studies in Mathematics and Its Applications, V. 32, Elsevier.
[5] Daubechies, I. (1992) Ten lectures on Wavelets, SIAM, Philadelphia.
[6] Gasquet, C. et Witomski, P. (2000) Analyse de Fourier et applications. Filtrage,
calcul numérique et ondelettes, Dunod.
[7] Mallat, S. (1998). A Wavelet Tour of Signal Processing, Academic Press.
[8] Mallat, S. (2000). Une exploration des signaux en ondelettes, Les Editions de
l’Ecole Polytechnique.
[9] Torrésani, B. (1995). Analyse continue par ondelettes , Savoir actuels - Interéditions/CNRS éditions.
71

Analyse par ondelettes - Institut de Mathématiques de Bordeaux

Transcription

Documents pareils

FRACTALES (et ondelettes) - Gipsa-lab

filtrage d`images en bases d`ondelettes

TP n 3 Transformée d`ondelettes : Application au débruitage.

introduction aux ondelettes

TP4: la transformée en ondelettes

Formalisme Multifractal fondé sur les Ondelettes

Thèse de doctorat Ondelettes et problèmes mal posés : la

Application de la théorie des ondelettes

DOCTEUR EN MATHÉMATIQUES APPLIQUÉES DE L`INPG