Analyse par ondelettes - Institut de Mathématiques de Bordeaux
Transcription
Analyse par ondelettes - Institut de Mathématiques de Bordeaux
Analyse par ondelettes Notes de cours Master 2 Professionnel IMAT Université Paul Sabatier - Toulouse III Jérémie BIGOT Septembre 2009 2 Introduction Ces notes de cours sont une présentation succinte des méthodes d’analyse tempséchelles basées sur des décomposition en ondelettes. Ces techniques ont de très nombreuses applications dans les sciences physiques et les sciences de l’ingénieur en particulier pour l’estimation et la compression de signaux. Ces notes de cours s’inspire largement du livre de Stéphane Mallat [7] qui est l’une des meilleures références sur l’analyse de signaux par ondelettes. Les ouvrages suivants, dont on peut trouver les références dans la bibliographie, peuvent également être consultés pour des applications plus spécificiques de l’analyse par ondelettes ou pour des compléments mathématiques : – – – – – [1] : applications des ondelettes en statistique, [2] : applications des ondelettes en médecine et biologie, [3] : applications des ondelettes pour l’analyse des turbulences en physique, [4] : applications des ondelettes en analyse numérique [5] : un des ouvrages de référence en mathématiques appliquées sur la théorie des ondelettes – [6] : analyse de Fourier et applications au filtrage, calcul numérique et ondelettes, – [7], [8] : un des ouvrages de référence sur l’analyse en ondelettes qui présente de nombreux développements théoriques et pratiques, il s’agit d’un livre très complet. – [9] : analyse continue par ondelettes. 3 4 Table des matières 1 Représentations temps-fréquence 1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 La transformée de Fourier . . . . . . . . . . . . . . . . . . . . . 1.2.1 Rappel de quelques propriétés . . . . . . . . . . . . . . . 1.2.2 Transformée de Fourier Inverse . . . . . . . . . . . . . . 1.2.3 Produit de convolution . . . . . . . . . . . . . . . . . . . 1.2.4 Quelques exemples de transformée de Fourier . . . . . . 1.2.5 Limitations de la transformée de Fourier . . . . . . . . . 1.2.6 Principe d’incertitude d’Heisenberg . . . . . . . . . . . . 1.3 La transformée de Gabor . . . . . . . . . . . . . . . . . . . . . . 1.3.1 Inversion de la transformée de Gabor . . . . . . . . . . . 1.3.2 Redondance et noyau reproduisant . . . . . . . . . . . . 1.3.3 Taille des boı̂tes d’Heisenberg . . . . . . . . . . . . . . . 1.3.4 Quelques exemples de transformée de Gabor . . . . . . . 1.3.5 Le problème du choix de la fenêtre . . . . . . . . . . . . 1.4 La transformée en ondelettes continue . . . . . . . . . . . . . . . 1.4.1 Inversion de la transformée en ondelettes continue . . . . 1.4.2 Redondance et noyau reproduisant . . . . . . . . . . . . 1.4.3 Taille des boı̂tes d’Heisenberg . . . . . . . . . . . . . . . 1.4.4 Quelques exemples de transformée en ondelettes continue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Transformée en ondelette continue et régularité d’un signal 2.1 Analyse de la régularité d’un signal unidimensionnel . . . . . . . . . . 2.1.1 Régularité Lipschitzienne . . . . . . . . . . . . . . . . . . . . . 2.1.2 Ondelette et nombre de moments nuls . . . . . . . . . . . . . 2.1.3 Amplitude des coefficients d’ondelettes et régularité d’un signal 2.1.4 Maxima d’ondelettes . . . . . . . . . . . . . . . . . . . . . . . 2.2 Analyse de la régularité d’une image . . . . . . . . . . . . . . . . . . 2.2.1 Extension de la transformée en ondelette pour des images . . . 2.2.2 Transformée en ondelette dyadique bidimensionnelle . . . . . . 2.2.3 Régularité Lipschitzienne . . . . . . . . . . . . . . . . . . . . . 2.2.4 Détecteur de Canny . . . . . . . . . . . . . . . . . . . . . . . . 2.2.5 Maxima d’ondelette pour des images . . . . . . . . . . . . . . 5 7 7 8 8 9 10 10 11 12 13 14 15 15 16 18 18 20 20 21 21 25 25 25 26 27 28 31 31 31 33 33 34 6 3 Bases d’ondelettes 3.1 Bases orthonormées d’ondelettes . . . . . . . . . . . . . . . . . . . . 3.1.1 Quelques rappels sur les bases hilbertiennes . . . . . . . . . 3.1.2 Analyse multirésolution de L2 (R) . . . . . . . . . . . . . . . 3.1.3 Filtres mirroirs conjugués . . . . . . . . . . . . . . . . . . . 3.1.4 Ondelettes orthogonales . . . . . . . . . . . . . . . . . . . . 3.2 Construction de bases d’ondelettes . . . . . . . . . . . . . . . . . . 3.2.1 Liens entre filtres, nombre de moments nuls et régularité de l’ondelette . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.2 Quelques exemples classiques d’ondelettes . . . . . . . . . . 3.2.3 Ondelettes sur un intervalle borné . . . . . . . . . . . . . . . 3.2.4 Ondelettes et bancs de filtres . . . . . . . . . . . . . . . . . 3.3 Bases d’ondelettes pour des images . . . . . . . . . . . . . . . . . . 3.3.1 Bases d’ondelettes séparables et multirésolution en 2D . . . 3.3.2 Algorithme rapide de transformée en ondelettes 2D . . . . . 3.3.3 Quelques exemples de décomposition en ondelettes pour des images . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Approximation, estimation et compression dans des bases lettes 4.1 Propriétés d’approximation des bases d’ondelettes . . . . . . 4.1.1 Décroissance des coefficients d’ondelettes . . . . . . . 4.1.2 Approximation linéaire de fonctions régulières . . . . 4.1.3 Approximation linéaire de fonctions non-régulières . . 4.1.4 Approximation non-linéaire . . . . . . . . . . . . . . 4.1.5 Quelques exemples d’approximation de fonctions . . . 4.1.6 Approximation d’images . . . . . . . . . . . . . . . . 4.1.7 Quelques exemples d’approximation d’images . . . . 4.2 Débruitage de fonctions 1D . . . . . . . . . . . . . . . . . . 4.3 Compression d’images . . . . . . . . . . . . . . . . . . . . . 4.4 Problèmes inverses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 37 37 38 41 42 44 . . . . . . . 44 46 47 51 53 53 54 . 55 d’onde. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 59 59 60 61 62 63 63 64 64 67 70 Chapitre 1 Représentations temps-fréquence 1.1 Introduction Que ce soit en mathématiques ou en physique, la transformée de Fourier a été pendant longtemps un des outils les plus utilisés pour le traitement du signal. Cette représentation, basée sur la notion physique de fréquence, est bien adaptée pour traiter des signaux stationnaires c’est à dire des signaux qui possèdent certaines propriétés invariantes dans le temps. Par contre, la transformée de Fourier n’est pas optimale pour la description de phénomènes transitoires et se révèle donc imparfaite pour l’analyse de la plupart signaux rencontrés en pratique. La principale limitation de la transformée de Fourier est qu’elle ne permet pas une description locale (sur une partie finie) d’un signal. Pour remedier à ces limitations, des représentations dites temps-fréquence ont été proposées afin d’analyser un signal à l’aide d’une transformation paramétrée par deux variables : le temps (ou la position) et la fréquence (ou échelle). Tout au long de ce cours, nous considérerons qu’un signal f (t) est une fonction réelle du temps (e.g. R 7→ R) ou bien de l’espace (e.g. R2 7→ R). Une représentation temps-fréquence est une transformation qui associe à un signal f (t) une fonction réelle de deux variables Tf (x, ξ), où x est le paramètre de temps ou de position et ξ est le paramètre de fréquence ou d’échelle. Les représentations temps-fréquence que nous verrons dans ce cours, consistent à projeter une fonction f sur des fonctions analysantes gx,ξ , ce qui revient à calculer le produit scalaire : Tf (x, ξ) = hf, gx,ξ i = Z f (t)gx,ξ (t)dt. Les représentations qui nous intéressent sont celles qui permettent : – d’avoir des propriétés d’invariance par rapport à des transformations simples d’un signal (translation, dilatation, modulation...) – d’obtenir des informations sur la structure locale (en temps et en fréquence) d’un signal – la reconstruction (exacte) du signal à partir des coefficients Tf (x, ξ) 7 8 Dans le cas uni-dimensionnel (x ∈ R) les valeurs de la fonction Tf (x, ξ) seront représentées dans le plan temps-échelle. Il s’agit d’une représentation graphique qui permet de visualiser le contenu temporel (axe des abcisses) et fréquentiel (axe des ordonnées) des signaux étudiés. Dans ce chapitre, nous rappelerons quelques propriétés de la transformée de Fourier, puis nous introduirons la transformée de Gabor et la transformée en ondelettes continue. Quelques exemples simulés seront utilisés pour illustrer les limitations et les avantages de chaque transformation. 1.2 La transformée de Fourier Dans ce chapitre, nous travaillerons essentiellement avec des fonctions unidimensionnelles. L’espace L1 (R) Rest l’ensemble des fonctions (réelles ou complexe) qui sont +∞ intégrables i.e. telles que −∞ |f (t)|dt < +∞. De même L2 (R) est l’ensemble des R +∞ fonctions de carré intégrable i.e. telles que −∞ |f (t)|2dt < +∞. Nous rappelons que L2 (R) est un espace de Hilbert pour le produit scalaire : Z +∞ f (t)g(t)dt, −∞ pour f, g ∈ L2 (R), et où g(t)qdénote le conjugué de g(t). La norme d’une fonction R +∞ |f (t)|2dt. f ∈ L2 (R) sera notée kf k = −∞ 1.2.1 Rappel de quelques propriétés En 1807, Fourier présente un mémoire à l’Institut de France qui propose de représenter toute fonction périodique comme une somme de sinusoı̈des à différentes fréquences. C’est le début de l’analyse de Fourier qui va avoir une importance déterminante en analyse mathématique, en physique et dans les sciences de l’ingénieur. Définition 1.1 La transformée de Fourier d’une fonction f ∈ L1 (R) est définie par : Z +∞ ˆ f (ω) = f (t)e−iωt dt. −∞ Elle mesure la “vitesse” des oscillations de la fonction f à la fréquence ω ∈ R. Cette transformation peut être vue comme la projection de f sur des fonctions analysantes qui sont des “ondes pures” : gx,ξ (t) = e−iξt qui ne dépendent pas du paramètre de temps x. Celle-ci permet donc d’analyser le contenu fréquentiel d’un signal. Le théorème de Rieman-Lebesgue assure que : – f 7→ fˆ est une application linéaire, continue de L1 (R) dans L∞ (R). – si f ∈ L1 (R) alors fˆ est continue sur R et limω→±∞ fˆ(ω) = 0 9 Parmi les principales propriétés de la transformée de Fourier qui sont souvent utilisées dans les calculs, on peut citer : Propriété Fonction Transformée de Fourier ˆ Translation f (t − t0 ) e−iωt0 f(ω) iω0 t Modulation fˆ(ω − ω0 ) e f (t) f (t/a) |a|fˆ(aω) Dilatation/Contraction (p) Derivation f (t) (iω)p fˆ(ω) ˆ Symétrie Hermitienne f(−ω) = fˆ(ω) f (t) ∈ R Si f ∈ L1 (R), f ′ ∈ L1 (R), . . . , f (p) ∈ L1 (R) alors fˆ(ω) = oω→±∞ ( ω1p ). De plus si Z +∞ |fˆ(ω)|(1 + |ω|)p dω < +∞, −∞ alors f est p fois continûment différentiable et bornée. La décroissance de fˆ en l’infini est donc caractéristique de la régularité de f . 1.2.2 Transformée de Fourier Inverse Il n’est pas évident de définir la transformée de Fourier inverse, car l’espace L1 (R) n’est pas invariant par cette transformation. L’espace qui est bien adaptée pour définir et inverser la transformée de Fourier est l’espace L2 (R). Toutefois, il n’est pas possible de définir “directement” la transformée fonction dans L2 (R). Il est T d’une 2 1 nécessaire de se restreindre tout d’abord à L (R) L (R) pourT définir correctement 2 la transformée de Fourier, puis d’utiliser la densité de L (R) L1 (R) dans L2 (R) pour étendre cette transformation et son inverse à L2 (R). Le théorème fondamental de la transformée de Fourier dans L2 (R) est le suivant (pour de plus amples détails on pourra se référer à [6]) : Théorème 1.1 Soit f ∈ L2 (R), on définit alors formellement la transformée de Fourier et son inverse par : Z +∞ ˆ f (ω) = f (t)e−iωt dt −∞ Z +∞ 1 f (t) = fˆ(ω)eiωt dω 2π −∞ Soit f, g ∈ L2 (R), on obtient alors la formule de Parseval Z +∞ Z +∞ 1 f (t)h(t)dt = fˆ(ω)ĥ(ω)dω, 2π −∞ −∞ et la formule de Plancherel Z +∞ −∞ 1 |f (t)| dt = 2π 2 Z +∞ −∞ 2 ˆ |f(ω)| dω. 10 Remarque : pour f ∈ L2 (R)\L1 (R), la transformée de Fourier et son inverse sont définies au sens d’une limite dans L2 (convergence forte dans L2 ) : Z +∞ ˆ f (ω) = f (t)e−iωt dt −∞ Z +T f (t)e−iωt dt lim T →∞ 1.2.3 −T Produit de convolution Définition 1.2 Pour f ∈ L1 (R) et h ∈ L1 (R) le produit de convolution de f et g, noté f ⋆ h, est défini par : Z +∞ f ⋆ h(t) = f (t − u)h(u)du. −∞ Alors, f ⋆ h ∈ L1 (R) est défini presque partout et tel que : – f ⋆ h = h ⋆ f : commutativité – dtd (f ⋆ h)(t) = df ⋆ h(t) = f ⋆ dh (t) : dérivabilité dt dt – f ⋆ δt0 (t) = f (t − t0 ) : convolution avec une masse de Dirac en t0 . De plus, si l’on note g = f ⋆ h alors : ˆ ĥ(ω). ĝ(ω) = f(ω) Cette propriété est à la base du filtrage linéaire en traitement du signal. En effet, tout processus de filtrage du type Lf = f ⋆ h où h est la réponse impulsionnelle du filtre L, peut s’écrire sous la forme d’un filtrage fréquentiel à partir de la transformée de Fourier inverse : Z +∞ 1 iωt ˆ Lf (t) = ĥ(ω)f(ω)e dω. 2π −∞ Chaque composante fréquentielle eiωt d’amplitude fˆ(ω) est en effet modulée par le filtre ĥ(ω). Ainsi, décomposer une fonction comme une intégrale de fonctions sinusoidales complexes eiωt permet de calculer directement la réponse d’un filtre Lf à partir de la donnée des coefficients ĥ(ω). Remarque : tous ces résultats pour le produit de convolution sont également valables pour l’extension de la transformée de Fourier à L2 (R). 1.2.4 Quelques exemples de transformée de Fourier • Soit f (t) = 11[−T,T ] (t) la fonction indicatrice de l’intervalle [−T, T ]. Il s’agit d’une fonction discontinue en −T et +T qui vaut 1 sur [−T, T ] et zéro en dehors de cet intervalle. Sa transformée de Fourier est une fonction non intégrable : 2 sin(T ω) . fˆ(ω) = ω 11 • Une masse de Dirac δt0 (t) au point t0 associe à une fonction sa valeur au point tR = t0 (une “intégration” d’une fonction régulière par rapport à un Dirac est telle que +∞ f (t)δt0 (t)dt = f (t0 )). La masse de Dirac δt0 (t) est une fonction “très localisée” −∞ dans le temps (son support se réduit à t = t0 ) dont la transformée de Fourier est définie comme (voir [6] pour une définition rigoureuse à partir de la théorie des distributions) : δ̂t0 (ω) = e−iωt0 . • Cosinus et Sinus. Posons cosω0 (t) = cos(ω0 t) et sinω0 (t) = sin(ω0 t). Il s’agit de fonctions oscillantes à une fréquence unique ω0 ce qui se traduit par deux Dirac dans la transformée de Fourier en ω0 et −ω0 : cos ˆ ω0 (ω) = π δ̂ω0 (ω) + δ̂−ω0 (ω) ˆ ω0 (ω) = π δ̂ω0 (ω) − δ̂−ω0 (ω) . sin i • Un filtre passe-bas idéal a une fonction de transfert du type : ĥ(ω) = 11[−ω0 ,ω0 ] (ω) qui sélectionne les fréquences comprises entre −ω0 et ω0 . Sa réponse inpulsionelle est donnée par la transformée de Fourier inverse : sin(ω0 t) . πt Comme expliqué précédemment, la transformée de Fourier d’un signal permet d’obtenir des informations sur son contenu fréquentiel. La Figure 1.1 représente une sinusoı̈de de fréquence 200 Hz (i.e. ω0 = 400π) observée avec un bruit aléatoire qui correspond au défaut des instruments de mesure et à la présence de parasites. La transformée de Fourier de ce signal permet de retrouver la fréquence de la sinusoı̈de malgrè la présence de ce bruit. h(t) = 5 500 4 450 3 400 2 350 1 300 0 250 −1 200 −2 150 −3 100 −4 −5 50 0 0.1 0.2 0.3 0.4 0.5 (a) 0.6 0.7 0.8 0.9 1 0 0 50 100 150 200 250 300 350 400 450 500 (b) Fig. 1.1 – (a) Signal : sinus à 200 Hz + bruit et (b) sa transformée de Fourier pour les fréquences positives (l’axe des abscisses donne ν = ω/2π) 1.2.5 Limitations de la transformée de Fourier Le principal inconvénient de la transformée de Fourier est qu’elle ne permet pas une analyse du comportement local d’une fonction. En effet, les fonctions analysantes sont de support infini et il est donc nécessaire de connaı̂tre l’ensemble des 12 valeurs d’une fonction pour pouvoir calculer sa transformée de Fourier. De plus, cette transformation ne permet pas d’avoir une localisation temporelle du contenu fréquentiel d’un signal. Par exemple, la Figure 1.2 représente un signal constitué de deux sinusoı̈des successives de fréquence 10 et 30 Hz (penser à deux notes de musiques). La transformée de Fourier de ce signal permet de retrouver ces deux fréquences, mais ne nous informe pas sur la localisation temporelle du changement de régime dans le signal. De la même façon, la présence d’une discontinuité dans un signal affecte le comportement de sa transformée de Fourier sur l’ensemble des fréquences. Par exemple, la transformée de Fourier de la fonction indicatrice de l’intervalle [−T, T ] décroit en 1/ω mais ceci ne permet pas de retrouver la localisation des deux discontinuités du signal en T et −T . 1 300 0.8 250 0.6 0.4 200 0.2 0 150 −0.2 100 −0.4 −0.6 50 −0.8 −1 0 0.1 0.2 0.3 0.4 0.5 (a) 0.6 0.7 0.8 0.9 1 0 0 50 100 150 200 250 (b) Fig. 1.2 – (a) Signal : sinus à 10 Hz suivi d’un sinus à 30 Hz et (b) sa transformée de Fourier pour les fréquences positives (l’axe des abscisses donne ν = ω/2π) 1.2.6 Principe d’incertitude d’Heisenberg Il semble donc raisonnable de se demander s’il est possible de construire une fonction f qui soit bien localisée en temps et dont la transformée de Fourier fˆ soit concentrée dans un petit intervalle de fréquences. Une masse de Dirac au point t0 est une fonction très localisée en temps (son support se réduit à t = t0 ). Toutefois, sa transformée de Fourier e−iωt0 est uniformément répartie sur l’ensemble des fréquences. La décroissance de la transformée de Fourier fˆ dépend de la régularité de la fonction f . Ainsi, pour construire une fonction f telle que fˆ soit bien localisée en fréquence, il est nécessaire que f soit suffisamment régulière. Toutefois, les deux observations suivantes montrent qu’un compromis doit être trouvé entre bonne localisation temporelle et bonne localisation fréquentielle : – pour réduire la location temporelle d’une fonction f , il est possible de la contracter par un facteur s < 1 tout en conservant son énergie (norme L2 ) constante. En effet, si on pose : 1 t fs (t) = √ f , s s R +∞ R +∞ √ ˆ alors −∞ |fs (t)|2 dt = −∞ |f (t)|2dt. Toutefois, fˆs (t) = sf(st) ce qui montre 13 que la transformée de Fourier de fs est dilaté d’un facteur s. Ainsi, lorqu’on gagne en location temporelle, on perd en localisation fréquentielle. – il n’est pas possible de construire une fonction qui soit à support compact et dont la transformée de Fourier soit également à support compact. Ces deux remarques illustrent le principe d’incertitude d’Heisenberg qui limite la possibilité d’une bonne résolution en temps et en fréquence. Le théorème suivant est une formulation du principe d’incertitude pour le cas unidimensionnel. 1.2 Principe d’incertitude d’Heisenberg : soit f ∈ L2 (R) et kf k2 = RThéorème +∞ 2 |f (t)| dt. On définit la position moyenne temporelle f¯ et la position fréquentielle −∞ moyenne ω̄ de f par : Z +∞ 1 ¯ f = t|f (t)|2 dt, kf k2 −∞ Z +∞ 1 2 ˆ ω|f(ω)| dω. ω̄ = 2 2πkf k −∞ Les variances autour de ces moyennes sont définies par : Z +∞ 1 2 (t − f¯)2 |f (t)|2 dt, σt = kf k2 −∞ Z +∞ 1 2 (ω − ω̄)2 |fˆ(ω)|2dω. σω = 2 2πkf k −∞ Alors, 1 σt σω ≥ , (1.1) 2 et cette inégalité est une égalité si et seulement si f est une Gaussienne i.e de la 2 forme f (t) = Aeiω0 t−B(t−m0 ) . Les variances temporelles et fréquentielles permettent de quantifier l’étalement (i.e. la localisation) de f et fˆ autour de leur position moyenne. Ainsi, la relation (1.1) montre que lorsque la précision temporelle augmente, l’incertitude pour la localisation en fréquence augmente et réciproquement. Pour remedier aux limitations de la transformée de Fourier, il est donc nécessaire de projeter un signal sur des fonctions analysantes qui sont bien localisées en temps et en fréquence. Toutefois, la résolution temps-fréquence de ces fonctions sera nécessairement limitée par le principe d’Heisenberg. 1.3 La transformée de Gabor Afin de remedier au problème de la location temporelle de la transformée de Fourier, Gabor a proposé en 1946 d’utiliser une transformée de Fourier à fenêtre 14 glissante. Cette transformation consiste à calculer la transformée de Fourier sur une partie du signal sélectionnée à l’aide d’une fenêtre bien localisée en temps. Des translations successives de cette fenêtre permettent d’analyser localement le comportement temps-fréquence du signal. La transformée de Gabor revient à projeter un signal sur des fonctions analysantes de la forme : gx,ξ (t) = eiξt g(t − x), où g ∈ L2 (R) est une fenêtre réelle et symmétrique (i.e. g(t) = g(−t)) qui est translatée dans le temps par x et modulée par la fréquence ξ. Afin de simplifier les notations, nous supposerons que kgk = 1 ce qui implique que kgx,ξ k = 1. Définition 1.3 Pour f ∈ L2 (R) et (x, ξ) ∈ R2 , la transformée de Fourier à fenêtre glissante est définie par Z +∞ Gf (x, ξ) = hf, gx,ξ i = f (t)g(t − x)e−iξt dt. −∞ La fenêtre g(t−x) permet de localiser la transformée de Fourier de f au voisinage du point x. Lorsque la fenêtre g est une Gaussienne, il s’agit de la transformée de Gabor. Toutefois, dans ce qui suit, la transformée de Fourier à fenêtre glissante sera appelée transformée de Gabor (TG) même si g n’est pas une Gaussienne. 1.3.1 Inversion de la transformée de Gabor La TG est une transformation inversible qui conserve l’énergie du signal comme le montre le théorème suivant. Théorème 1.3 Si f ∈ L2 (R) alors (le sens de la formule de reconstruction suivante dépend des conditions sur f et g) : Z +∞ Z +∞ 1 f (t) = Gf (x, ξ)g(t − x)eiξt dxdξ, 2π −∞ −∞ et Z +∞ −∞ 1 |f (t)| dt = 2π 2 Z +∞ −∞ Z +∞ −∞ |Gf (x, ξ)|2 dxdξ. En utilisant la formule de Parseval, on peut remarquer que la TG peut également s’écrire sous la forme : Z +∞ 1 ˆ 1 Gf (x, ξ) = hf , ĝx,ξ i = fˆ(ω)ĝ(ω − ξ)ei(ω−ξ)x dω. 2π 2π −∞ La TG peut donc également s’interpréter comme une transformée de Gabor (à un facteur de phase prêt) de la transformée de Fourier fˆ. Cett remarque montre que si la fenêtre g est bien localisée en temps autour de t = 0 et si ĝ est bien localisée 15 en fréquence autour de ω = 0, alors les coefficients de la TG peuvent s’interpréter comme une analyse locale du comportement de f au voisinage du temps x et de la fréquence ξ. Il faut donc choisir pour la fenêtre g une fonction suffisamment régulière afin d’avoir à la fois une bonne localisation en temps et en fréquence. Ceci exclue donc d’utiliser pour g une fonction indicatrice 11[−T,T ] qui est bien localisée en temps autour de t = 0, mais donc la localisation en fréquence est très mauvaise (décroissance en 1/ω). A l’inverse, les propriétés temps-fréquences de la Gaussienne sont optimales car celle-ci “sature” l’inégalité d’Heisenberg, ce qui justifie son utilisation pour la TG. 1.3.2 Redondance et noyau reproduisant La TG associe à une fonction f ∈ L2 (R) une fonction à deux variables. D’après la propriété de conservation de l’énergie Gf (x, ξ) ∈ L2 (R2 ). Toutefois, toute fonction dans L2 (R2 ) n’est pas nécessairement la TG d’une fonction dans L2 (R). Le théorème suivant montre que ceci provient de la redondance de la TG. Théorème 1.4 Soit F ∈ L2 (R2 ). Alors il existe une fonction f ∈ L2 (R) telle que F (x, ξ) = Gf (x, ξ) si et seulement si : 1 F (x, ξ) = 2π Z +∞ −∞ Z +∞ K(x, ξ, x′ , ξ ′)F (x′ , ξ ′ )dx′ dξ ′, −∞ où est le noyau reproduisant K(x, ξ, x′ , ξ ′ ) = hgx,ξ , gx′ ,ξ ′ i, Le noyau K(x, ξ, x′ , ξ ′ ) mesure la corrélation temps-fréquence entre les fonctions analysantes gx,ξ et gx′ ,ξ ′ . On peut montrer que l’amplitude de K(x, ξ, x′ , ξ ′) est une fonction décroissante de x − x′ et ξ − ξ ′ qui dépend uniquement de la localisation en temps et en fréquence (et donc de l’énergie) de g et ĝ. Plus les distances |x − x′ | et |ξ − ξ ′ | sont grandes, plus l’amplitude de K(x, ξ, x′ , ξ ′ ) diminue. La redondance peut donc s’interpréter comme le “taux de répétition” de la même information dans une transformation. 1.3.3 Taille des boı̂tes d’Heisenberg On définit la variance temporelle σt2 et la variance fréquentielle σω2 de la fonction gx,ξ par σt2 σω2 Z +∞ 2 2 Z +∞ t2 |g(t)|2dt, −∞ −∞ Z +∞ Z +∞ 1 1 2 2 (ω − ξ) |ĝx,ξ (ω)| dω = ω 2 |ĝ(ω)|2dω. = 2π −∞ 2π −∞ = (t − x) |gx,ξ (t)| dt = 16 Etant donné la symmétrie de g et ĝ, on peut facilement remarquer que σt2 et σω2 sont indépendantes de x et ξ. La représentation dans le plan temps-fréquence de la fonction gx,ξ correspond à une boı̂te d’Heisenberg centrée au point (x, ξ) et d’aire σt σω (voir Figure 1.3). La taille de cette boı̂te est indépendante de la position x et de la fréquence ξ, ce qui implique que la résolution temps-fréquence de la TG est la même dans tout le plan temps-fréquence. La TG correspond donc à des translations successives en temps et en fréquence d’une boı̂te d’Heisenberg de taille constante. L’aire minimale de cette boı̂te est limitée par le principe d’incertitude d’Heisenberg : σt σω ≥ 1/2. Rappelons qu’il y a égalité si la fenêtre g est une Gaussienne, ce qui justifie ce choix en pratique. Insérer Figure Fig. 1.3 – Boı̂tes d’Heisenberg pour la TG dans le plan temps-fréquence pour deux fonctions analysantes gx,ξ et gx′ ,ξ ′ 1.3.4 Quelques exemples de transformée de Gabor L’intérêt de la TG est de permettre une analyse du comportement local d’une fonction. Les exemples suivants, pour lesquels la TG peut être calculée explicitement, illustrent les avantages cette transformation par rapport à la transformée de Fourier. • Sinusoı̈de : soit f (t) = sin(ω0 t), on peut facilement calculer que : Gf (x, ξ) = 1 −i(ξ−ω0 )x e ĝ(ξ − ω0 ) − e−i(ξ+ω0 )x ĝ(ξ + ω0 ) . 2i Etant donnée que ĝ est localisée autour de ω = 0, l’équation ci-dessus montre que le maximum de l’amplitude de Gf (x, ξ) se situe au voisinage de ξ = ω0 et ξ = −ω0 . La phase de la TG permet également de retrouver la fréquence du signal. Toutefois, du fait de l’introduction d’une fenêtre d’analyse, la localisation du comportement temps-fréquence du signal n’est pas parfaite. La TG diminue nécessairement la résolution alors que pour la transformée de Fourier d’un sinus, on obtient deux masses de Dirac en ξ = ω0 et ξ = −ω0 . Par contre, la TG permet de repérer les changements de la fréquence d’un signal au cours du temps. La Figure 1.4 donne la TG d’un signal constitué de deux sinusoı̈des successives de fréquence 10 et 30 Hz. L’analyse de l’amplitude et de la phase de la TG permet clairement de mettre en évidence le changement de fréquence au point t = 0.5. • Chirps : un chirp est un signal sinusoı̈dale, non-stationnaire dont la fréquence et l’amplitude sont des fonctions qui sont dépendantes du temps. Ce type de signaux peut s’écrire sous la forme : f (t) = A(t) sin(φ(t)). 17 1 100 100 0.8 90 90 0.6 80 80 0.4 70 70 0.2 60 60 0 50 50 −0.2 40 40 −0.4 30 30 −0.6 20 20 −0.8 10 −1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 10 0 0.1 0.2 0.3 (a) 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0 0.1 0.2 0.3 0.4 (b) 0.5 0.6 0.7 0.8 0.9 1 (c) Fig. 1.4 – (a) Signal : sinus à 10 Hz suivi d’un sinus à 30 Hz, (b) module et (c) phase de sa transformée de Gabor Gf (x, ξ). L’axe des abscisses donne la position x et l’axe des ordonnées représente les fréquences positives pour ν = ξ/2π. Le noir représente les coefficients de la TG d’amplitude maximale, et le blanc les coefficients d’amplitude minimale. Si les fonctions A(t) et φ(t) sont suffisamment régulières et sous certaines hypothèses sur la fenêtre g, alors on peut montrer que pour ξ ≥ 0 1 Gf (x, ξ) ≈ A(x)ei(φ(x)−ξx) ĝ(ξ − φ′ (x))). 2 Etant donnée la bonne localisation en fréquence de g, l’expression précédente montre que dans le plan temps-fréquence, les valeurs de Gf (x, ξ) se concentrent autour de courbes d’équation ξ = φ′ (x). Ces courbes qui sont appelées les arêtes de la TG permettent de retrouver l’expression de φ. La Figure 1.5 illustre ce comportement pour un Chirp linéaire i.e. dont la fréquence est une fonction linéaire du temps. L’analyse de signaux qui peuvent se modéliser comme une somme de chirps, d’amplitude et fréquence variables, est particulièrement utilisée pour le traitement de la parole. 1 100 100 0.8 90 90 0.6 80 80 0.4 70 70 0.2 60 60 0 50 50 −0.2 40 40 −0.4 30 30 −0.6 20 20 −0.8 10 −1 0 0.1 0.2 0.3 0.4 0.5 (a) 0.6 0.7 0.8 0.9 1 0 10 0 0.1 0.2 0.3 0.4 0.5 (b) 0.6 0.7 0.8 0.9 1 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 (c) Fig. 1.5 – (a) Chirp linéaire (b) module et (c) phase de sa transformée de Gabor Gf (x, ξ). L’axe des abscisses donne la position x et l’axe des ordonnées représente les fréquences positives pour ν = ξ/2π 18 1.3.5 Le problème du choix de la fenêtre Le choix d’une bonne fenêtre est d’une importance cruciale pour l’interprétation de la TG. Nous avons déjà mentionné qu’une fenêtre Gaussienne permet de réaliser le meilleur compromis temps-fréquence. La taille des boı̂tes d’Heisenberg qui correspondent aux fonctions Gf (x, ξ) étant constante, la résolution temps-fréquence de la TG est entièrement déterminée par la résolution de la fenêtre d’analyse g. En définissant gs (t) = √1s g( st ), il est possible de modifier la résolution de la fenêtre d’analyse en contractant ou dilatant la fonction g d’un facteur s > 0 tout en conservant l’énergie des fonctions analysantes. Le choix du facteur s dépend des phénomènes que l’on soufaite observer. D’après le principe d’incertitude, un compromis s’impose nécessairement entre bonne localisation en fréquence et mauvaise localisation en temps (et réciproquement). Par exemple, prenons le cas d’un signal composé de deux sinusoı̈des successives de fréquence ω1 et ω2 . Si le facteur d’échelle s est suffisamment grand par rapport à ω1 − ω2 , alors ĝs est bien localisée autour de ω = 0 et la transformée de Gabor permet de bien séparer les deux composantes du signal. A l’inverse si s est petit par rapport à ω1 − ω2 , alors ĝs est faiblement localisée en fréquence et la TG ne permet plus de distinguer les deux composantes du signal. Le signal de la Figure 1.6 est composé de deux sinusoı̈des successives de fréquences 5 Hz et 15 Hz, et de deux masses de Dirac aux points t = 0.3 et t = 0.7. Le choix s = 0.1 permet de rendre compte du comportement fréquentiel des deux sinusoı̈des, mais ne nous renseigne pas sur la présence de deux masses de Dirac. A l’inverse, le choix s = 0.01 permet de localiser précisemment les deux masses de Dirac, mais la caractérisation du comportement sinusoı̈dal du signal n’est plus satisfaisante. 50 200 45 180 3 40 160 2.5 35 140 2 30 120 1.5 25 100 1 20 80 0.5 15 60 0 10 40 −0.5 5 4 3.5 −1 0 0.1 0.2 0.3 0.4 0.5 (a) 0.6 0.7 0.8 0.9 1 0 20 0 0.1 0.2 0.3 0.4 0.5 (b) 0.6 0.7 0.8 0.9 1 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 (c) Fig. 1.6 – Limitatons de la TG : (a) Signal : sinus à 5 Hz suivi d’un sinus à 15 Hz + deux masses de Dirac, (b) module de sa transformée de Gabor pour s = 0.1, (c) module de sa transformée de Gabor pour s = 0.01 1.4 La transformée en ondelettes continue Le but de l’analyse par ondelettes est de construire un outil qui permet de s’affranchir du problème du choix de la fenêtre dans la TG, en utilisant des fonctions analysantes pour lesquelles la taille de la boı̂te d’Heisenberg varie avec la fréquence. 19 Nous verrons par la suite que l’analyse par ondelettes est un outil puissant pour caractériser simultanément les différentes composantes temps-fréquence d’un signal. Les premiers travaux sur les ondelettes remontent au début des années 1980. Grossmann qui travaillait en physique théorique et Morlet un chercheur en traitement du signal ont été parmi les premiers scientifiques à étudier les propriétés de la transformée en ondelettes continue. Dès leur début, les travaux sur la théorie des ondelettes sont donc caractérisés par la collobaration entre des scientifiques provenant aussi bien des mathématiques, de la physique que du traitement du signal. C’est encore le cas des travaux en cours sur les ondelettes, ce qui explique le succès de cet outil et sa très large diffusion dans la communauté scientifique. Une ondelette est une fonction ψ ∈ L2 (R) de moyenne nulle i.e. telle que : Z +∞ ψ(t)dt = 0. −∞ Nous supposerons de plus que l’ondelette est normalisée : kψk = 1.Dans l’analyse par ondelettes, les fonctions analysantes sont définies à partir de translations et dilatations/contractions de l’ondelette “mère” ψ : 1 t−x ψx,s (t) = √ ψ( ), s s où x ∈ R définit la translation temporelle et s > 0 est l’échelle de dilatation/contraction. Par définition, l’énergie des fonctions analysantes est constante : kψx,s k = kψk = 1. Définition 1.4 La transformée en ondelettes continue d’une fonction f ∈ L2 (R) au point x ∈ R et à l’échelle s > 0 est définie par : Z +∞ t−x 1 )dt. Wf (x, s) = hf, ψx,s i = f (t) √ ψ( s s −∞ • Ondelettes réelles et complexes : dans ce cours, nous nous limiterons à l’étude des ondelettes à valeurs réelles dans un souci de simplification. Les ondelettes réelles sont bien adaptées pour la détection de changements brusques dans un signal. Les ondelettes complexes, appelées également ondelettes analytiques, sont utilisées pour séparer la phase et l’amplitude des composantes d’un signal. Elles sont en particulier bien adaptées pour la détection de fréquences instantanées. Pour plus de précisions sur les ondelettes analytiques, nous renvoyons à [7]. Ainsi, dans tout ce qui suit, nous supposerons que ψ(t) ∈ R pour tout t ∈ R. • Relation entre échelle et fréquence : la transformée en ondelettes continue est une analyse temps-échelle. Elle permet d’avoir des informations sur le comportement d’une fonction au voisinage du point x et à l’échelle s. Une transformée en ondelettes peut s’écrire sous la forme d’un filtrage par convolution : Wf (x, s) = f ⋆ ψs∗ (x), 20 ). Etant donné que la transformée de Fourier de ψs∗ est égale où ψs∗ (t) = √1s ψ( −t s R +∞ √ à sψ̂(sω) et que ψ̂(0) = −∞ ψ(t)dt = 0, la transformée en ondelettes continue (abrégée TOC par la suite) peut s’interpréter comme un filtre passe bande. La largeur du filtre est déterminée par le facteur d’échelle s. 1.4.1 Inversion de la transformée en ondelettes continue Le théorème suivant montre que la TOC est une transformation inversible qui conserve l’énergie du signal si l’ondelette vérifie la condition d’admissibilité suivante : Z +∞ |ψ̂(ω)|2 < +∞. Cψ = ω 0 Si ψ vérifie la condition ci-dessus, alors l’ondelette est dite admissible. OnRpeut re+∞ marquer que la condition d’admissibilité impose nécessairement que ψ̂(0) = −∞ ψ(t)dt = 0 c’est à dire que l’ondelette soit de moyenne nulle. Théorème 1.5 Soit ψ ∈ L2 (R) une ondelette admissible, alors pour tout f ∈ L2 (R) on a (au sens de la convergence forte dans L2 (R)) Z +∞ Z +∞ 1 1 t − x dxds ) 2 . Wf (x, s) √ ψ( f (t) = Cψ 0 s s s −∞ De plus, la TCO conserve l’énergie du signal Z +∞ Z +∞ Z +∞ 1 dxds 2 |f (t)| dt = |Wf (x, s)|2 2 . Cψ 0 s −∞ −∞ 1.4.2 Redondance et noyau reproduisant Comme la transformée de Gabor, la TOC est une transformation très redondante. La TOC associe à une fonction f ∈ L2 (R) une fonction Wf (x, s) de deux variables ). Comme pour la TG, l’ensemble des fonctions de appartenant à L2 (R × R+ , dxds s2 2 + dxds L (R × R , s2 ) qui sont des TOC de fonctions de L2 (R) est caractérisé par un noyau reproduisant qui mesure la corrélation entre les fonctions analysantes. ). Alors il existe une fonction f ∈ L2 (R) Théorème 1.6 Soit F ∈ L2 (R × R+ , dxds s2 telle que F (x, s) = Wf (x, s) si et seulement si : Z +∞ Z +∞ 1 dx′ ds′ F (x, s) = K(x, s, x′ , s′ )F (x′ , s′ ) 2 , Cψ −∞ −∞ s où K est le noyau reproduisant K(x, s, x′ , s′ ) = hψx,s , ψx′ ,s′ i, Le noyau K(x, s, x′ , s′ ) mesure la corrélation temps-fréquence entre les ondelettes ψx,s et ψx′ ,s′ . 21 1.4.3 Taille des boı̂tes d’Heisenberg Supposons que l’ondelette ψ est centrée en zéro, ce qui implique que ψx,s est centrée au point t = x. La variance temporelle de ψx,s s’écrit alors comme : Z +∞ (t − x)2 |ψx,s (t)|2 dt = s2 σt2 , −∞ où σt2 = par : R +∞ −∞ t2 |ψ(t)|2 dt. De même, on peut définir la “fréquence moyenne” de ψ̂ 1 ξ= 2π Z +∞ ω|ψ̂(ω)|2dω. −∞ √ La transformée de Fourier de ψx,s s’écrit comme : ψ̂x,s = sψ̂(sω)e−iωx . La fréquence moyenne de ψ̂x,s est donc ξ/s et sa variance fréquentielle est par conséquent égale à Z +∞ ξ 2 σω2 1 2 (ω − ) |ψ̂x,s (ω)| dω = 2 , 2π −∞ s s R +∞ 1 (ω − ξ)2 |ψ̂(ω)|2dω. L’énergie temps-fréquence de l’ondelette ψx,s où σω2 = 2π −∞ correspond donc à une boı̂te d’Heisenberg centrée au point (x, ξ/s) de taille sσt selon l’axe temporel et de taille σω /s selon l’axe fréquentiel. L’aire de cette boı̂te σt σω reste constante à toutes les échelles, mais la résolution temps-fréquence de l’ondelette ψx,s dépend du niveau de résolution s (voir Figure 1.7). Contrairement à la TG qui correspond à un pavage régulier du plan temps-fréquence, la TCO permet d’ajuster le niveau d’analyse. Il s’agit d’une procédure de “zoom” qui permet d’inspecter le comportement local d’un signal en réduisant progressivement le paramètre d’échelle s : de petites valeurs de s diminue l’étalement temporel de ψx,s mais augmente le support fréquentiel de ψ̂x,s dont le centre est décalé vers de plus hautes fréquences. Insérer Figure Fig. 1.7 – Boı̂tes d’Heisenberg pour la TOC dans le plan temps-fréquence pour deux fonctions analysantes ψx,s et ψx′ ,s′ avec s < s′ . 1.4.4 Quelques exemples de transformée en ondelettes continue La TG et la TOC se comportent essentiellement de la même façon pour l’analyse temps fréquence des signaux. La TOC peut également être utilisée pour caractériser les fréquences instantanées des chirps, et cette technique a été largement employée en traitement de la parole. L’intérêt de la TOC est de permettre une analyse locale des signaux et en particulier de mettre en évidence des comportements irréguliers (ou singuliers). Elle est en particulier bien adaptée pour caractériser le degré de régularité d’une fonction. Les deux exemples suivants illustrent les bonnes propriétés 22 des ondelettes pour la détection de singularités dans des signaux (dans les deux cas, l’ondelette choisie est la dérivée première d’une Gaussienne). • Deux sinusoı̈des successives + masses de Dirac. La Figure 1.8 donne les valeurs de la TCO du signal constitué de deux sinusoı̈des successives de fréquences 5 Hz et 15 Hz, et de deux masses de Dirac aux points t = 0.3 et t = 0.7. Ce signal a déjà été étudié pour illustrer les limitations de la TG. La TCO permet de rendre compte de toutes les composantes du signal. Les grandes échelles permettent d’analyser la partie sinusoı̈dale du signal, alors que l’analyse aux fines échelles met en évidence la présence des deux masses de Dirac. • Le signal de la Figure 1.9 présente 3 singularités aux points t = 0.3, t = 0.5 et t = 0.8. On peut constater sur la Figure 1.9 que les coefficients d’ondelettes de grande amplitude se concentrent au voisinage des trois singularités quand l’échelle s diminue. 4 10 3.5 9 3 8 2.5 7 2 6 1.5 5 1 4 0.5 3 0 2 −0.5 −1 1 0 0.1 0.2 0.3 0.4 0.5 (a) 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 (b) Fig. 1.8 – (a) Signal : sinus à 5 Hz suivi d’un sinus à 15 Hz + deux masses de Dirac, (b) module de sa transformée en ondelettes continue : l’axe des abscisses représente la position x, et l’axe des ordonnées l’échelle s en coordonnée logarithmique i.e. − log2 (s) 23 35 10 9.5 30 9 8.5 25 8 20 7.5 7 15 6.5 6 10 5.5 5 5 0 0.1 0.2 0.3 0.4 0.5 (a) 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 (b) Fig. 1.9 – (a) Signal présentant 3 singularités (b) module de sa transformée en ondelettes continue : l’axe des abscisses représente la position x, et l’axe des ordonnées l’échelle s en coordonnée logarithmique i.e. − log2 (s) 24 Chapitre 2 Transformée en ondelette continue et régularité d’un signal La transformée en ondelette continue permet d’analyser le comportement local d’un signal en réduisant progressivement le paramètre d’échelle s. Cette procédure de zoom est un outil puissant pour détecter et caractériser les irrégularités d’un signal. Dans ce chapitre, nous montrons que la décroissance des coefficients d’ondelettes le long des échelles est caractéristique de la régularité Lipschitzienne d’un signal. Les singularités d’un signal unidimensionnel (discontinuité, dirac, cusp...) ainsi que les contours dans une image (zones où l’intensité des pixels change brutalement) peuvent être détectés en suivant la propagation aux fines échelles des coefficients de grande amplitude de la transformée en ondelette continue. Dans tout ce chapı̂tre, nous supposerons que les signaux analysés sont des fonctions réelles de L2 (R) ou L2 (R2 ). 2.1 2.1.1 Analyse de la régularité d’un signal unidimensionnel Régularité Lipschitzienne Définition 2.1 Une fonction f ∈ L2 (R) est ponctuellement Lipschitzienne d’ordre α ≥ 0 au point x0 , s’il existe une constante Cx0 et un polynôme P de degré m = ⌊α⌋ tels que pour tout t ∈ R |f (t) − P (t)| ≤ Cx0 |t − x0 |α . (2.1) De plus, – la régularité Lipschitizienne de f au point x0 est le supremum des α pour lesquels f est ponctuellement Lipschitzienne d’ordre α en x0 . – une fonction est dite uniformément Lipschitzienne d’ordre α, si elle satisfait l’équation (2.1) pour tout x0 ∈ [a, b] avec une constante C qui est indépendante de x0 . 25 26 Les exposants de Lipschitz permettent de caractériser la régularité d’une fonction. Si 0 ≤ α < 1, alors P (t) = f (x0 ) et l’équation (2.1) devient : |f (t) − f (x0 )| ≤ Cx0 |t − x0 |α . Si la régularité Lipschitzienne de f au point x0 est 0 ≤ α < 1, alors f n’est pas dérivable au point x0 . Une fonction discontinue au point x0 est de régularité Lipschitzienne 0 en x0 . De même si f est m = ⌊α⌋ fois continûment dérivable au voisinage de x0 , alors P correspond au développement de Taylor de f d’ordre m au point x0 i.e. m−1 X f k (x0 ) P (t) = (t − x0 )k . k! k=0 On peut également montrer que si f est uniformément Lipschitzienne d’ordre α > m sur un intervalle [a, b], alors f est nécessairement m fois continûment dérivable sur ]a, b[. 2.1.2 Ondelette et nombre de moments nuls L’exposant de Lipschitz permet de décomposer une fonction f au voisinage d’un point x0 comme la somme d’un polynôme plus un terme d’erreur dont on peut contrôler l’amplitude f (t) = P (t) + ǫ(t), avec |ǫ(t)| ≤ |t − x0 |α . Une ondelette est une fonction oscillante de moyenne nulle. Le degré d’oscillation de l’ondelette permet d’ignorer les parties régulières d’un signal lorsque l’on calcule sa TOC. Cette propriété se traduit par le nombre de moments nuls de l’ondelette. Définition 2.2 Une ondelette ψ ∈ L2 (R) a r ∈ N∗ moments nuls si pour tout entier 0≤k<r Z +∞ tk ψ(t)dt = 0. −∞ Ainsi, une transformée en ondelette permet d’ignorer les polynomes de degré strictement inférieur à r. En effet, si P est un polynôme de degré m < r alors pour tout x ∈ R et pour tout s > 0, WP (x, s) = 0. Ainsi, si une fonction est ponctuellement Lipschitzienne d’ordre α au point x0 et si l’ondelette ψ a r ≥ ⌊α⌋+ 1 moments nuls, alors au voisinage de x0 Wf (x, s) = Wǫ (x, s). La TOC est donc caractéristique de la régularité Lipschtizienne d’une fonction car elle permet de supprimer sa composante polynomiale. 27 Pour pouvoir mesurer la régularité Lipschitzienne d’une fonction, il est nécessaire d’utiliser des ondelettes qui soient suffisamment régulières et qui ont de bonnes propriétés de décroissance en l’infini. Nous dirons qu’une fonction f est à décroissance rapide si pour tout m ∈ N, il existe une constante Cm telle que pour tout t ∈ R |f (t)| ≤ Cm . 1 + |t|m Il s’agit de fonctions qui décroissent en l’infini plus rapidement que n’importe quel polynôme. Dans ce qui suit, nous utiliserons des ondelettes à décroissance rapide avec exactement r moments nuls. Dans ce cas, on montre que ψ peut s’écrire comme la dérivée d’ordre r d’une fonction θ, appelée noyau i.e. ψ(t) = (−1)r dr θ(t) . dtr R +∞ telle que θ est à décroissance rapide et −∞ θ(t)dt 6= 0. Pour ce choix particulier de l’ondelette ψ et à une échelle s donnée, la TOC peut s’interpréter comme une ) suivi d’un opérateur différentiel convolution du signal f par le noyau θs∗ (t) = √1s θ( −t s 1 −t ∗ d’ordre r. En effet, si on pose ψs (t) = √s ψ( s ) alors on a Wf (x, s) = f ⋆ ψs∗ (x). r r ∗ ∗ r d θs (t) et donc en Etant donné, que ψ(t) = (−1)r d dtθ(t) r , on a alors que ψs (t) = s dtr permutant les opérateurs de convolution et de dérivation r dr θ∗ (t) r d (x) = s (f ⋆ θs∗ )(x). dtr dtr Afin d’avoir une ondelette suffisamment régulière, nous supposerons également que ψ est r fois continûment dérivable telle que ses dérivées ψ (k) soient des fonctions à décroissance rapide pour 1 ≤ k ≤ r. Un exemple classique pour la fonction θ est le noyau Gaussien, et dans ce cas on dira que ψ est une ondelette Gaussienne. Wf (x, s) = sr f ⋆ 2.1.3 Amplitude des coefficients d’ondelettes et régularité d’un signal Les théorèmes suivants montrent que l’évolution de l’amplitude des coefficients d’ondelettes quand s → 0 est caractéristique de la régularité Lipschitzienne d’un signal. Théorème 2.1 Soit une fonction f ∈ L2 (R) uniformément Lipschitzienne d’ordre α ≤ r sur un intervalle [a, b], alors il existe une constante A telle que pour tout x ∈ [a, b] et pour tout s > 0 |Wf (x, s)| ≤ Asα+1/2 (2.2) Réciproquement, si f est bornée et si Wf (x, s) satisfait (2.2) pour un α < r qui n’est pas un entier, alors f est uniformément Lipschitzienne d’ordre α sur [a + ǫ, b − ǫ] pour tout ǫ > 0. 28 Théorème 2.2 Soit une fonction f ∈ L2 (R) ponctuellement Lipschitzienne d’ordre α ≤ r au point x0 , alors il existe une constante A telle que pour tout x ∈ R et pour tout s > 0 x − x0 α α+1/2 . (2.3) 1 + |Wf (x, s)| ≤ As s Réciproquement, si α < r n’est pas un entier et s’il existe une constante A et α′ < α tels que pour tout x ∈ R et pour tout s > 0 α′ ! x − x 0 |Wf (x, s)| ≤ Asα+1/2 1 + (2.4) s alors f est Lipschtizienne d’ordre α en x0 . Lorsque que l’ondelette ψ est à support compact égal à [−C, C], les conditions (2.3) et (2.4) sont plus faciles à interpréter. Le cone d’influence de l’ondelette ψ au point x0 est défini comme l’ensemble des points (x, s) dans le plan temps-échelle tels que |x − x0 | ≤ Cs (voir Figure 2.1). Ils correspondent aux points tels que le support des fonctions analysantes ψx,s (t) = √1s ψ( t−x ) contient le point x0 . Si (x, s) est dans s le cone d’influence de f au point x0 alors les valeurs de Wf (x, s) sont influencées par le comportement de f au voisinage de x0 . De plus, si (x, s) est tel que |x − x0 | ≤ Cs alors les conditions (2.3) et (2.4) peuvent s’écrire Wf (x, s)| ≤ A′ sα+1/2 . Le comportement de la TCO dans le cone d’influence de x0 est donc caractéristique du comportement de f au voisinage de ce point. Dans la Figure 2.2, on peut remarquer que les coefficients d’ondelettes de grande amplitude sont inclus dans le cone d’influence de chacune des 3 singularités. 1 0.9 0.8 |x-x0| < Cs 0.7 s 0.6 |x-x0| > Cs 0.5 |x-x0| > Cs 0.4 0.3 0.2 0.1 0 0 0.1 0.2 0.3 0.4 0.5 x 0.6 0.7 0.8 0.9 1 Fig. 2.1 – Zone grise : cone d’influence de l’ondelette ψ au point x0 = 0.5. 2.1.4 Maxima d’ondelettes Le théorème 2.2 montre que la régularité d’une fonction peut être mesurée à partir de la décroissance de ses coefficients d’ondelettes quand s → 0. Toutefois, il n’est pas nécessaire de considérer l’ensemble des coefficients Wf (x, s). La régularité d’une fonction peut en effet contrôlée par la décroissance le long des échelles des maxima en module de la TOC. 29 10 11 8 10 6 4 9 2 8 0 7 −2 −4 6 −6 −8 5 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 (a) 0.5 0.6 0.7 0.8 0.9 1 (b) Fig. 2.2 – (a) Signal présentant 3 singularités (b) Module de sa TOC pour la dérivée seconde d’une Gaussienne : l’axe des abscisses représente la position x, et l’axe des ordonnées − log2 (s) Définition 2.3 Le terme maxima d’ondelette est utilisé pour décrire tout point (m0 , s0 ) dans le plan temps-échelle tels que x 7→ |Wf (x, s0 )| est locallement maximum au point x = m0 . Ce maximum local doit être strict à droite ou à gauche de m0 . On appelle ligne de maxima d’ondelette toute courbe continue m(s) dans le plan temps-échelle telle que les points (m(s), s) soient des maxima d’ondelette. Le théorème suivant prouve que la propagation des maxima d’ondelettes dans le plan temps-échelle est reliée à la régularité Lipschitzienne d’une fonction. Théorème 2.3 Supposons que l’ondelette ψ est à support compact. S’il existe une échelle s0 > 0 telle que |Wf (x, s)| n’a pas de maximum local pour x ∈ [a, b] et pour tout s < s0 , alors f est uniformément Lipschitizienne d’ordre r sur ]a, b[. Ce théorème montre que si la régularité de f au point x0 est d’ordre α < r, alors il existe nécessairement une séquence de maxima d’ondelette (mp , sp ) telle que lim mp = x0 et lim sp = 0. p→+∞ p→+∞ Cette propriété est illustrée dans la Figure 2.3 qui représente les lignes de maxima d’ondelettes d’une fonction contenant 3 singularités aux points x = 0.1, x = 0.5 et x = 0.8, où la TOC a été calculée pour la dérivée seconde d’une Gaussienne i.e. pour r = 2. On peut constater que plusieurs lignes de maxima d’ondelettes convergent vers les singularités de la fonction. Il existe également d’autres lignes de maxima qui convergent vers des parties régulières du signal. Ces lignes sont dues à la présence de zéros dans la dérivée troisième du signal. En effet, si f est C r+2 dans un intervalle [a, b] et si f (r+1) a zero au point x0 telle que f (r+2) (x0 ) 6= 0, on peut montrer qu’il existe une ligne de maxima d’ondelettes qui converge vers x0 quand s tend vers zéro. Pour cela, on peut tout d’abord remarquer que si f est r fois continûment dérivale R +∞ Wf (x0 ,s) (r) au voisinage de x0 , alors lims→0 sr+1/2 = Kf (x0 ) où K = −∞ θ(t)dt, et que 30 ∂W (m(s),s) par définition, si m(s) est une ligne de maxima d’ondelettes alors f ∂x = 0. A l’aide du théorème des fonctions implicites, on montre alors que si f (r+1) (x0 ) = 0 et ∂Wf (m(s),s) f (r+2) (x0 ) 6= 0, il existe m(s) → x0 quand s → 0 telle que = 0. ∂x 10 8 8 7 6 6 4 5 2 4 0 3 −2 2 −4 1 −6 −8 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0 0.1 0.2 0.3 (a) 0.4 0.5 0.6 0.7 0.8 0.9 1 (b) Fig. 2.3 – (a) Signal présentant 3 singularités (b) Lignes de maxima d’ondelette pour la dérivée seconde d’une Gaussienne : l’axe des abscisses représente la position x, et l’axe des ordonnées − log2 (s) Mesure de la régularité d’un signal : la régularité Lipschitzienne d’une fonction peut être mesurée à partir de la décroissance du module des maxima d’ondelettes. Soit f une fonction de régularité Lipschitzienne d’ordre α < r en x0 . Supposons qu’il existe une échelle s0 à partir de laquelle tous les maxima d’ondelette (m(s), s) qui convergent vers le point x0 sont inclus dans un cone du type |x − x0 | ≤ Cs. Alors, on peut utiliser les théorèmes 2.2 et 2.3 pour montrer que f est Lipschitzienne d’ordre α au point x0 si et seulement s’il existe une constante A > 0 telle que pour tout s < s0 et pour tous les maxima d’ondelette inclus dans le cone défini précédemment |Wf (m(s), s)| ≤ Asα+1/2 ce qui est équivalent à log2 |Wf (m(s), s)| ≤ log2 A + (α + 1/2) log2 (s). Pour chaque ligne de maxima d’ondelettes m(s), la régularité Lipchitzienne de f au point x0 peut donc être estimée en calculant aux fines échelles la pente maximale de la courbe de log2 |Wf (m(s), s)| considérée comme une fonction de log2 (s). Remarque : les points pour lesquels toutes les lignes de maxima d’ondelettes se concentrent dans un cone dans le plan temps-échelle sont des singularités dites isolées. Les lignes de maxima sont bien adaptées pour mesurer l’exposant Lipschitz de ce type de singularités. Toutefois, nous verrons en TP qu’il existe des fonctions pour lesquelles il n’est pas possible d’estimer la régularité ponctuelle de certains points à partir de cette technique. 31 2.2 2.2.1 Analyse de la régularité d’une image Extension de la transformée en ondelette pour des images La TOC peut être étendue au cas bidimensionnel de plusieurs façons. L’extension naturelle par rapport à ce que nous avons vu en 1D consiste à prendre une ondelette réelle et isotrope i.e. une fonction ψ ∈ L2 (R2 ) qui s’écrit pour x = (x1 , x2 ) sous la forme ψ(x) = h(kxk), p où kxk = x21 + x22 et h est une fonction unidimensionnelle à valeurs réelles. Dans ce cas, l’ondelette est dite isotrope car ses propriétés sont les mêmes dans toutes les directions du plan 2D. La TOC d’une fonction f ∈ L2 (R) à l’échelle s > 0 est alors définie par Z u−x 1 du. Wf (x, s) = f (u) ψ s s R2 Si l’ondelette ψ vérifie une condition d’admissibilité similaire à celle du cas 1D, alors on peut montrer que cette transformation est inversible et qu’elle converse l’énergie du signal. Comme ψ est de moyenne nulle, Wf (x, s) permet de mesurer les variations de l’image f dans un voisinage du point x dont la taille est proportionnelle à s. Un exemple classique pour l’ondelette ψ est le Laplacien d’une Gaussienne i.e. pour u = (u1 , u2 ) ∈ R2 θ(u) = ∂2θ 1 − u21 +u22 ∂2θ + . e 2 et ψ = 2π ∂u21 ∂u22 Ce filtre est couramment utilisé en vision par ordinateur. Un exemple d’utilisation du Laplacien de la Gaussienne est donné dans la Figure 2.4. A une échelle s donnée, on peut constaster que les contours significatifs d’une image correspondent aux points où x 7→ Wf (x, s) s’annule. Il s’agit des zero-crossing du Laplacien. 2.2.2 Transformée en ondelette dyadique bidimensionnelle Pour pouvoir étendre la notion de maxima d’ondelettes pour la détection de contours dans des images, nous allons considérer une transformée en ondelette directionnelle selon les axes verticaux et horizontaux d’une image. Une version bidimensionnelle de la TOC peut être implémentée à l’aide d’un noyau de convolution θ ∈ L2 (R2 ) qui doit être une fonction suffisamment lisse. Un exemple classique pour θ est le noyau Gaussien. La TOC 2D est ensuite calculée à partir de deux ondelettes qui sont les dérivées partielles de θ dans les directions verticales et horizontales ψ1 = − ∂θ ∂θ et ψ 2 = − ∂u1 ∂u2 32 (a) (b) (c) (d) Fig. 2.4 – (a) Image d’un caméraman. TOC en 2D pour le Laplacien d’une Gaussienne : (b) s = 1, (c) s = 2, (d) s = 3. Le noir représente les pixels d’intensité maximale et le blanc ceux d’intensité minimale. Il s’agit donc d’une tranformée en ondelette avec r = 1 moment nul. Afin de simplifier les calculs numériques il est possible de d’échantillonner le paramètre de résolution s selon une échelle dyadique i.e. de prendre s = 2j pour j ∈ Z. Dans les deux directions indexées par k = 1, 2 et pour s = 2j , on définit alors la transformée en ondelette dyadique 2D (abrégée TOD 2D) d’une fonction f ∈ L2 (R) comme Z 1 k u−x k j Wf (x, 2 ) = f (u) j ψ du. 2 2j R2 La TOD 2D peut également s’écrire comme la convolution de f par le noyau θ au niveau de résolution j ∈ Z suivie d’une dérivée partielle dans les directions verticales et horizontales i.e. pour k = 1, 2 Wfk (x, 2j ) = 2j où θ2∗j (u) = 1 θ( −u ). 2j 2j ∂ (f ⋆ θ2∗j )(x), ∂xk Les composantes horizontales et verticales de la TOD 2D sont 33 donc proportionnelles au gradient de l’image f lissée par le noyau θ à l’échelle 2j : 1 ∂ ∗ (f ⋆ θ )(x) Wf (x, 2j ) j j 2 ∂x1 =2 = 2j ∇(f ⋆ θ2∗j )(x) ∂ ∗ Wf2 (x, 2j ) (f ⋆ θ )(x) 2j ∂x2 2.2.3 Régularité Lipschitzienne La décroissance des coefficients de la TOD 2D est reliée à la régularité d’une image. Pour 0 ≤ α < 1, une fonction f ∈ L2 (R2 ) est dite ponctuellement Lipschitzienne d’ordre α au point x0 s’il existe une constante C telle que pour tout u ∈ R2 |f (u) − f (x0 )| ≤ Cku − x0 kα . Une fonction est dite uniformément Lipchitizienne d’ordre α sur un domaine Ω de R2 , si f est ponctuellement Lipschitzienne d’ordre α pour tout x ∈ Ω avec une constante C qui est indépendante de x0 . Comme dans le cas 1D, on peut montrer que la décroissance des coefficients d’ondelettes est caractéristique de la régularité Lipschitzienne d’une image. En particulier si on définit le module de la TOD 2D comme q j Mf (x, 2 ) = |Wf1(x, 2j )|2 + |Wf2 (x, 2j )|2 , alors on peut montrer que f est uniformément Lipchitizienne d’ordre α sur Ω si et seulement s’il existe une constante A telle que pour tout x ∈ Ω et pour tout j ∈ Z Mf (x, 2j ) ≤ A2j(α+1/2) . La Figure 2.5 donne un exemple de TOD 2D. On peut constater que les grandes valeurs de Mf (x, 2j ) se concentrent au niveau des contours de l’image. 2.2.4 Détecteur de Canny Les contours dans une image peuvent être définis comme les points où l’intensité de l’image varie brutalement. Le détecteur de Canny est un algorithme adapté à la détection de ce type de contours. Le gradient d’une image permet de quantifier les variations d’intensité de ses pixels. La dérivée partielle d’une fonction f ∈ L2 (R) → dans une direction donnée par un vecteur unité − n = (cos α, sin α) dans le plan 2D → est égale au produit scalaire du gradient de f et de − n ∂f ∂f ∂f → cos α + sin α. = ∇f . − n = − → ∂n ∂x1 ∂x2 La dérivée partielle d’une fonction permet de mesurer le taux de variation de → → l’intensité de f dans la direction − n . Or, le module de ∂∂f→ est maximum si ∇f et − n − n sont colinéaires. Ceci montre donc que le vecteur ∇f (x) est parallèle à la direction de changement maximum de l’intensité de f au point x. Nous dirons alors qu’un point y ∈ R2 fait partie d’un contour dans une image, si x 7→ k∇f (x)k est localement maximum au point x = y pour x = y + λ∇f (y) et |λ| suffisamment petit. Ceci 34 signifie que la dérivée partielle de f au voisinage de y dans une direction donnée par le gradient ∇f (y) est locallement maximum en y. Cette définition des contours correspond donc aux points d’inflexion dans une image. 2.2.5 Maxima d’ondelette pour des images Rappelons que le module de la TOD 2D à l’échelle s = 2j est défini par q Mf (x, 2j ) = |Wf1(x, 2j )|2 + |Wf2 (x, 2j )|2 . Nous avons montré précédemment que cette quantité est proportionnelle au module du gradient de l’image f lissée par le noyau θ à l’échelle 2j i.e. Mf (x, 2j ) = 2j k∇(f ⋆ θ2∗j )(x)k. Définissons Af (x, 2j ) comme l’angle entre la composante horizontale Wf1 (x, 2j ) et la composante verticale Wf2 (x, 2j ) de la TOD 2D par j Af (x, 2 ) = α(x) π − α(x) où α(x) = tan−1 si Wf1 (x, 2j ) ≥ 0, si Wf1 (x, 2j ) < 0, Wf2 (x, 2j ) Wf1 (x, 2j ) ! . → Le vecteur unitaire − n j (x) = (cos Af (x, 2j ), sin Af (x, 2j )) est donc colinéaire au gradient ∇(f ⋆ θ2∗j )(x). Un point d’un contour à l’échelle 2j est alors défini comme un point y tel que x 7→ Mf (x, 2j ) est localement maximum au point x = y pour x = → y + λ− n j (y) et λ suffisamment petit. Ces points sont également appelés les maxima d’ondelettes de l’image f à l’échelle 2j . Ainsi, la détection des contours dans une image via les maxima d’ondelettes est équivalente à un détecteur de Canny multiéchelles. La Figure 2.5 donne un exemple de détection de contours dans une image à partir des maxima d’ondelettes pour un noyau θ Gaussien. On peut constater qu’il est possible de détecter uniquement les contours significatifs en garder les maxima d’ondelettes tels que le module de la TOD 2D en ces points est suffisamment grand par rapport à un seuil bien choisi. 35 (a) (b) (c) Fig. 2.5 – Détection multi-échelles de contours pour l’image du caméraman pour s = 2−j , j = −1, 0, 1, 2 : (a) Mf (x, 2j ) le noir représente les pixels d’intensité maximale et le blanc ceux d’intensité minimale, (b) Maxima d’ondelette, (c) Maxima d’ondelette dont l’amplitude est supérieure à un seuil fixé. 36 Chapitre 3 Bases d’ondelettes Dans les chapitres précédents, nous avons introduit la TOC qui permet une représentation temps-fréquence d’un signal. Nous avons montré que cette transformation est inversible et qu’elle conserve l’énergie du signal. Toutefois, il s’agit d’une représentation très redondante qui nécessite de connaı̂tre l’ensemble des coefficients d’ondelettes pour pouvoir reconstruire un signal. Dans ce chapitre, nous allons nous intéresser à des représentations discrètes d’une fonction qui permettent de résumer l’information contenue dans un signal avec peu de coefficients. En particulier, nous allons montrer qu’il est possible de construire des ondelettes ψ telle que la famille 1 t − 2j k ψj,k (t) = √ ψ 2j 2j (j,k)∈Z2 soit une base orthonormée de L2 (R). Pour une fonction f ∈ L2 (R), les produits scalaires hf, ψj,k i sont appellés les coefficients d’ondelettes dans la base {ψj,k }(j,k)∈Z2 , P+∞ P et tout signal pourra donc s’écrire sous la forme f = +∞ k=−∞ hf, ψj,k iψj,k . Les j=−∞ coefficients d’ondelettes au niveau de résolution j caractérisent les variations d’un signal à l’échelle 2j . Nous allons en particulier montrer que la construction de telle bases permet d’établir un lien entre l’analyse multi-échelle de signaux (largement utilisée en vision par ordinateur), la théorie du filtrage discret en traitement du signal et les mathématiques appliquées. 3.1 3.1.1 Bases orthonormées d’ondelettes Quelques rappels sur les bases hilbertiennes Définition 3.1 Un espace de Hilbert est un R espace vectoriel muni d’un p produit scalaire noté hx, yi (pour x, y ∈ H) qui est complet pour la norme kxk = hx, xi (norme associée au produit scalaire). Proposition 3.1 L’ensemble L2 (R), qui est l’espace des fonctions de carré intégrable, R de norme asest un espace de Hilbert pour le produit scalaire hf, gi = f (t)g(t)dt R R 2 2 2 sociée kf k = R |f (t)| dt pour f, g ∈ L (R). 37 38 Soit H un espace de Hilbert. Nous rappelons les définitions et propriétés suivantes – deux vecteurs x et y de H sont orthogonaux si hx, yi = 0 – soit A une partie non vide de H. On note A⊤ l’orthogonal de A dans H défini par A⊤ = {x ∈ H, ∀y ∈ A, hx, yi = 0}, – A⊤ est un sous-espace vectoriel fermé de H – si A est un sous-espace vectoriel de H, alors Ā = (A⊤ )⊤ . Proposition 3.2 Soit H un espace de Hilbert et F un sous-espace vectoriel fermé de H. Pour tout x ∈ H, on note PF x la projection orthogonale de x sur F qui est caractérisée comme l’unique point de F tel que kx − PF xk = inf y∈F kx − yk. De plus, – pour tout y ∈ F , hx − PF x, yi = 0 – PF : H L → F est une application linéaire et continue, – H=F F ⊤. Définition 3.2 Soit H un espace de Hilbert et soit (Hn )n≥0 une suite de sousespaces vectoriels fermés de H. On dit que H est une somme hilbertienne des Hn si – ∀m 6= n, ∀(x, y) ∈ Hm × Hn , hx, yi = 0 – l’espace vectoriel L engendré par les Hn est dense dans H. On note alors, H = n≥0 Hn . L Proposition 3.3 Soit H = n≥0 Hn . Si x ∈ H, on pose pour tout n ∈ N, xn = a alors PHn x. On P PN – x = n≥0 x , i.e. lim n N →∞ n=0 xn = x P – kxk2 = n≥0 kxn k2 (égalité de Bessel-Parseval) Réciproquement, soit (xn )Pune suite dans H telle que pour tout n, xn ∈ Hn et P N 2 n=0 xn converge vers un point x ∈ H tel que pour tout n≥0 kxn k < +∞, alors n ∈ N, xn = PHn x. Définition 3.3 On appelle base hilbertienne (ou base orthonormée) une suite (en )n≥0 d’éléments de H telle que – hen , em i = δn,m – l’espace vectoriel engendré par les (en )n≥0 est dense dans H. D’après ce qui précède, si (en )n≥0 est une base orthonormée P d’un espace de Hilbert P H, alors tout x ∈ H s’écrit de manière unique x = n≥0 hx, en ien avec kxk2 = n≥0 |hx, en i|2. 3.1.2 Analyse multirésolution de L2(R) La décomposition d’un signal à différents niveaux de résolution est largement utilisée en vision par ordinateur. Une analyse multirésolution correspond au calcul d’un ensemble de coefficients qui constituent une représentation plus ou moins précise 39 d’un signal. Par exemple, l’approximation d’une fonction f au niveau de résolution j peut être définie par la donnée d’une suite de coefficients qui correspondent à une moyenne locale de f sur des intervalles disjoints de longueur 2j . Lorsque que l’on passe de la résolution j à la résolution j + 1 le niveau d’approximation est plus grossier, alors que lorsque l’on passe du niveau j au niveau j − 1 on affine la qualité de l’approximation (voir Figure 3.1). De façon plus formelle, l’approximation d’une fonction f à la résolution j correspond à la projection orthogonale de f sur un sous-espace Vj ⊂ L2 (R) ce qui conduit à la définition suivante : Définition 3.4 Une analyse multirésolution (AMR) de L2 (R) est une succession de sous-espaces fermés (Vj )j∈Z qui satisfait les 6 propriétes suivantes ∀j ∈ Z, ∀j ∈ Z, Vj+1 ⊂ Vj ⊂ . . . ⊂ L2 (R), t f (t) ∈ Vj ⇐⇒ f ( ) ∈ Vj+1 , 2 \ Vj = {0}, (3.1) (3.2) (3.3) j∈Z [ Vj = L2 (R), (3.4) j∈Z ∀(j, k) ∈ Z2 , f (t) ∈ Vj =⇒ f (t − 2j k) ∈ Vj (3.5) il existe φ ∈ V0 telle que {φ(t − k), k ∈ Z} soit une base orthonormée de V0 . Au niveau de résolution j, l’approximation d’une fonction f ∈ L2 (R) correspond à la projection orthogonale PVj f de f sur Vj . Intuitivement, on peut interpréter les 6 propriétés d’une AMR de la façon suivante – l’inclusion (3.1) des espaces Vj signifie qu’une approximation d’un signal au niveau de résolution j est plus précise que l’approximation au niveau j + 1, – la multirésolution est définie par la propriété (3.2) : l’espace Vj+1 définit une approximation deux fois plus grossière que la représentation dans l’espace Vj , – lorsque que le niveau de résolution devient de plus en plus grossier i.e. j → +∞, la propriété (3.3) implique que l’approximation de f se dégrade et que l’on perd tous les détails sur f i.e limj→+∞ kPVj f k = 0, – lorsque l’échelle d’analyse 2j tend vers zéro (i.e. j → −∞), la propriété (3.4) impose que l’approximation du signal converge vers le signal original i.e. limj→−∞ kf − PVj f k = 0, – la propriété (3.5) signifie que l’espace Vj est invariant par des translation proportionnelles à l’échelle d’analyse 2j , – φ est la fonction d’échelle de l’AMR, également appelée fonction génératrice de l’espace V0 . Des propriétés d’une AMR, on déduit immédiatement la proposition suivante j k Proposition 3.4 Posons φj,k (t) = √12j φ t−2 . Alors pour tout j ∈ Z, {φj,k , k ∈ 2j Z} est une base orthonormée de Vj . 40 Dans ce qui suit, nous allons montrer que l’on peut entièrement spécifier une AMR à partir de la donnée d’une fonction d’échelle φ. Les deux fonctions suivantes sont des exemples classiques d’une AMR de L2 (R) – Approximation constante par morceaux : si φ(t) = 11[0,1] (t) est la fonction indicatrice de l’intervalle [0, 1], alors Vj est le sous-espace de fonctions f ∈ L2 (R) telles que f (t) est constante sur chaque intervalle {Ij,k = [2j k, 2j (k + 1)[, k ∈ Z}. L’AMR est alors constituée de l’ensemble des fonctions constantes par morceaux sur les intervalles Ij,k , (j, k) ∈ Z2 i.e. φj,k (t) = 2−j/211Ij,k (t). Au niveau de résolution j, l’approximation d’un signal f ∈ L2 (R) est une fonction en escalier qui est la moyenne de f sur chaque intervalle Ij,k (voir Figure 3.1). , alors – Approximation de Shannon. On peut montrer que si φ(t) = sin(πt) πt {φ(t − k), k ∈ Z} est une base orthonormée de l’espace V0 des fonctions de L2 (R) dont la transformée de Fourier est à support inclus dans [−π, π]. En définissant les espaces Vj comme l’ensemble des fonctions dont la transformée de Fourier est à support inclus dans [−2−j π, 2−j π], on peut vérifier que ceci définit bien une AMR de L2 (R). L’approximation de f ∈ L2 (R) au niveau de résolution j correspond à un filtre fréquentiel. On peut en effet montrer que PVˆj f(ω) = fˆ(ω)11[−2−j π,2−j π] (ω). Généralement, l’approximation au niveau de résolution j correspond à un filtrage passe-bas dont la largeur de bande est inversement proportionnelle à l’échelle 2j . 25 17 22 16 20 15 18 14 16 13 14 12 12 11 10 24 22 20 20 18 15 16 14 10 12 10 5 8 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 10 0 0.1 0.2 0.3 (a) 0.4 0.5 0.6 0.7 0.8 0.9 1 8 0 0.1 0.2 0.3 (b) 3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 (c) 5 0.5 0.6 0.7 0.8 0.9 1 0.6 0.7 0.8 0.9 1 3 2.5 4 0.4 (d) 2 2 2 3 1.5 2 1 1 0.5 0 0 −1 −0.5 −2 −1 1 0 1 0 −1 −1 −3 −1.5 −2 −2 −4 −3 6 0 0.1 0.2 0.3 0.4 0.5 (e) 0.6 0.7 0.8 0.9 1 −5 −2 0 0.1 0.2 0.3 0.4 0.5 (f) 0.6 0.7 0.8 0.9 1 −2.5 0 0.1 0.2 0.3 0.4 0.5 (g) 0.6 0.7 0.8 0.9 1 −3 0 0.1 0.2 0.3 0.4 0.5 (h) Fig. 3.1 – (a) Signal présentant 2 singularités. Approximation constante par morceaux au niveau : (b) j = 1, (c) j = 2 et (d) j = 3. Projection du signal sur les sous-espaces d’ondelettes (e) W0 , (f) W1 , (g) W2 et (h) W3 . 41 3.1.3 Filtres mirroirs conjugués Dans cette section, nous étudions les caractéristiques que doit vérifier une fonction d’échelle φ pour générer une base orthonormée de chaque espace Vj et garantir toutes les propriétés d’une AMR. Nous montrons en particulier que toute fonction d’échelle est entièrement spécifiée par un filtre discret appelé filtre mirroir conjugué. Supposons que l’on ait construit une AMR de L2 (R). La propriété (3.2) impose que 2−1/2 φ(t/2) ∈ V1 ⊂ V0 et comme {φ(t − k), k ∈ Z} est une base orthonormée de V0 , on obtient que : k=+∞ X 1 t √ φ( ) = hk φ(t − k) 2 2 k=−∞ où hk = h2−1/2 φ(t/2), φ(t − k)i. La suite hk s’interprète un filtre discret dont la transformée de Fourier est P+∞comme−ikω définie par ĥ(ω) = n=−∞ hk e ce qui permet d’obtenir l’expression suivante : 1 φ̂(2ω) = √ ĥ(ω)φ̂(ω). 2 L’équation précédente implique que l’on peut écrire φ̂ sous la forme : ! p −i Y ĥ(2 ω) √ φ̂(ω) = φ̂(2−p ω). 2 i=1 Et en prenant la limite quand p → +∞, il est alors tentant d’écrire que : ! +∞ Y ĥ(2−i ω) √ φ̂(ω) = φ̂(0). 2 i=1 Le théorème suivant (dû à S. Mallat et Y. Meyer) donne les conditions nécessaires et suffisantes sur le filtre ĥ(ω) pour que le produit ci-dessus permette de définir une AMR. Théorème 3.1 Soit φ ∈ L2 (R) une fonction d’échelle d’une AMR, alors la transformée de Fourier du filtre défini par hk = h2−1/2 φ(t/2), φ(t − k)i vérifie √ (3.6) ∀ω ∈ R, |ĥ(ω)|2 + |ĥ(ω + π)|2 = 2, et ĥ(0) = 2. Réciproquement, si ĥ(ω) est une fonction 2π-périodique et continûment dérivable au voisinage de ω = 0, alors si ĥ vérifie les propriétés (3.6) et si inf ω∈[−π/2,π/2] |ĥ(ω)| > 0, 42 alors le produit φ̂(ω) = +∞ Y ĥ(2−iω) √ 2 i=1 ! , est la transformée de Fourier d’une fonction d’échelle φ ∈ L2 (R) qui définit une AMR. Le théorème précédent montre qu’il est donc équivalent de connaı̂tre le filtre (hk )k∈Z ou la fonction d’échelle φ, et que la construction d’une AMR de L2 (R) peut se faire à partir d’un filtre qui vérifie les propriétés énoncées ci-dessus. En effet, si on connait la fonction φ, on construit une AMR en définissant : Vj = V ect {2−j/2φ(2−j x − k), k ∈ Z}. La caractérisation des fonctions d’échelles à partir de la donnée des filtres (hk )k∈Z permet donc d’établir un lien entre les mathématiques appliquées et la théorie du filtrage discret en traitement du signal. Ceci va se révéler particulièrement utile pour le calcul des coefficients d’ondelettes d’un signal discret comme nous le verrons par la suite. Nous avons vu précédemment que pour l’ – Approximation constante par morceaux, φ(t) = 11[0,1] (t) et que φj,k (t) = 2−j/2 11Ij,k (t), (j, k) ∈ Z2 . On obtient alors que hk = √1 2 0 si k = 0, 1 sinon – Approximation de Shannon, φ̂(ω) = 11[−π,π](ω) ce qui implique que pour √ tout ω ∈ [−π, π], ĥ(ω) = 211[−π/2,π/2] (ω). En utilisant le fait que la famille de fonctions {e−ikω }k∈ZR est une base orthonormée de L2 ([−π, π]) pour le produit π ˆ 1 scalaire hfˆ, ĝi = 2π f (ω)ĝ(ω)dω, on obtient alors que −π √ Z π/2 √ sin( π2 k) 2 hk = eikω dω = 2 . 2π −π/2 πk 3.1.4 Ondelettes orthogonales L’approximation d’une fonction f aux échelles 2j et 2j−1 est définie par la projection orthogonale de f sur les espaces Vj et Vj−1 respectivement. Etant donné que Vj ⊂ Vj−1, on définit l’espace Wj comme l’espace complémentaire orthogonal de Vj dans Vj−1 i.e. M Vj−1 = Vj Wj . L’approximation de f à l’échelle 2j−1 peut donc se décomposer sous la forme M PVj−1 f = PVj f PWj f. 43 L’espace Wj permet de calculer les détails PWj f pour la fonction f qui permettent de passer de l’approximation à l’échelle 2j à une approximation plus fine à l’échelle 2j−1 . De la définition d’une AMR, on déduit les propriétés suivantes (S. Mallat et Y. Meyer) qui permettent de construire une base orthornormée de Wj à partir de contractions et dilatations d’une ondelette ψ : – – – – – ∀(j, j ′ ) ∈ Z2 , j 6= j ′ ⇒ Wj ⊥Wj ′ , L 2 j∈Z Wj = L (R), f (t) ∈ Wj ⇐⇒ f ( 2t ) ∈ Wj+1 ∀(j, k) ∈ Z2 , f (t) ∈ Wj =⇒ f (t − 2j k) ∈ Wj soit 1 ω ω ψ̂(ω) = √ ĝ( )φ̂( ), avec ĝ(ω) = e−iω ĥ(ω + π), 2 2 2 j k et posons ψj,k (t) = √12j ψ t−2 . Alors pour tout j ∈ Z, {ψj,k , k ∈ Z} est une 2j base orthonormée de Wj , et donc {ψj,k , (j, k) ∈ L2 (R)} est une base orthonormée de L2 (R). La fonction ψ est appelée ondelette mère ou plus simplement ondelette de l’AMR. Les espaces Wj sont appelés les sous-espaces de détail ou sous-espaces d’ondelettes. Ils caractérisent la différence d’information entre les projections sur les espaces Vj et Vj−1 . De ce qui précède, on obtient que si l’on dispose d’une AMR de L2 (R) alors toute fonction f ∈ L2 (R) peut s’écrire sous la forme d’une décomposition en ondelettes +∞ +∞ X +∞ X X hf, ψj,k iψj,k , PW j f = f= j=−∞ k=−∞ j=−∞ et pour tout j0 ∈ Z, f = PVj0 f + j0 X j=−∞ PW j f = +∞ X hf, φj0 ,k iφj0 ,k + k=−∞ j0 +∞ X X hf, ψj,k iψj,k . j=−∞ k=−∞ Comme ψ ∈ V0 , l’ondelette vérifie l’équation +∞ X 1 t √ ψ( ) = gk φ(t − k) 2 2 k=−∞ et on peut alors montrer que la fonction ĝ introduite précédemment est la transformée de Fourier du filtre discret (gk )k∈Z qui est donné par gk = h2−1/2 ψ(t/2), φ(t − k)i. On peut également montrer que (gk )k∈Z est un filtre mirroir de (hk )k∈Z i.e. gk = (−1)1−k h1−k . 44 Cette propriété de filtre en mirroir joue un rôle important dans la mise au point d’algorithmes rapides de transformée en ondelettes. En reprenant les exemples précédents d’AMR, on obtient que – Approximation constante par morceaux. Le ondelettes de Haar correspondent au cas d’une AMR constituée des fonctions constates par morceaux et sont telles que : −1 si 0 ≤ t < 1/2 1 si 1/2 ≤ t < 1 ψ(t) = 0 sinon et gk = 1 − √2 √1 2 0 si k = 0 si k = 1 sinon – Approximation de Shannon, φ̂(ω) = 11[−π,π] (ω) et ĥ(ω) = ce qui implique que −iω/2 S e si ω ∈ [−2π, −π] [π, 2π] ψ̂ = 0 sinon, et ψ(t) = √ 211[−π/2,π/2] (ω) sin 2π(t − 1/2) sin π(t − 1/2) − . 2π(t − 1/2) π(t − 1/2) Généralement, pour les ondelettes orthogonales, l’énergie de ψ̂ est essentiellement S concentrée sur les intervalles [−2π, −π] [π, 2π]. La projection de f sur l’espace Wj correspond donc à un filtrage passe-bande dont la largeur dépend du niveau de résolution j. La Figure 3.1 donne un exemple de projection d’une fonction dans différents espaces de détails Wj , j = 0, 1, 2, 3 pour la base de Haar. 3.2 3.2.1 Construction de bases d’ondelettes Liens entre filtres, nombre de moments nuls et régularité de l’ondelette Les ondelettes de Shanon sont des fonctions C ∞ qui décroissent lentement quand t tend vers +∞ et −∞, et qui ont un nombre infini de moments nuls. Toutefois, elles ne sont pas à support compact. L’un des buts d’une décomposition en ondelettes dans une base orthonormée, est de représenter une fonction f avec peu de coefficients significatifs. Nous allons voir par la suite que les ondelettes à support compact sont bien adaptées pour obtenir des représentations parcimonieuses (ou creuses) d’un signal. L’amplitude des coefficients d’ondelettes et le nombre de coefficients significatifs dépend à la fois de 45 – la régularité de f – du nombre de moments nuls r – de la taille du support de ψ Les deux dernières propriétés ainsi que la régularité de l’ondelette ψ peuvent être reliées aux caractéristiques du filtre (hk )k∈Z . • Nombre de moments nuls : rappelons que si une ondelette a r moments nuls, alors elle est orthogonale à tous les polynômes de degré inférieur ou égal r−1. Dans le chapitre précédent, nous avons montré que si f est suffisamment régulière alors l’amplitude coefficients d’ondelettes |hf, ψj,k i| est d’autant plus petite aux fines échelles (j → −∞) que r est grand car |hf, ψj,k i| est borné par 2j(r+1/2) . Soient ψ et φ les fonctions ondelette et d’échelle d’une AMR telles que |ψ(t) = O((1 + t2 )−r/2−1 )| et |ψ(t) = O((1 + t2 )−r/2−1 )|, alors les trois assertions suivantes suivantes sont équivalents et montrent que le nombre de moments nuls dépend du nombre de zéros de ψ̂ et ĥ aux points ω = 0 et ω = π : – l’ondelette ψ a r moments nuls – ψ̂(ω) et ses r − 1 dérivées sont nulles au point ω = 0 – ĥ(ω) et ses r − 1 dérivées sont nulles au point ω = π • Taille du support de l’ondelette : si f a une singularité isolée en point x0 et si le support de ψj,k contient le point x0 alors l’amplitude de |hf, ψj,k i| peut être élevée. Si ψ est à support compact de taille K, alors à l’échelle j, il y a K coefficients |hf, ψj,k i| qui sont influencés par le comportement de f au voisinage de x0 . Pour réduire le nombre de coefficients de grande amplitude, il est donc nécessaire de minimiser la taille du support de ψ. La proposition suivante montre que la taille du support de l’ondelette est relié à la longueur du filtre (hk )k∈Z (nombre de coefficients hk non nuls) : Proposition 3.5 Le filtre h et la fonction d’échelle ψ sont à support compact si et seulement si leurs supports sont égaux. Si le support de h et de la fonction d’échelle ψ est [N1 , N2 ], alors le support de ψ est [(N1 − N2 + 1)/2, (N2 − N1 + 1)/2]. • Taille du support et nombre de moments nuls : pour de ondelettes orthogonales, la taille du support et le nombre de moments nuls ne sont pas indépendants. En effet, il est possible de montrer (théorème dû à I. Daubechies) que si ψ a r moments nuls, alors son support est au moins de taille 2r − 1. Nous verrons par la suite que les ondelettes de Daubechies sont optimales dans le sens où elles ont une taille de support minimale pour un nombre de moments nuls donné. Lors d’une décomposition en ondelettes, il est donc nécessaire de trouver un compromis entre taille du support et nombre de moments nuls. Si le signal f a quelques singularités isolées et est très régulier entre ces points, on peut choisir une ondelette avec un nombre de moments nuls élevés de sorte à produire peu de coefficients d’ondelettes |hf, ψj,k i| significiatifs. Si le nombre de singularités augmente, le nombre de 46 fonctions analysantes ψj,k dont le support contient une singularité augmente et il peut donc être judicieux de réduire la taille du support de ψ même si cela diminue r. • Régularité de l’ondelette : on peut montrer que la régularité de ψ est reliée au nombre de zéros de ĥ en ω = π. La régularité de l’ondelette influence laP qualité de reP +∞ construction ou de débruitage d’un signal. En effet, si on a f = +∞ k=−∞ hf, ψj,k iψj,k , j=−∞ alors une perturbation de ǫ d’un coefficent hf, ψj,k i ajoute la composante ǫψj,k . Plus l’ondelette est régulière et moins cette perturbation sera visible. Enfin, il est important d’insister sur le fait que l’amplitude des coefficients d’ondelettes dépend du nombre de moments nuls et non de la régularité de l’ondelette ψ. 3.2.2 Quelques exemples classiques d’ondelettes • Ondelettes de Haar : la base de Haar est obtenue à partir d’une AMR constituée de fonctions constantes par morceaux. Le filtre (hk )k∈Z a deux coefficients non nuls aux points k = 0 et k = 1, et l’ondelette de Haar a le plus petit support parmi toutes les ondelettes orthogonales. Toutefois, il s’agit d’une fonction discontinue qui n’est pas bien adaptée pour représenter les signaux lisses. • Ondelettes de Daubechies : une ondelette de Daubechies a un support de taille minimale égal à [−r + 1, r] pour un nombre de moments nuls r donné. De plus, la régularité de ces ondelettes augmente avec r. Le support de la fonction d’échelle φ est [0, 2r − 1]. • Symmlets : les ondelettes de Daubechies sont très assymétriques. Daubechies a montré que l’ondelette de Haar est la seule ondelette symmétrique. Les ondelettes Symmlets sont construites de sorte à avoir des fonctions analysantes les moins assymétriques possibles. Il s’agit à nouveau d’ondelettes qui ont un support minimal égal à [−r + 1, r] avec r moments nuls. • Coiflets : il s’agit d’une ondelette qui a r moments nuls et une taille de support minimale, dont la fonction d’échelle φ vérifie Z +∞ Z +∞ φ(t)dt = 1, et tk φ(t)dt = 0 pour 1 ≤ k < r. −∞ −∞ Ces fonctions d’échelles sont très utiles pour établir des formules précises entre l’approximation d’une fonction dans un espace VJ etRl’échantillonnage d’une fonction. En +∞ effet, pour une ondelette donnée on a toujours −∞ φ(t)dt = 1 et si on suppose que f est C 1 alors, en utilisant un développement de Taylor, on obtient l’approximation suivante entre les échantillons de f et sa projection dans le sous-espace VJ : 2−J/2 hf, φJ,k i ≈ f (2J k) + O(2J ). 47 Si on utilise des Coiflets, on augmente la qualité de l’approximation car dans ce cas on montre que si f est C k avec k < r alors 2−J/2 hf, φJ,k i ≈ f (2J k) + O(2J(k+1) ). La taille du support des Coiflets est 3r − 1. La Figure 3.2 donne les graphes des ondelettes de Daubechies et Symmlets pour différentes valeurs de r. On peut constater que pour ces ondelettes la régularité de ψ augmente avec r. 2 2 1.5 1.5 1 1 0.5 0.5 0 0 −0.5 −0.5 −1 −1 1.5 1 0.5 0 −0.5 −1.5 −1 −0.5 0 0.5 1 1.5 2 −1.5 −2 −1.5 −1 −0.5 0 (a) 0.5 1 1.5 2 2.5 3 −1 −3 −2 −1 (b) 1.5 0 1 2 3 4 (c) 1.5 1 1 1 0.5 0.5 0.5 0 0 0 −0.5 −0.5 −0.5 −1 −1 −1 −1.5 −4 −3 −2 −1 0 (d) 1 2 3 4 5 −1.5 −5 −4 −3 −2 −1 0 1 2 3 4 5 6 −1.5 −6 (e) −4 −2 0 2 4 6 (f) Fig. 3.2 – Ondelettes de Daubechies (a) r = 2, (b) r = 3, (c) r = 4, et Symmlets (d) r = 5, (e) r = 6, (f) r = 7. La Figure 3.3 donne un exemple de décomposition dans différentes bases d’ondelettes du signal tracé dans la Figure 3.1(a). On peut remarquer que les coefficients d’ondelettes de grande amplitude se concentrent au niveau des singularités du signal à mesure que l’échelle diminue (j → −∞) et que le nombre de coefficients significatifs dépend du nombre de moments nuls r. 3.2.3 Ondelettes sur un intervalle borné Dans les sections précédentes, nous avons étudié la construction de bases d’ondelettes pour des fonctions de L2 (R). En pratique, les signaux rencontrés sont soit périodiques, soit définis sur un intervalle bornée, par exemple [0, 1]. Afin de pouvoir analyser des signaux réels, il est donc nécessaire de pouvoir construire des bases d’ondelettes pour l’espace L2 ([0, 1]). En effet, il n’est pas judicieux d’utiliser une AMR de L2 (R) pour une fonction f de L2 ([0, 1]) en imposant f = 0 en dehors de 48 10 −2 8 −2.5 −3 6 −3.5 4 −4 2 −4.5 0 −5 −2 −5.5 −4 −6 −6 −8 −6.5 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 −7 0 0.1 0.2 0.3 0.4 (a) −2 −2 −2.5 −3 −3 −3.5 −3.5 −4 −4 −4.5 −4.5 −5 −5 −5.5 −5.5 −6 −6 −6.5 −6.5 0 0.1 0.2 0.3 0.4 0.5 (c) 0.6 0.7 0.8 0.9 1 0.6 0.7 0.8 0.9 1 (b) −2.5 −7 0.5 0.6 0.7 0.8 0.9 1 −7 0 0.1 0.2 0.3 0.4 0.5 (d) Fig. 3.3 – (a) Signal présentant 3 singularités. Coefficients d’ondelettes au niveau j = −3, −4, −5, −6 dans la base de (b) Haar, (c) Daubechies r = 2 et (d) Symmlets r = 4. Les barres verticales représentent l’amplitude de 2−j coefficients d’ondelettes au niveau de résolution j. [0, 1], car cette extension crée généralement deux discontinuités en t = 0 et t = 1 qui génèrent de grands coefficients près des bords. Des bases d’ondelettes de L2 ([0, 1]) sont obtenues en modifiant les ondelettes (ψj,k )(j,k)∈Z2 d’une base de L2 (R). Les ondelettes intérieures (dont le support est inclus dans [0, 1]) ne sont pas modifiées, alors que les ondelettes aux bords, dont le support contient les points t = 0 ou t = 1, sont transformée en des fonctions à support dans [0, 1] de sorte à générer une base orthonormée de L2 ([0, 1]). La principale difficulté de cette construction est d’obtenir des ondelettes qui conservent leur nombre de moments nuls. Nous citerons deux approches pour construire des ondelettes sur un intervalle bornée et nous détaillerons uniquement la construction pour des ondelettes périodiques. Les fonctions d’échelle φj,k sont également modifiées pour avoir un support inclus dans [0, 1]. Si ψ est à support compact, il existe un nombre constant d’ondelettes incluses dans un intervalle borné à chaque échelle. Une base orthonormée d’ondelettes de L2 ([0, 1]) est alors constituée de 2−J fonctions d’échelle à une échelle 2J < 1 et de 2−j ondelettes à chaque échelle 2j ≤ 2J : o n (φ̃J,k )0≤k<2−J , (ψ̃j,k )−∞<j≤J,0≤k<2−j , 49 et une fonction f ∈ L2 ([0, 1]) se décompose alors sous la forme f= −j 2−J −1 X J 2X −1 X hf, ψ̃j,k iψ̃j,k . hf, φ̃J,k iφ̃J,k + k=0 j=−∞ k=0 Sur un intervalle [a, b], une base orthonormée d’ondelettes de L2 ([a, b]) peut alors se construire par translation de a et dilatation par b − a d’ondelettes sur l’intervalle [0, 1]. • Ondelettes périodiques : une base d’ondelettes de L2 ([0, 1]) peut être obtenue en périodisant une AMR de L2 (R) i.e. en posant φ̃J,k (t) = 2 −J/2 +∞ X φJ,k (t + l) et ψ̃j,k (t) = 2 −j/2 l=−∞ +∞ X ψj,k (t + l) . l=−∞ Pour j ≤ 0, il y a 2−j ondelettes différentes ψ̃j,k indexée par 0 ≤ k < 2−j . Si le support de ψj,k est inclus dans [0, 1] alors ψ̃j,k = ψj,k . Sinon l’ondelette ψj,k est transformée en une fonction qui a deux composantes disjointes au voisinage de t = 0 et t = 1 (voir Figure 3.4). 1.5 1 1 0.5 0.5 0 0 −0.5 −0.5 −1 −1 −1.5 0 0.1 0.2 0.3 0.4 0.5 (a) 0.6 0.7 0.8 0.9 1 −1.5 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 (b) Fig. 3.4 – Ondelettes périodiques sur [0, 1] pour j = −3, k = 0 (a) Daubechies , (b) Symmlets (r = 6). n −j o En notant Ṽj et W̃j les sous-espaces vectoriels engendrés par φ̃j,k , 0 ≤ k < 2 n o et ψ̃j,k , 0 ≤ k < 2−j respectivement, on montre que les ondelettes périodiques 50 générent une AMR de L2 ([0, 1]) dans le sens où ∀j ≤ 0, [ Ṽj Ṽj ⊂ Ṽj−1 = L2 ([0, 1]) f (t) ∈ Ṽj φ̃0,0 (t) = 1 dimṼj = 2−j dimW̃j = 2−j ⇒ et et et Ṽj−1 = f (t/2) ∈ Ṽj+1 Ṽ0 = {f ∈ L2 ([0, 1]), f = cste} φ̃j,k (t) = φ̃j,0(t − 2j k) est une base orthonormée de Ṽj , ψ̃j,k (t) = ψ̃j,0 (t − 2j k) est une base orthonormée de W̃j M Ṽj W̃j j≤0 ˜ = f (t mod 1) Pour f ∈ L2 ([0, 1]), on note f˜ la périodisation de f sur R (i.e. f(t) pour t ∈ R). On peut alors facilement vérifier que ˜ ψj,k i. hf, φ̃j,k i = hf˜, φj,k i et hf, ψ̃j,k i = hf, Les coefficients d’ondelettes périodiques peuvent donc s’interpréter comme la décomposition de f˜ (périodisation de f sur R) dans une base d’ondelettes de L2 (R). Les ondelettes périodiques composées de deux segments disjoints au voisinage t = 0 et t = 1 n’ont pas de moments nuls ce qui génére de grands coefficients d’ondelttes au bord de [0, 1] (voir Figure 3.5). En effet, si f (0) 6= f (1) alors ces ondelettes se comportent comme si le signal était discontinu en t = 0 et t = 1. Malgré le mauvais comportement des ondelettes périodiques aux bords de [0, 1], celles-ci sont souvent employées pour la simplicité de leur implémentation numérique. 2 −2 1.8 −3 1.6 −4 1.4 −5 1.2 −6 1 −7 0.8 0 0.1 0.2 0.3 0.4 0.5 (a) 0.6 0.7 0.8 0.9 1 −8 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 (b) Fig. 3.5 – (a) Signal régulier f avec une singularité en x = 0.5, (b) Coefficients d’ondelettes pour une Symmlet avec r = 8 moments nuls. On peut remarquer que f (0) et f (1) sont très différents, ce qui génére de grands coefficients aux bords de [0, 1]. 51 • Ondelettes sur l’intervalle : comme nous l’avons vu précédedemment, les coefficients d’ondelettes sont de faible amplitude dans les régions où le signal est régulier si les ondelettes analysantes ont suffisamment de moments nuls. Les ondelettes périodiques localisées au voisinage de t = 0 et t = 1 n’ont pas de moment nul, et ne peuvent donc pas prendre en compte la régularité d’un signal aux bornes de [0, 1]. Ce comportement génère des coefficients de grande amplitude qui ne correspondent pas à la présence de singularités. Cohen, Daubechies et Vial ont proposé une technique pour obtenir des ondelettes sur l’intervalle [0, 1] qui ont autant de moments nuls que l’ondelette orginale ψ. Toutefois, cette construction est plus longue et plus compliquée à décrire que celle des des ondelettes périodiques, et nous renvoyons à Mallat [7] pour une présentation détaillée. Nous verrons en TP l’intérêt d’utiliser des ondelettes sur l’intervalle par rapport aux ondelettes périodiques. 3.2.4 Ondelettes et bancs de filtres Soit f ∈ L2 (R) et φ, ψ les fonctions d’échelle et d’ondelette d’une AMR de L2 (R). Nous avons vu que la projection orthogonale PVj f de f dans l’espace Vj peut s’exprimer comme la somme des projections orthogonales de f dans les sous-espaces Vj+1 et Wj+1 où PVj f = X aj,k φj,k et aj,k = hf, φj,k i aj+1,k φj+1,k et aj+1,k = hf, φj+1,k i dj+1,k ψj+1,k et dj+1,k = hf, ψj+1,k i k∈Z PVj+1 f = X k∈Z PWj+1 f = X k∈Z Soient (hk )k∈ZZ et (gk )k∈ZZ les filtres conjugués en miroir associés aux fonctions φ et ψ. On montre alors que • Formule de décomposition : le cadre de l’AMR conduit naturellement à un algorithme rapide de calcul des coefficients d’ondelettes à partir de l’approximation LL−1 d’une fonction dans un espace V = V L J j=J Wj qui est basée sur la décomposition L Vj = Vj+1 Wj+1 et la définition des filtres conjugués en miroir : aj+1,k = X n∈Z hn−2k aj,n et dj+1,k = X gn−2k aj,n n∈Z Pour une suite (xk )k∈Z , on note (x̄k )k∈Z la suite obtenue en inversant les éléments de la suite x i.e. x̄k = x−k . Les formules de décomposition ci-dessus peuvent alors s’exprimer à l’aide de convolutions discrètes suivies par un sous-échantillonnage d’un facteur 2 : aj+1,k = aj ⋆ h̄[2k] et dj+1,k = aj ⋆ ḡ[2k]. 52 La décomposition d’un signal dans une base d’ondelettes fait donc intervenir une succession de convolutions discrètes avec le filtre passe-bas h̄ et le filtre passe-haut ḡ. La décomposition d’une suite aL = hf, φL,k i, k ∈ Z dans une base orthonormée d’ondelette est donc composée des coefficients d’ondelettes de f aux échelles 2L < 2j ≤ 2J plus les coefficients d’échelles à l’échelle la plus grossière 2J i.e. l’ensemble de coefficients {(dj )L<j≤J , aJ } qui est calculé à l’aide des formules de décomposition ci-dessus. • Formule de reconstruction : la reconstruction ou synthèse des coefficients d’ondelettes consiste à retrouver la suite aL à partir de l’ensemble de coefficients {(dj )L<j≤J , aJ }. On utilise alors la récurrence ascendante suivante aj,k = X n∈Z hk−2n aj+1,n + X gk−2n dj+1,n n∈Z Pour une suite (xk )k∈Z , on note (x̃k )k∈Z la suite obtenue en insérant un zéro entre chaque élément de la suite x i.e. x̃k = xp si k = 2p et x̃k = 0 si k = 2p + 1. Les formules de décomposition ci-dessus peuvent alors s’exprimer à l’aide de convolutions discrètes aj,k = ãj+1 ⋆ h[k] + d˜j+1 ⋆ g[k]. • Initialisation de l’algorithme : en pratique, on doit déterminer les coefficients d’échelle aL à partir de la discrétisation d’un signal f ( Nk ) k∈Z où 1/N est le pas d’échantillonnage. On doit donc pouvoir associer à la suite f ( Nk ) k∈Z un ensemble de coefficients qui soit une bonne approximation de la projection de f dans VL . Nous avons vu précédemment que si f est C 1 alors 2−L/2 aL,k = f (2L k) + O(2L) et si f est C k , en utilisant des Coiflets, on obtient que 2−L/2 aL,k = f (2Lk) + O(2L(k+1)). Donc, si N = 2−L , on pourra considérer que aL,k ≈ N −1/2 f ( Nk ) constitue une bonne approximation de PVL f pour initialiser l’algorithme de décomposition dans une base d’ondelettes. • Complexité de l’algorithme : supposons que les filtres h et g sont de longueur finie K (cas des ondelettes à support compact). Si aL est une suite de longueur N = 2−L , alors les suites aj et dj sont de longueur 2−j pour L < j ≤ J. Les formules de décomposition ci-dessus impliquent donc que aj+1 et dj+1 sont calculées avec au plus 2−j K additions et multiplications, et les formules de reconstruction montrent que aj est obtenue à partir de aj+1 et dj+1 avec au plus 2−j K opérations. Le coût de la décomposition ou de la reconstruction de la suite aL dans une base d’ondelettes orthogonales est donc en O(n). • Signaux finis et ondelettes périodiques : supposons que le signal f est observé sur [0, 1] et que l’on dispose d’un échantillon f ( Nk ), k = 0, . . . , N −1. Notons aL,k , k = 0, . . . , N −1 l’approximation de f dans l’espace VL obtenue à partir de cet échantillon. Les formules de décomposition impliquent de connaı̂tre les valeurs de aL au delà des 53 bornes k = 0 et k = N − 1. Nous avons vu précédemment que la décomposition dans une base d’ondelettes périodiques d’une fonction f ∈ L2 ([0, 1]) est équivalente à la décomposition dans une base d’ondelettes de L2 (R) de la périodisation de f sur R. Ainsi pour calculer les coefficients d’ondelettes de f dans une base d’ondelettes périodiques de L2 ([0, 1]), il suffit de périodiser la suite aL,k , k = 0, . . . , N − 1 en posant ãL,k = aL,k mod N . 3.3 3.3.1 Bases d’ondelettes pour des images Bases d’ondelettes séparables et multirésolution en 2D Une base d’ondelettes de L2 (R2 ) peut être construite à partir d’une base d’ondelettes de L2 (R). Soient φ la fonction d’échelle et ψ la fonction d’ondelette d’une AMR de L2 (R), et notons Vj et Wj les sous-espaces d’approximation et de détails associés. Une analyse multirésolution séparable de L2 (R2 ) est définie à l’aide du produit tensoriel des espaces d’approximation 1D Vj2 = Vj ⊗ Vj Les espaces Vj2 vérifient les propriétés de l’extension de la définition d’une AMR de L2 (R) au cas des images (relation d’échelle, suite emboı̂tée, approximation...). L’espace Vj2 est l’ensemble des fonctions f ∈ L2 (R2 ) qui s’écrivent comme des combinaisons linéaires de fonctions séparables 1D X f (x1 , x2 ) = ak hk (x1 )gk (x2 ) avec hk ∈ Vj , gk ∈ Vj . k∈Z L’ensemble de fonctions φ2j,k (x1 , x2 ) = φj,k1 (x1 )φj,k2 (x2 ) k=(k ,k )∈Z2 constitue 1 2 une base orthonormée de Vj2 obtenue en dilatant la fonction d’échelle φ2 (x1 , x2 ) = φ(x1 )φ(x2 ) d’un facteur 2j et en la translatant sur une grille 2D de côté 2j . • Approximation constante par morceaux : soient Vj l’espace des fonctions de L2 (R) qui sont constantes sur les intervalles [2j k, 2j (k + 1)[, k ∈ Z. Une AMR constituée de fonctions constantes par morceaux en 2D est alors construite à l’aide des sous-espaces d’approximation Vj2 constitués des images constantes sur les carrés [2j k1 , 2j (k1 + 1)[×[2j k2 , 2j (k2 + 1)[, (k1 , k2 ) ∈ Z2 . 2 2 Soit Wj+1 le complément orthogonal de Vj+1 dans Vj2 i.e. M 2 2 Vj2 = Vj+1 Wj+1 . Une base d’ondelettes orthogonales de Wj2 peut être construite en définissant trois ondelettes ψ 1 (x1 , x2 ) = φ(x1 )ψ(x2 ) ψ 2 (x1 , x2 ) = ψ(x1 )φ(x2 ) ψ 3 (x1 , x2 ) = ψ(x1 )ψ(x2 ). 54 p En posant pour 1 ≤ p ≤ 3 et k = (k1 , k2 ) ∈ Z2 , ψj,k (x) = 1 p ψ 2j x1 −2j k1 x2 −2j k2 , 2j 2j , on 1 2 3 montre que la famille d’ondelettes {ψj,k , ψj,k , ψj,k }k∈Z2 est une base orthogonale de 2 1 2 3 Wj et que {ψj,k , ψj,k , ψj,k }j∈Z,k∈Z2 est une base d’ondelettes orthogonales de L2 (R2 ). Nous verrons par la suite que les coefficients d’ondelettes calculés avec – ψ 1 sont larges le long des contours horizontaux, – ψ 2 sont larges le long des contours verticaux, – ψ 3 sont larges le long des contours diagonaux dans une image. 3.3.2 Algorithme rapide de transformée en ondelettes 2D Les algorithmes de décomposition et de reconstruction pour une base d’ondelettes de L2 (R) peuvent être étendus au cas des images pour construire des algorithmes rapides de calculs des coefficients d’ondelettes en 2D. Pour j ∈ Z et k ∈ Z2 , on définit les coefficients d’approximation et de détails en 2D pour f ∈ L2 (R2 ) par p aj,k = hf, φ2j,k i et dpj,k = hf, ψj,k i, 1 ≤ p ≤ 3. Soient (hk )k∈Z et (gk )k∈Z les filtres associés à l’ondelette ψ. On a alors les relations suivantes : • Formule de décomposition : les coefficients d’approximation et de détails à l’échelle 2j+1 sont obtenus à partir des coefficients d’approximation à l’échelle 2j à l’aide de six groupes de convolutions discrètes uni-dimensionnelles combinées avec des sous-echantillonnages d’un facteur 2 le long des colonnes et des lignes de l’image aj aj →lignes ⋆h̄ ↓ 2 →colonnes ⋆h̄ ↓ 2 → aj+1 →colonnes ⋆ḡ ↓ 2 → d1j+1 aj →lignes ⋆ḡ ↓ 2 →colonnes ⋆h̄ ↓ 2 → d2j+1 →colonnes ⋆ḡ ↓ 2 → d3j+1 • Formule de reconstruction : de même la reconstruction des coefficients d’ondelettes à l’échelle 2j peut se faire à partir des coefficients d’échelles aj+1 et d’ondelettes d1j+1 , d2j+1, d3j+1 à l’échelle 2j+1 . Cette reconstruction peut également s’exprimer à partir de six groupes de convolutions discrètes uni-dimensionnelles combinées avec des insertions de zéros le long des lignes et des colonnes des images aj+1 , d1j+1, d2j+1, d3j+1 aj+1 →colonnes↑ 2 ⋆ h d1j+1 →colonnes ↑ 2 ⋆ g d2j+1 d3j+1 →colonnes ↑ 2 ⋆ h →colonnes↑ 2 ⋆ g ⊕ →lignes↑ 2 ⋆ h ⊕ →lignes ↑ 2 ⋆ g ⊕ → aj 55 Soit f ∈ L2 (R) une image dont on connaı̂t une discrétisation de pas N −1 = 2L . La projection de f dans l’espace VL peut être approximée par aL,k = N −1 f ( kN1 , kN2 ) pour k = (k1 , k2 ) ∈ Z2 . La représentation de f dans une base d’ondelettes est calculée en itérant la formule de décomposition ci-dessus pour obtenir pour L < j ≤ J l’ensemble d’images : {aJ , (d1j , d2j , d3j )L<j≤J } • Cas des images de taille finie : supposons que l’on dispose d’une image carrée aL de taille finie contenant N 2 = 2−2L pixels. Comme dans le cas uni-dimensionnels la décomposition en ondelettes de aL peut être obtenue en utilisant des ondelettes périodiques 1D ce qui revient à calculer à périodiser l’image aL dans R2 puis à utiliser les formules de décomposition et reconstruction 2D ci-dessus. Pour L < j ≤ J, les images aj , d1j , d2j et d3j sont constituées de 2−2j coefficients. Si les filtres h et g sont de longueur finie, on peut vérifier que le coût des l’algorithmes de décomposition et de reconstruction en ondelettes 2D est en 0(N 2 ). 3.3.3 Quelques exemples de décomposition en ondelettes pour des images • Approximation dans les espaces Vj : la Figure 3.6 donne un exemple de projection d’une image de taille 256 × 256 dans plusieurs espaces d’approximation Vj , j = −6, −5, −4 pour des ondelettes de Haar et des Symmlets avec r = 8 moments nuls. On peut constater que la qualité de l’approximation se dégrade plus rapidement avec les ondelettes de Haar à mesure que l’échelle d’analyse augmente. Dans les Figures 3.6(b-c-d) l’approximation est constituée d’images constantes par morceaux sur des carrés de côté 2j , j = −6, −5, −4, alors que les approximations obtenues avec des Symmlets représentées dans les Figures 3.6(e-f-g) sont nettement plus lisses. • Représentation des coefficients d’ondelettes en 2D : l’ensemble des coefficients d’échelle et de détails en 2D est de même taille que le nombre de pixels de l’image originale et peut se représenter sous la forme d’une image organisée de façon hiérarchique (voir Figure 3.7) dont les pixels les plus noirs représentent les coefficients de grande amplitude alors que les pixels blancs représentent les coeffciients d’ondelettes les moins significatifs. La Figures 3.8 donne des exemples de décomposition en ondelettes de trois images de taille 256 × 256 pixels. On peut constater qu’aux petites échelles, les coefficients d’ondelettes de grande amplitude se concentrent au voisinage des points où l’intensité des pixels des images change rapidement. Ils correspondent soit aux contours horizontaux (d1j ), soit aux contours verticaux (d2j ) ou soit aux contours diagonaux d’une image (d3j ). 56 (a) (b) (c) (d) (e) (f) (g) Fig. 3.6 – (a) Image de Lenna, 256 × 256 pixels. Approximation avec des ondelettes de Haar dans les espaces Vj : (b) j = −6, (c) j = −5, (d) j = −4. Approximation avec des ondelettes Symmlets avec r = 8 moments nuls dans les espaces Vj : (e) j = −6, (f) j = −5, (g) j = −4. Insérer Figure Fig. 3.7 – Représentation des coefficients de détails et d’échelle en 2D. 57 50 50 100 100 150 150 200 200 250 250 50 100 150 200 250 50 100 (a) 150 200 250 150 200 250 150 200 250 (b) 50 50 100 100 150 150 200 200 250 250 50 100 150 200 250 50 100 (c) (d) 50 50 100 100 150 150 200 200 250 250 50 100 150 (e) 200 250 50 100 (f) Fig. 3.8 – Exemples de décomposition en ondelettes 2D pour des images de taille 256×256 pixels et j = −7, −6, −5. (a) Boite avec une croix, (b) Coefficients d’échelle et de détails, ondelette Symmlet r = 4. (d) Lenna, (d) Coefficients d’échelle et de détails, ondelette Coiflet r = 8. (e) Scan MRI, (f) Coefficients d’échelle et de détails, ondelette Daubechies r = 2 58 Chapitre 4 Approximation, estimation et compression dans des bases d’ondelettes Nous avons vu précédemment que la décroissance de l’amplitude de la TOC aux fines échelles permet de caractériser la régularité globale ou locale d’un signal. De la même façon, il est possible sous certaines hypothèses, de relier la décroissance des coefficients dans une base d’ondelettes à la régularité d’un signal. Dans ce chapitre, nous allons voir que cette propriété permet d’approximer un signal en gardant uniquement les coefficients d’ondelettes qui sont les plus significatifs. Cette propriété d’approximation permet de représenter efficacement des signaux qui ne sont pas homogènes c’est à dire qui ne sont pas uniformément réguliers. Nous verrons également que cette propriété a des conséquences importantes sur les qualités d’estimation et de compression des bases d’ondelettes. 4.1 4.1.1 Propriétés d’approximation des bases d’ondelettes Décroissance des coefficients d’ondelettes Définition 4.1 Les espaces de Hölder C α (R) sont définis par : (x)| < +∞} – si 0 < α < 1, C α (R) = {f ∈ L∞ (R); supx∈R,h>0 |f (x+h)−f |h|α n ′ – si α = n + α′ , avec 0 < α′ < 1, C α (R) = {f ∈ C n (R); ddxnf ∈ C α (R) Définition 4.2 Les espaces de Hölder ponctuels C α ({x0 }) sont définis par : (x0 )| – si 0 < α < 1, C α ({x0 }) = {f ∈ L∞ (R); suph>0 |f (x0 +h)−f < +∞} |h|α n ′ ′ ′ α n – si α = n + α , avec 0 < α < 1, C ({x0 }) = {f ∈ C ({x0 }); ddxnf ∈ C α ({x0 }) Théorème 4.1 Soit f ∈ C α (R) et ψ une ondelette r fois continûment différentiable avec r moments nuls, associée à une AMR de L2 (R). Si r > α, on a alors l’équivalence 59 60 suivante f ∈ C α (R) ⇔ |hf, ψj,k i| ≤ K2−j(α+1/2) pour tout (j, k) ∈ Z2 , et localement nous avons l’équivalence suivante f ∈ C α ({x0 }) ⇔ |hf, ψj,k i| ≤ K2−j(α+1/2) (1 + |2j x0 − k|)α pour tout (j, k) ∈ Z2 , où K > 0 est une constante indépendante de j et k. En pratique, de nombreux signaux analysés sont des fonctions régulières qui présentent des singularités isolées (par exemple des fonctions C ∞ par morceaux). Le théorème 4.1 montre alors que pour ce type de signaux de nombreux coefficients d’ondelettes seront négligeables. Nous allons voir par la suite que les coefficients qui sont les plus significatifs permettent une bonne reconstruction d’un signal. 4.1.2 Approximation linéaire de fonctions régulières Il existe de nombreux espaces fonctionnels pour caractériser la régularité d’une fonction. Le nombre de dérivées d’un signal permet en particulier de mesurer sa régularité. Afin de caractériser la régularité des fonctions qui sont n − 1 fois continment dérivables mais par n fois, il est possible d’utiliser des espaces de Sobolev d’ordre s > 0 notés W s (R) et qui sont tels que Z +∞ s f ∈ W (R) ⇔ |ω|2s|fˆ(ω)|2dω < +∞. −∞ Si s > n + 1/2 alors on peut vérifier que si f ∈ W s (R) alors f est nécessairement n fois continûment dérivable. Dans ce qui suit, nous allons étudier des fonctions définies sur l’intervalle [0, 1]. L’espace de Sobolev W s ([0, 1]) est alors défini comme l’ensemble des fonctions de L2 ([0, 1]) qu’on peut étendre en dehors de [0, 1] en des fonctions de W s (R). Nous avons vu précédemment qu’il est possible de construire des bases d’ondelettes orthogonales de L2 ([0, 1]). Afin de présenter les propriétés d’approximation des ondelettes, nous supposerons que l’on dispose d’une AMR de L2 ([0, 1]) constituée de 2−j0 fonctions d’échelles {φj0 ,k }0≤k<2−j0 (avec 2−j0 > 1 et d’un ensemble de fonctions ondelettes {ψj,k }−∞<j≤j0,0≤k<2−j . Nous supposerons de plus que les ondelettes ψj,k possèdent r moments nuls (rappelons que la construction de telles ondelettes a été proposée par Cohen et al). Notons que cette hypothèse exclue l’utilisation des ondelettes périodiques car dans ce cas les ondelettes aux bords de l’intervalle [0, 1] n’ont pas de moments nuls. Les résultats indiqués dans la suite restent toutefois valable avec des ondelettes périodiques si on impose que le support du signal analysé est strictement inclus dans [0, 1] afin d’éviter la création de grands coefficients d’ondelettes aux bords dus à la périodisation du signal. 61 L’approximation de f sur les M = 2−J premières fonctions d’échelles et d’ondelettes (avec J < j0 ) est donnée par la projection orthogonale de f sur VJ : fM = PVJ f = 0 −1 2−j X k=0 j0 2 −1 X X hf, ψj,k iψj,k . hf, φj0,k iφj0 ,k + −j j=J+1 k=0 L’erreur d’approximation linéaire correspond alors à l’énergie des coefficients d’ondelettes aux échelles plus petites que 2−J : −j 2 ǫ(M) = kf − fM k = J 2X −1 X j=−∞ k=0 |hf, ψj,k i|2 Si 2−J < M < 2−J+1 n’est pas une puissance de deux, on choisit d’inclure uniquement à l’échelle 2J les coefficients correspondant aux M − 2−J ondelettes {ψJ,k }0≤k<M −2−J . Une mesure de l’erreur d’approximation linéaire en fonction de la régularité du signal est alors donnée par le théorème suivant : Théorème 4.2 Soit 0 < s < r un exposant de Sobolev où r est le nombre de moments nuls de l’ondelette ψ. Alors, si f ∈ W s ([0, 1]) ǫ(M) = o(M −2s ). Il s’agit d’un résultat classique pour l’erreur d’approximation linéaire de fonctions régulières. Les mêmes taux d’erreur peuvent être obtenus à l’aide de séries de Fourier ou bien avec des Splines. 4.1.3 Approximation linéaire de fonctions non-régulières Supposons qu’une fonction de L2 ([0, 1]) possède une discontinuité en un point x0 ∈]0, 1[. Alors, d’après les proprités des espaces de Sobolev, f ne peut pas appartenir à W s ([0, 1]) pour s > 1/2, ce qui implique : Théorème 4.3 Supposons qu’une fonction f ∈ L2 ([0, 1]) soit discontinue en un point x0 ∈]0, 1[, alors pour α > 1 on ne peut pas avoir ǫ(M) = O(M −α ). Ce résultat nous montre que même si la fonction en très régulière à gauche et à droite de x0 (par exemple C s ), l’erreur d’approximation se comporte au mieux en O(M −1 ). Il s’agit d’un des inconvénients majeurs des techniques d’approximation linéaire. 62 4.1.4 Approximation non-linéaire Afin de simplifier les notations nous noterons φj0 ,k = ψj0 +1,k pour 0 ≤ k < 2−j0 . L’approximation non-linéaire d’une fonction f ∈ L2 ([0, 1]) est obtenue à partir des M plus grands coefficients d’ondelettes i.e. X ∗ hf, ψj,k iψj,k , fM = (j,k)∈IM où IM représentent les indices des M coefficients d’ondelettes de plus grande amplitude |hf, ψj,k i|. Une approximation non-linéaire peut également être calculée à partir d’une procédure de seuillage. Soit λ ≥ 0 et Tλ la fonction telle que : x si |x| ≥ λ Tλ (x) = 0 si |x| < λ Si l’on choisi le seuil λ de sorte que pour tout (j, k) ∈ IM , |hf, ψj,k i| ≥ λ et pour tout (j, k) ∈ / IM , |hf, ψj,k i| < λ alors l’approximation non-linéaire de f peut s’écrire comme j0 +1 2−j −1 X X ∗ Tλ (hf, ψj,k i)ψj,k . fM = j=−∞ k=0 L’erreur d’approximation non-linéaire est définie par X ∗ 2 ǫ∗ (M) = kf − fM k = |hf, ψj,k i|2 (j,k)∈I / M Une mesure de l’erreur d’approximation non-linéaire pour certaines fonctions non-régulières est alors donnée par le théorème suivant : Théorème 4.4 Soit f ∈ L2 ([0, 1]) une fonction qui possède un nombre fini de discontinuités et qui est C s (ou uniformément Lipchitizienne d’ordre s) entre ces discontinuités. Si s < r où r est le nombre de moments nuls de l’ondelette ψ, alors ǫ∗ (M) = o(M −2s ) Le théorème 4.4 montre que l’erreur d’approximation non-linéaire dépend de la régularité uniforme de la fonction entre les discontinuités. Ainsi si s > 1/2, alors l’erreur d’approximation non-linéaire ǫ∗ (M) décroit plus vite que l’erreur d’approximation linéaire ǫ(M) et ceci d’autant plus rapidement que s est grand. En effet, en présence de discontuités ǫ(M) décroit au mieux en O(M −1 ). Une approximation non-linéaire correspond à une approximation adaptative. Aux fines échelles, l’approximation se concentre sur les coefficients d’ondelettes de grande amplitude qui sont localisés au voisinage des discontinuités du signal. Ceci permet une bonne reconstruction des parties irrégulières d’une fonction tout en conservant une bonne qualité d’approximation des parties régulières du signal. 63 4.1.5 Quelques exemples d’approximation de fonctions La figure 4.1 donne un exemple d’approximation linéaire et non-linéaire d’un signal régulier par morceaux qui présentent deux discontinuités. On peut constater que la qualité de la reconstruction des deux discontinuités du signal est bien meilleure avec l’approximation non-linéaire. Le taux d’erreur relatif est également bien plus petit pour une approximation non-linéaire. 4 3 2 1 0 −1 −2 −3 −4 −5 −6 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 (a) 6 4 3 4 2 1 2 0 0 −1 −2 −2 −3 −4 −4 −5 −6 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 −6 (b) 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 (c) Fig. 4.1 – (a) Signal f de taille n = 1024 régulier par morceaux présentant 2 discontinuités. Pour une ondelette Coiflet avec r = 6 : (b) approximation linéaire dans l’espace Vj0 pour j0 = −5 i.e. M = 32, kf − fM k/kf k = 0.0537, (c) approximation ∗ non-linéaire pour M = 32, kf − fM k/kf k = 0.0135 4.1.6 Approximation d’images Dans le cas bi-dimensionnel, il est plus difficile de trouver des espaces fonctionnels qui permettent de bien caractériser le comportement d’une image. Une image se compose généralement de parties homogènes où l’intensité des pixels est pratiquement constante, de contours qui correspondent à des changement brusques d’intensité entre deux zones homogènes, ainsi que de parties dites texturées dans lesquelles l’intensité peut varier fortement et rapidement d’un pixel à un autre. Nous ne présenterons pas les espaces fonctionnels utilisés pour modéliser les images. Il est par contre important de noter que les bons résultats de l’approximation 64 non-linéaire obtenus dans le cas 1D ne peuvent pas s’étendre au cas 2D en utilisant des produits tensoriels de bases d’ondelettes uni-dimensionnelles. En effet, supposons que l’on ait construit une base d’ondelettes orthogonales adaptées à l’espace L2 (R2 ). Si f est une image régulière sur deux morceaux qui sont séparés par un contour Ω de longueur finie L > 0 (e.g. f = C 11Ω ) alors l’erreur d’approximation nonlinéaire ǫ∗ (M) d’ordre M (calculée comme dans le cas 1D à l’aide des M plus grands coefficients d’ondelettes) est telle que ǫ∗ (M) ∼ KM −1 , où K est une constante qui dépend du contour Ω. Ainsi, contrairement au cas 1D, une approximation non-linéaire d’une image dans une base d’ondelettes ne décroit pas en fonction de la régularité uniforme de l’image sur chacun des morceaux. Il s’agit d’un des désavantages des bases d’ondelettes en deux dimensions. Pour des images, il est nécessaire d’utiliser de nombreuses ondelettes pour représenter un contour ce qui explique la limitation de la vitesse de convergence de ǫ∗ (M). La recherche de nouvelles réprésentations multiéchelles qui sont adaptées à la géométrie des images fait actuellement l’objet de nombreux travaux (Donoho [], Candes et Donoho [], Donoho et Huo [], Willet et Nowak [], Le Pennec et Mallat [], Cohen et Matei [].) . Ceci permetterait d’améliorer considérablement la qualité de l’approximation de fonctions en 2D ce qui aurait de nombreux avantages en débruitage et compression d’images. 4.1.7 Quelques exemples d’approximation d’images La figure 4.2 donne un exemple d’approximation linéaire et non-linéaire de l’image du caméraman. On peut constater que la qualité de la reconstruction des contours de l’image est bien meilleure avec l’approximation non-linéaire. Le taux d’erreur relatif est également plus petit pour une approximation non-linéaire. 4.2 Débruitage de fonctions 1D Le problème du débruitage de fonctions 1D peut se formuler comme un problème de régression nonparamétrique en statistique. On suppose que l’on dispose de n = 2J observations bruitées d’une fonction inconnue f ∈ L2 ([0, 1]) à des instants régulièrement espacés ti = ni de l’intervalle [0, 1] : yi = f (ti ) + σǫi , i = 1, . . . , n, (4.1) où les ǫi sont des réalisations indépendantes et identiquement distribuées (i.i.d.) de la loi normale de moyenne 0 et de variance 1 (N(0, 1)), et σ est un paramètre qui représente le niveau de bruit (σ 2 correspond donc à la variance du bruit dans ce modèle). L’équation (4.1) correspond au modèle standard de régression nonparamétrique avec un bruit Gaussien. Il s’agit d’un modèle nonparamétrique car, 65 (a) (b) (c) Fig. 4.2 – (a) Image f du caméraman de taille n × n avec n = 256. Pour une ondelette Symmlet avec r = 8 : (b) approximation linéaire dans l’espace Vj0 pour j0 = −6 i.e. M = 4096, kf − fM k/kf k = 0.1354, (c) approximation non-linéaire ∗ pour M = 4096, kf − fM k/kf k = 0.0620 comme nous allons le voir par la suite, aucune hypothèse restrictive n’est faite sur la forme de la fonction f . Le but du débruitage de fonctions est de trouver un estimateur fˆ qui approche au mieux la fonction f . La qualité du débruitage est mesurée à partir de l’erreur quadratique empirique : n E= 1X ˆ (f(ti ) − f (ti ))2 , n i=1 pour f appartenant à une certaine classe de fonctions (par exemple f ∈ W s ([0, 1])(M) = {f ∈ L2 ([0, 1]), kf kW s ≤ M}, ou bien pour f appartenant à une classe de fonctions plus irrégulières). Rappelons que la décomposition en ondelettes d’une fonction f ∈ L2 ([0, 1]) dans 66 une base d’ondelettes périodiques s’écrit sous la forme f= 0 −1 2−j X k=0 j0 2 −1 X X hf, ψ̃j,k iψ̃j,k . hf, φ̃j0,k iφ̃j0,k + −j j=−∞ k=0 Le calcul des coefficients d’échelle et des coefficients d’ondelette empiriques peut s’exprimer à l’aide d’une matrice W de taille n × n dont les lignes correspondent à la discrétisation des fonctions d’échelle et d’ondelette à différents niveaux de résolution. Ainsi, si on note f = [f (t1 ), . . . , f (tn )] le vecteur des valeurs de f aux points du design, les coefficients d’échelle et d’ondelette empiriques au niveau j0 sont donnés par d = W f, où d = [(αj0 ,k )k=0,...,2−j0 −1 , (βj,k )j=−J+1,...,j0 ,k=0,...,2−j −1 ]. Rappelons toutefois qu’il s’agit seulement d’une façon formelle d’écrire la transformée en ondelette empirique car en pratique on utilise l’algorithme pyramidal en O(n) et non pas un produit matriciel (coût en O(n2 )). De plus, nous avons vu précédemment que : √ √ αj0 ,k ≈ nhf, φ̃j0,k i et βj,k ≈ nhf, ψ̃j,k i. On peut montrer que W est une matrice orthogonale i.e. W t W = In ce qui implique que la transformée en ondelette inverse peut s’exprimer comme f = W t d. La matrice W étant une matrice orthogonale, on peut montrer que la transformée en ondelette d’un vecteur Gaussien est à nouveau un vecteur Gaussien de même moyenne et de même matrice de covariance. Ainsi, les coefficients d’échelle et d’ondelette bruités peuvent s’écrire comme (avec y = [y1 , . . . , yn ]) : d̃ = W y, avec α̃j0 ,k = αj0 ,k + σzj0 ,k , k = 0, . . . , 2−j0 − 1 β̃j,k = βj,k + σzj,k , j = −J + 1, . . . , j0 , k = 0, . . . , 2j − 1, où les zj,k sont des variables aléatoires i.i.d. N(0, 1). Nous avons vu précédemment que pour des fonctions qui sont régulières par morceaux, la plupart des coefficients d’ondelette sont nuls aux fines échelles, et que les coefficients d’ondelette de grande amplitude se concentrent aux voisinages des éventuelles singularités du signal. Aux fines échelles, les coefficients d’ondelette d’une fonction bruitée correspondent donc principalement au bruit et seuls quelques coefficients correspondent effectivement au signal. Le débruitage par ondelette d’une fonction est donc obtenu par une procédure de seuillage des coefficients d’ondelettes bruités pour un seuil λ ≥ 0 bien choisi. On distingue en particulier 67 – le seuillage dur (Hard Thresholding) : 0 H δλ (β̃j,k ) = β̃j,k – le seuillage doux (Soft Thresholding) : 0 δλS (β̃j,k ) = β̃j,k − λ β̃j,k + λ si si |β̃j,k | ≤ λ |β̃j,k | > λ si si si |β̃j,k | ≤ λ β̃j,k > λ β̃j,k < −λ En général, on choisit de ne pas modifier les coefficients d’échelles α̃j0 ,k car ceuxci sont très peu influencés par le bruit et correspondent au comportement du signal aux basses fréquences. Prendre j0 = −2 ou j0 = −3 donne généralement de bons résultats. L’estimation de f est alors donnée par fˆλ = 0 −1 2−j X k=0 j0 2X −1 X α̃j0 ,k δλ (β̃j,k ) √ φ̃j0,k + √ ψ̃j,k . n n j=−J+1 k=0 −j Au point du design, on calcule l’estimation de f selon le schéma suivant : y F T −−W −→ {α̃j0 ,k , β̃j,k } Seuillage −−−−−−→ {α̃j0 ,k , δλ (β̃j,k )} IW T −−−→ f̂λ Il a été développé de nombreuses techniques pour déterminer un seuil λ optimal. L’un des méthodes les plus utilisées, car très simple à implémenter, consiste à choisir le seuillage universel : p λ = σ̂ 2 log n, où σ̂ est une estimation du niveau du bruit à partir des coefficients d’ondelettes à l’échelle la plus fine : σ̂ = median({|β̃−J+1,k |, k = 0, . . . , 2−J+1 − 1}) . 0.6745 La Figure 4.3 donne un exemple de débruitage par ondelettes avec un seuillage dur universel. On peut constater que la procédure de seuillage conserve uniquement les coefficients significatifs du signal bruité. 4.3 Compression d’images Nous présentons ici quelques principes de la compression d’images. Une présentation détaillée du problème de la compression de signaux dépasse très largement le cadre de ce cours. Les méthodes de compression des images par ondelettes sont basées sur le fait que les décompositions en ondelettes permettent des représentations creuses des images (c’est à dire avec peu de coefficients). C’est l’une des raisons qui explique le succès du nouveau standard de compression d’images JPEG2000 qui est basé sur 68 4 −2 3 −3 2 1 −4 0 −1 −5 −2 −6 −3 −4 −7 −5 −6 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 −8 0 0.1 0.2 0.3 0.4 (a) 0.5 0.6 0.7 0.8 0.9 1 0.6 0.7 0.8 0.9 1 0.6 0.7 0.8 0.9 1 (b) 6 −2 4 −3 2 −4 0 −5 −2 −6 −4 −7 −6 −8 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 −8 0 0.1 0.2 0.3 0.4 (c) (d) 4 −2 2 −3 0 −4 −2 −5 −4 −6 −6 −7 −8 0 0.1 0.2 0.3 0.4 0.5 0.5 0.6 0.7 0.8 0.9 1 −8 0 0.1 (e) 0.2 0.3 0.4 0.5 (f) Fig. 4.3 – (a), (b) Signal HeaviSine et ses coefficients d’ondelette (Symmlet, r = 8, n = 256, j0 = −3), (c), (d) Signal bruité et coefficients d’ondelette bruités, (e), (f) estimation du signal par seuillage dur et coefficients d’ondelette seuillés des décompositions dans des bases d’ondelettes. Supposons que l’on dispose d’une image f de taille N × N. Le principice de la compression de signaux est de décomposer cette image dans une base orthonormée de fonctions gm (x), m = 0, . . . , N 2 −1 (qui ne sont pas nécessairement des ondelettes) : f (x) = 2 −1 N X m=0 fm gm (x), avec fm = hf, gm i Afin de pouvoir stocker la valeur des coefficients fm , il est nécessaire d’introduire une fontion de quantification notée Q qui a tout x ∈ R associe un élement Q(x) 69 dans un ensemble de cardinal fini X = {x1 , . . . , xK }. La reconstruction de l’image est alors définie par 2 −1 N X f˜(x) = Q(fm )gm (x) m=0 et l’erreur (ou taux de distorsion) qui est introduite par cette quantification est mesurée par 2 −1 N X (fm − Q(fm ))2 . d(f ) = m=0 Afin de déterminer une fonction Q qui soit bien adaptée aux données, on peut 2 utiliser la méthode suivante : soit R p(x) l’histogramme des N coefficients fm . Il s’agit d’une densité de probabilité ( p(x)dx = 1) qui permet de connaı̂tre la répartition des coeffcients fm . En particulier, R y on peut définir la proportion de coefficients dans l’intervalle [yk , yk+1[ par pk = ykk+1 p(x)dx, où [yk , yk+1[, k = 1, . . . , K correspond à une partition du support [a, b] de p(x). On définit alors le codage par 1 Q(x) = xk = (yk + yk+1) si x ∈ [yk , yk+1[. 2 Chaque quantité xk est ensuité codée par lk bits, et le nombre total R de bits nécessaires pour coder l’image est donné par R = N2 K X pk lk . k=1 Un codage de taille constante correspond à : lk = log2 (K) et dans ce cas R = N 2 log2 (K). Le nombre minimal de bits est minoré par l’entropie de Shanon qui correspond au choix lk = − log2 (pk ) : R ≥ −N 2 K X pk log2 (pk ). k=1 Le problème de la compression d’image est de déterminer une quantification optimale Q qui minimise l’erreur d(f ) lorque l’on se fixe un nombre de bits par pixels R̄ = R/N 2 . Le choix de Q dépend de la forme de l’histogramme p(x). Si p(x) est approximativement constant sur les intervalles [yk , yk+1 [, alors on peut montrer que le quantificateur optimal est donné par [yk , yk+1[= ∆ = b−a , k = 1, . . . , K : il s’agit K du quantificateur uniforme. Par contre si l’on choisit une base de fonctions gm (x) de sorte que de nombreux coefficients fm sont nuls (par exemple une base d’ondelettes), alors on ne peut plus considérer que p(x) est constant au voisinage de zéro, et le quantificateur uniforme n’est plus optimal, en particulier si R̄ est petit. Il faut donc distinguer les coefficients significatifs de ceux que l’on peut considérer comme négligeagles pour pouvoir obtenir une bonne compression. Soit λ un seuil bien choisi et M le nombre de coefficients 70 tels que |fm | > λ. Soit R0 le nombre de bits nécessaires pour coder la position de ces coefficients significatifs et R1 le nombre de bits nécessaires pour coder la valeur de ces coefficients. Le nombre total de bits pour coder l’image est alors donné par R = R0 + R1 . Le taux de distorsion est égal à X X d(f ) = |fm |2 + (fm − Q(fm ))2 |fm |<λ |fm |≥λ Il est alors possible de déterminer une quantification optimale en fonction de la décroissance en module des plus grands coefficients fm (voir [7] pour plus de détails). 4.4 Problèmes inverses Lorsqu’un signal ou une image n’est pas directement mesurable, il est courant de procéder à l’observation d’autres quantités qui sont reliées à la fonction que l’on voudrait estimer. Le principe d’un problème inverse est la recherche d’une méthode pour inverser le processus que l’on observe afin de retrouver le signal ou l’image d’intérêt. Il existe de nombreuses applications qui peuvent se modéliser comme un problème inverse : tomographie, déconvolution d’image, estimation de la dérivée d’une fonction... Formellement, un problème inverse peut se formuler à l’aide d’un opérateur K qui représente le processus que l’on voudrait inverser et où les données qu’on observe sont de la forme g = Kf + ǫ, où f est le signal ou l’image que l’on voudrait estimer et ǫ représente un bruit de mesure. Par exemple si l’on suppose que l’on se place dans un modèle de régression nonparamétrique, le problème de l’estimation de la dérivée d’une fonctionR peut s’écrire t sous la forme (dans ce cas, K est l’opérateur d’intégration : Kf (t) = 0 f (u)du) : gi = Z ti f (u)du + ǫi , i = 1, . . . , n. 0 Dans la plupart des applications, le problème est mal-posé dans le sens où il n’est pas possible d’estimer f en inversant directement l’opérateur K. En effet, l’opérateur inverse K −1 n’est en général pas borné ce qui entraı̂ne une amplification du bruit et implique que l’estimateur fˆ = K −1 ĝ n’est pas une bonne estimation de f . Lorque les fonctions que l’on souhaite estimer sont irrégulières (ce qui est le cas des images par exemple), les ondelettes sont un outil bien adapté pour estimer la fonction f . L’estimation est basée sur une décomposition temps-échelle des observations g, puis sur un seuillage bien adapté des coefficients et une méthode d’inversion à base d’ondelettes (qui prend en compte l’amplification du bruit par le processus d’inversion). Le lecteur intéressé pourra consulter [7], pour de plus amples détails. Bibliographie [1] Antoniadis, A. et Oppenheim, G. (Eds.) (1995) Wavelets and Statistics, Lect. Notes Statist., New York : Springer-Verlag. [2] Aldroudi, A. et Unser, M. (1996) Wavelets in Medecine and Biologoy, CRC Press. [3] Abry, P. (1997) Ondelettes et turbulences, Nouveaux essais, arts et sciences, Diderot. [4] Cohen, A. (2003) Numerical Analysis of Wavelet Methods, Studies in Mathematics and Its Applications, V. 32, Elsevier. [5] Daubechies, I. (1992) Ten lectures on Wavelets, SIAM, Philadelphia. [6] Gasquet, C. et Witomski, P. (2000) Analyse de Fourier et applications. Filtrage, calcul numérique et ondelettes, Dunod. [7] Mallat, S. (1998). A Wavelet Tour of Signal Processing, Academic Press. [8] Mallat, S. (2000). Une exploration des signaux en ondelettes, Les Editions de l’Ecole Polytechnique. [9] Torrésani, B. (1995). Analyse continue par ondelettes , Savoir actuels - Interéditions/CNRS éditions. 71