De la parcimonie à la synthèse à la parcimonie à la synthèse à la

Transcription

De la parcimonie à la synthèse à la parcimonie à la synthèse à la
Introduction
Minimisation `1
Minimisation `1 analyse.
Jauges
De la synthèse aux jauges en passant par
l’analyse.
Charles Dossal1
Samuel Vaiter2
Fadili3
1 IMB
Jalal
CNRS-Université Bordeaux
2 CEREMADE
3 GREYC
Gabriel Peyré2
CNRS-Université Paris Dauphine
CNRS-ENSICAEN-Université de Caen
23 Juin 2014, Séminaire Hermite, Journée Parcimonie
Introduction
Minimisation `1
Minimisation `1 analyse.
Plan
Motivation
Questions et notations.
Minimisation `1 (Synthèse)
Un problème de géométrie.
Certificat et précertificats duaux.
Conditions d’identifiabilité et de robustesse au bruit
Régularisation analyse.
Extension des résultats obtenus en synthèse.
Exemples
Extension aux jauges convexes.
Conclusion
Jauges
Introduction
Minimisation `1
Minimisation `1 analyse.
Jauges
Problème direct
Un modèle de mesures linéaires
On considère les modèles d’observation suivants :
y = Φx 0
(1)
y = Φx 0 + b
(2)
et
où x ∈ RN , y ∈ RQ est le vecteur observé, Φ est une matrice
Q × N non inversible ou mal conditionnée et b un vecteur de
R Q tel que kbk2 6 ε.
Questions
Estimer x 0 à partir de y , problème inverse mal posé.
Estimer le support I de x à partir de y .
Stabilité d’un estimateur par rapport au bruit.
Introduction
Minimisation `1
Minimisation `1 analyse.
Exemples
Inpainting, 93 % pixels manquants en TV
Jauges
Introduction
Minimisation `1
Minimisation `1 analyse.
Exemples
Inpainting, 93 % pixels manquants en TV
Jauges
Introduction
Minimisation `1
Minimisation `1 analyse.
Exemples
Inpainting en `1 synthèse ondelettes
50
100
150
200
250
300
350
400
450
500
50
100
150
200
250
300
350
400
450
500
Jauges
Introduction
Minimisation `1
Minimisation `1 analyse.
Exemples
Inpainting en `1 synthèse ondelettes
50
100
150
200
250
300
350
400
450
500
50
100
150
200
250
300
350
400
450
500
Jauges
Introduction
Minimisation `1
Minimisation `1 analyse.
Exemples
Déconvolution en `1 synthèse ondelettes
50
100
150
200
250
50
100
150
200
250
Jauges
Introduction
Minimisation `1
Minimisation `1 analyse.
Exemples
Déconvolution en `1 synthèse ondelettes
50
100
150
200
250
50
100
150
200
250
Jauges
Introduction
Minimisation `1
Minimisation `1 analyse.
Jauges
Régularisation convexe
Régularisation convexe
Soit J une fonction convexe sci définie sur RN
Si les données ne sont pas bruitées, on considère
x ? = arg min J(x) tel que y = Φx.
(3)
x∈RN
Si les données sont bruitées on peut considérer les 2 problèmes
suivants
x ? = arg min J(x) tel que
x∈RN
et
x ? = arg min λJ(x) +
x∈RN
ky − Φxk2 6 ε.
1
ky − Φxk22 .
2
(4)
(5)
Introduction
Minimisation `1
Minimisation `1 analyse.
Identifiabilité et robustesse
Identifiabilité
A quelle condition x 0 est il solution de (3) ?
A quelle condition x 0 est il l’unique solution de (3) ?
Robustesse dans le cas bruité
Peut on contrôler x 0 − x ? ?
Support de x ? (si cette notion a un sens) ?
Jauges
Introduction
Minimisation `1
Minimisation `1 analyse.
Jauges
Régularisation `1
La minimisation `1
Si les données ne sont pas bruitées, on considère
x ? = arg min kxk1 tel que y = Φx.
(6)
x∈RN
Si les données sont bruitées on considère la forme relaxée :
x ? = arg min λ kxk1 +
x∈RN
1
ky − Φxk22 .
2
(7)
Par un changement de variable simple, cette formulation est
équivalente quand T est une transformée inversible à
x ? = arg min kTxk1 tel que y = Ψx.
x∈RN
On pose en effet z = Tx et y = ΨT −1 z.
Introduction
Minimisation `1
Minimisation `1 analyse.
Notations
Notations et définition
Le support I d’un vecteur x est défini par
I = {i tels que x(i) 6= 0},
Le signe d’un vecteur est défini par
sign(x)(i) = 1 si x(i) > 0
sign(x)(i) = −1 si x(i) < 0
sign(x)(i) = 0 si x(i) = 0
La restriction d’un vecteur x à son support xI , c’est un
vecteur de taille cardinal de I (|I |).
ΦI désigne la matrice extraite de Φ composée des colonnes de
t
−1 t
Φ indicées sur I et Φ+
I = (ΦI ΦI ) ΦI sa pseudoinverse.
On dira qu’un vecteur x 0 est identifiable s’il est solution de
(6) avec y = Φx 0 .
Jauges
Introduction
Minimisation `1
Minimisation `1 analyse.
Sous différentielle ou sous gradient
définition de la sous différentielle
Si f est une fonction convexe sci, en tout point x on définit la sous
différentielle de f en x
∂f (x) = {u ∈ RN tels que ∀z ∈ RN , f (z) > f (x) + hu, z − xi}.
Propriétés
La sous différentielle peut être multivaluée.
Chaque élément de ∂f (x) correspond à un hyperplan tangent
à f au point x.
Si f est différentiable alors ∂f (x) = {∇f (x)}.
x ? est un minimiseur de f ssi 0 ∈ ∂f (x ? ).
∂ k·k1 (x) = {u tels que kuk∞ 6 1 et uI = sign (xI )}
Jauges
Introduction
Minimisation `1
Minimisation `1 analyse.
Minimisation `1 et géométrie des polytopes
Géométrie
x 0 est identifiable ssi Φx 0 ∈ ∂Φ(B`1 (x 0 1 )).
x 0 est identifiable ssi l’image de la face associé à x 0 est une
face extérieure du polytope P = Φ(B`1 ).
L’identifiabilité de x 0 ne dépend que du signe de x 0 et de son
support.
x1 = ( 13 , 0, 23 ), Φx1 ∈
/ ∂P.
x1 n’est pas identifiable
x2 = ( 35 , 0, − 25 ), Φx2 ∈ ∂P.
x2 est identifiable.
Jauges
Introduction
Minimisation `1
Minimisation `1 analyse.
Certificats duaux
Définition
Un vecteur η ∈ Rn est un certificat dual associé à x 0 ssi
ΦtI η = sign xI0 et kΦt ηk∞ 6 1 (i.e Φt η ∈ ∂ k·k1 (x 0 )).
Théorèmes
x 0 est identifiable ssi il existe un certificat dual η associé à x 0 .
Si rang (ΦI ) = |I | et si kΦtI c ηk∞ < 1 alors x 0 est l’unique
minimiseur de (6).
Dualité de Fenchel : deux problèmes liés
min kxk1 sous la contrainte Φx = y
x∈RN
minn hη, y i sous la contrainte Φt η ∞ 6 1
η∈R
Jauges
Introduction
Minimisation `1
Minimisation `1 analyse.
Certificat dual et géométrie
Hyperplans tangents
A un certificat dual est associé un hyperplan tangent au
polytope P.
Un certificat peut ne pas être unique.
η0 et η1 sont deux certificats
duaux associés à
x3 = (−1, 0, 0). Ils
définissent chacun une droite
tangente au polytope P au
point Φx3
Jauges
Introduction
Minimisation `1
Minimisation `1 analyse.
Comment trouver un Certificat dual ?
Définition de précertificat
0
Un vecteur η est
un précertificat au point x de support I ssi
t
0
ΦI η = sign xI .
Exemples et propriétés
Si rang (ΦI ) = |I | alors η0 = Φ+t
sign xI0 est un précertificat.
I
0 Si IC (x 0 ) = ΦtI c Φ+t
< 1 alors η0 est un
I sign xI
∞
0
certificat dual et x est l’unique solution de (6) (Fuchs)
t +t Si ERC (I ) = maxj ∈I
/ ϕj ΦI < 1 alors tout vecteur x de
1
support inclus dans I est identifiable, (voir Tropp).
D’autres constructions explicites (Super-résolution voir Candès
et Granada ou Duval et Peyré).
Construction itérative (matrices aléatoires, Candès et Tao,
matrices déterministes Nicodème, D. et Turcu).
Jauges
Introduction
Minimisation `1
Minimisation `1 analyse.
Robustesse au Bruit
Critère IC
Si IC (x 0 ) < 1 alors si b est suffisamment petit, le support et
le signe de x ? sont égaux à ceux de x 0 pour λ 6 λ0
De plus on a une formulation explicite de la solution :
xI? = xI0 − λ(ΦtI ΦI )−1 sign xI0 + Φ+
I b.
Robustesse à un bruit quelconque (Grasmair)
Si λ = C ε, la solution x ? de (7), et η est un certificat dual
associé à x 0 alors
?
x − x 0 6 cI (1+C kηk )+
2
2
où cI = Φ−1
I
(1 + C kηk2 /2)2
1 + cI kΦk
1 − maxj ∈I
C
/ |hϕj , ηi|
(8)
Jauges
Introduction
Minimisation `1
Minimisation `1 analyse.
Au delà de la synthèse
Certificats pour des fonctionnelles J
Un vecteur η est un certificat associé à x 0 pour la
fonctionnelle J ssi Φt η ∈ ∂J(x 0 ).
L’existence d’un certificat assure l’identifiabilité pour une
fonctionnelle J, c’est une CNS d’identitifiabilité
Construction d’un certificat plus complexe.
Critères d’identifiabilité moins facilement calculable.
Jauges
Introduction
Minimisation `1
Minimisation `1 analyse.
Jauges
Régularisation analyse
Régularisation analyse
Considérons les problèmes suivants :
xs = arg min D t x 1 tel que y = Φx.
(9)
x∈RN
1
xs = arg min λ D t x 1 + ky − Φxk22 .
2
x∈RN
(10)
où D est un opérateur linéaire quelconque (Frame
d’ondelettes, Gradient discret).
Soit x 0 un vecteur de RN , I = {i tels que hdi , xi =
6 0} son
c
D-support et I sont co-support.
Soit G = Ker (DItc ) et U une base orthonormée de G . On note
A = U(U t Φt ΦU)−1 U t et Ω = DI+c (Φt ΦA − Id)DI .
IC (s) = minu∈Ker (DI c ) kΩsI − uk∞ .
Introduction
Minimisation `1
Minimisation `1 analyse.
Jauges
Théorème d’identifiablité Analyse
Théorème
Si IC (sign D t x 0 ) < 1, si kbk2 est suffisamment petit, et si
λ ∼ kbk2 alors
x ? (y , λ) = x 0 − λADI sI + AΦt b
(11)
est l’unique solution de (10).
t ?
De plus x ? (y , λ) ∈ G et sign Dt x 0 = sign
(D x (y , λ)).
0
?
Si kbk2 est suffisamment petit x − x = 0(kbk2 ).
Remarques sur IC
La condition IC est une condition suffisante d’identifiabilité.
C’est une CNS de stabilité locale du support.
Le calcul de IC (s) peut nécessiter la résolution d’un problème
d’optimisation (algo Primal Dual).
Introduction
Minimisation `1
Minimisation `1 analyse.
Jauges
Extension du critère ERC de Tropp
Définition de RC (Analyse Recovery Criterion)
Soit I un support, on définit
RC (I ) = max IC (pI )
kpI k∞
(12)
Théorème
cI
Si RC (I ) < 1 pour I = Supp(D t x 0 ) et si λ = ρ kbk2 1−RC
(I ) avec
ρ > 1, alors (10) a une unique solution x ? (y , λ) dont le support
supp(D t x ? (y , λ)) ⊂ I et
kx ? (y , λ)k2 6 CI kbk2 , où
cI = DI c Φt (ΦAΦt − Id)2,∞ ,
ρcI
CI = kAk2,2 kΦk2,2 +
kDI k2,∞
1 − RC (I )
(13)
Introduction
Minimisation `1
Minimisation `1 analyse.
Debruitage TV
Débruitage par Variation Totale
t x) = (x − x
Φ = Id, (D t x)i = (DDIF
i
i
i−1 ).
+
t
0
s = sign D x , σ = ΩsI = DI c DI sI et IC (s) = kσk∞ .
Dessin du dessus vecteur
x 0.
2
1.5
En rouge le vecteur sI .
1
0.5
1
2
3
4
5
6
7
En bleu le vecteur σ.
1
IC (s) = kσk∞ < 1, le
vecteur est identifiable.
0.5
0
−0.5
−1
1
2
3
4
5
6
7
Stabilité du support à
petit bruit.
Jauges
Introduction
Minimisation `1
Minimisation `1 analyse.
Debruitage TV
Débruitage par Variation Totale
t x) = (x − x
Φ = Id, (D t x)i = (DDIF
i
i
i−1 ).
+
t
0
s = sign D x , σ = ΩsI = DI c DI sI et IC (s) = kσk∞ .
Dessin du dessus vecteur
x 0.
2
1.5
En rouge le vecteur sI .
1
0.5
1
2
3
4
5
6
7
En bleu le vecteur σ.
1
IC (s) = kσk∞ = 1, le
vecteur est identifiable.
0.5
0
−0.5
−1
1
2
3
4
5
6
7
Mais pas de stabilité du
support à petit bruit.
Jauges
Introduction
Minimisation `1
CS-Fused Lasso
CS-Fused Lasso
Φij ∼ i.i.dN (0, 1/Q).
D = [DDIF ηId ]
s = sign D t x 0 .
Minimisation `1 analyse.
Jauges
Introduction
Minimisation `1
Minimisation `1 analyse.
Jauges
Valeur de IC
1
1
0.5
IC
0
0.8
−0.5
−1
0.9
20
40
60
80
100
120
0.5
0.6
0.7
0.8
0.9
1
0.8
0.9
1
0.8
0.9
1
Q/N
1
1.4
0.5
IC
0
−0.5
−1
1.2
1
20
40
60
80
100
120
0.5
0.6
0.7
Q/N
1
2
0.5
IC
0
1.5
−0.5
−1
20
40
60
80
100
120
1
0.5
0.6
0.7
Q/N
Introduction
Minimisation `1
Minimisation `1 analyse.
Quid des autres régularisations
Certificat duaux
η est un certificat dual associé à x 0 ssi Φt η ∈ ∂J(x 0 ).
Intérêt d’une strucute de ∂J particulière.
La sous diffrentielle d’une jauge (forte) a une structure qui
permet d’étendre les résultats précédents.
Jauges
Introduction
Minimisation `1
Minimisation `1 analyse.
Jauges
Définition et propriétés
Si C est un convexe contenant l’origine, sa jauge est définie
par
γC (x) = inf{λ > 0 tels que x ∈ λC }.
γC (x) = +∞ si l’ensemble est vide.
La sous différentielle de la jauge est :
∂γC (x) = {p ∈ RN | p ∈ C 0 et hp, xi = γC (x)}.
où C 0 est le polaire de C .
C 0 = {z ∈ R N tels que ∀x ∈ C , hx, zi 6 1}.
Jauges
Introduction
Minimisation `1
Minimisation `1 analyse.
Généralisation à une jauge
Jauge
On note S¯x = aff ∂J(x),
ex = arg mine∈S¯x kek et Sx = S¯x − ex et Tx = Sx⊥ .
ex correspond au vecteur signe.
Tx appelé espace modèle tangent correspond à l’espace
vectoriel engendré par les colonnes de ΦI .
Si fx appartient à l’intérieur relatif de ∂J(x) alors
∂J(x) = {p ∈ RN |pTx = ex et Jfx,0
(PSx (p − fx )) 6 1}. (14)
x
où Jfx,0
est la jauge polaire de J translatée de fx .
x
x ? est un minimiseur de (3) ssi il existe un vecteur η tel que
ΦtT η = ex et Jfx,0
(ΦtS η − PS (fx )) 6 1.
x
Jauges
Introduction
Minimisation `1
Minimisation `1 analyse.
Jauges
Extension de la définition de IC
IC pour des jauges
Si J est une jauge alors on peut définir l’Identifialibility Criterion IC
(ΦtSx Φ+,t
IC (x) = Jfx,0
Tx ex − PSx (fx)).
x
qui ne dépend pas du choix de fx .
(15)
Introduction
Minimisation `1
Minimisation `1 analyse.
The end
Merci
Jauges