Optimisation numérique

Transcription

Optimisation numérique
Optimisation numérique
La méthode d’Uzawa
Daniele Di Pietro
A.A. 2013–2014
Outline
1 Rappels
2 La méthode d’Uzawa
3 Dualité et interprétation de la méthode d’Uzawa
Rappel : Projection sur un convexe I
Soit V un EHR et K ⊂ V un convexe fermé
Soit v ∈ K. Le problème de projection sur K est défini par
kΠK v − vkV = min kw − vkV
w∈K
La solution du problème de projection est caractérisée par
(ΠK v − v, w − ΠK v)V ≥ 0
∀w ∈ K.
(car. ΠK )
Cette inégalité a été prouvée en TD
Rappel : Projection sur un convexe II
En général, la projection ΠK v n’est pas connue explicitement
Une exception remarquable est le cas où K est un pavé,
K=
N
Y
[ai , bi ],
ai , bi ∈ R ∀1 ≤ i ≤ N
i=1
Soit x ∈ RN . On a montré en TD que
(ΠK (x))i = max(ai , min(xi , bi )),
à savoir, il suffit de “tronquer” le composantes de x pour obtenir sa
projection sur le pavé
Rappel : Somme de deux fonctions dont une seule dérivable
Lemme (Inéquations d’Euler pour la somme de deux fonctions dont une
seule dérivable)
Soit V un EHR et K ⊂ V convexe, J1 et J2 deux fonctions convexes
continues sur K. On suppose que J1 seulement est dérivable. Alors,
u ∈ K est un minimum de J1 + J2 sur K ssi
hJ10 (u), v − uiV 0 ,V + J2 (v) − J2 (u) ≥ 0
∀v ∈ K.
Outline
1 Rappels
2 La méthode d’Uzawa
3 Dualité et interprétation de la méthode d’Uzawa
(Euler J1 + J2 )
La Méthode d’Uzawa I
Soit V un EHR, J : V → R une fonctionnelle convexe et
F : V → RM une fonction convexe
On considère le problème de minimisation sous contrainte
(Π)
inf J(v)
F (v)≤0
Sous les hypothèses du Théorème Kuhn–Tucker résoudre (Π) revient
à trouver un point selle (PS) (u, p) du Lagrangien
L(v, q) := J(v) + q·F (v)
dans V × Q avec Q := RM
+
La Méthode d’Uzawa II
Par définition de PS on a
∀q ∈ Q
L(u, q) ≤ L(u, p) ≤ L(v, p)
∀v ∈ V
En utilisant la première inégalité on obtient pour tout q ∈ Q
+ q·F (u) ≤ J(u)
J(u)
+ p·F (u)
⇐⇒ (p − q)·F (u) ≥ 0
⇐⇒ (p − q)·(µF (u)) ≥ 0 ∀µ > 0
⇐⇒ (p − q)·((p + µF (u)) − p) ≥ 0 ∀µ > 0
Ceci implique
p = ΠQ (p + µF (u))
∀µ > 0
(car. p)
La Méthode d’Uzawa III
La Méthode d’Uzawa consiste
fixer p0 ∈ Q et µ > 0 paramètre utilisateur
pour tout n ≥ 0, poser
L(un , pn ) = inf L(v, pn ),
v∈V
pn+1 = ΠQ (pn + µF (un )),
(U1)
(U2)
Cela revient à resoudre deux problèmes de minimisation sans
contrainte dont un est une projection sur le pavé Q = RM
+
La Méthode d’Uzawa IV
Lemme (Convergence de la méthode d’Uzawa)
Soit J fortement convexe de paramètre α et différentiable, F : V → RM
convexe et Lipschitzienne, à savoir,
∃C ∈ R, ∀v, w ∈ V
kF (v) − F (w)k2 ≤ Ckv − wkV .
On suppose de plus que L admet un PS sur V × Q. Alors,
0<µ<
2α
=⇒ un → u lorsque n → +∞
C2
La Méthode d’Uzawa V
On commence par remarquer que
L admet un PS =⇒ (Π) admet une solution
J fort. convexe =⇒ la sol. de (Π) est unique
Soit q ∈ Q fixé et G := J + q·F . On peut montrer que G est
fortement convexe de paramètre α (exercice) et on a
G fort. convexe, K convexe =⇒ (U1) admet une unique sol
On a prouvé en TD que (U2) admet une solution unique
La Méthode d’Uzawa VI
D’après (car. p) et (U2), en posant rn := pn − p on a
rn+1 = ΠQ (pn − p + µ(F (un ) − F (u)))
= ΠQ (rn + µ(F (un ) − F (u)))
Comme ΠQ est faiblement contractant on a
krn+1 k2 ≤ krn + µ(F (un ) − F (u))k2
En élevant au carré et en développant on obtient
krn+1 k22 = krn k22 + 2µrn ·(F (un ) − F (u)) + µ2 kF (un ) − F (u)k22
Comme F est Lipschitzienne, kF (un ) − F (u)k22 ≤ C 2 kun − uk2V
Il ne reste qu’à estimer le seconde terme
La Méthode d’Uzawa VII
D’après les inégalités d’Euler enoncées en debut de séance,
hJ 0 (u), v − uiV 0 ,V + p· (F (v) − F (u)) ≥ 0
∀v ∈ V
hJ 0 (un ), w − un iV 0 ,V + pn · (F (w) − F (un )) ≥ 0
∀w ∈ V
En prenant v = un , w = u et additionnant on obtient
hJ 0 (u) − J 0 (un ), un − uiV 0 ,V + (p − pn )· (F (un ) − F (u)) ≥ 0
Comme J est fortement convexe de paramètre α,
hJ 0 (u) − J 0 (un ), un − uiV 0 ,V ≤ −αkun − uk2V
Comme, par définition, rn := pn − p, on a donc
rn · (F (un ) − F (u)) ≤ −αkun − uk2V
La Méthode d’Uzawa VIII
Nous avons donc
krn+1 k22 ≤ krn k22 + µ2 C 2 − 2µα kun − uk2V
Si 0 < µ < 2α/C 2 , on peut trouver β > 0 t.q. C 2 µ2 − 2µα < −β,
0 ≤ βkun − uk2V ≤ krn k22 − krn+1 k22
Ceci montre que la suite (krn k22 )n∈N est décroissante et le seconde
membre tend vers 0
Par conséquent,
kun − ukV → 0 lorsque n → +∞
La Méthode d’Uzawa IX
Une remarque importante est que ce théorème ne dit rien de la
convergence de (pn )n∈N
En effet, sous ces hypothèses, l’unicité de p ∈ Q t.q. (u, p) soit PS
de L n’est même pas assurée
L’algorithme d’Uzawa peut s’appliquer aussi à des sous-ensembles K
de forme plus générale
Outline
1 Rappels
2 La méthode d’Uzawa
3 Dualité et interprétation de la méthode d’Uzawa
Dualité I
Une interpretation intéressante de la méthode d’Uzawa s’obtient en
utilisant la dualité
Soit V et Q deux EHR, L un Lagrangien défini sur une partie U × P
de V × Q
On suppose qu’il existe un PS de L sur U × P ,
∀q ∈ P
L(u, q) ≤ L(u, p) ≤ L(v, p) ∀v ∈ U
Pour v ∈ U et q ∈ P on pose
I(v) := sup L(v, r)
G(q) := inf L(w, q)
r∈P
w∈U
Dualité II
Définition (Problème primal et problème dual)
On appelle problème primal le problème de minimisation
inf I(v),
v∈U
et problème dual le problème de maximisation
sup G(q).
q∈P
Dualité III
Comme on a suppose qu’il existe un PS (u, p) de L sur U × P ,
I(u) = G(p) = L(u, p)
Ceci montre que les ensembles
{v ∈ U | I(v) < +∞},
{q ∈ P | G(q) > −∞},
ne sont pas vides car
I(u) = G(p) = L(u, p)
Dualité IV
Théorème (De dualité)
Le couple (u, p) est PS de L sur U × P ssi
I(u) = min I(v) = max G(q) = G(p),
v∈U
q∈P
(min-max)
à savoir, on peut échanger l’ordre du max et du min s’ils sont atteints.
Dualité V
(u, p) PS de L sur U × P =⇒ (min-max)
Pour tout v ∈ U , I(v) = supq∈P L(v, q) et L(u, p) ≤ L(v, p), donc
I(v) ≥ L(v, p) ≥ L(u, p) := L∗
D’autre part, comme (u, p) est PS, I(u) = L∗ , ce qui montre
I(u) = inf I(v) = L∗
v∈U
(l’infimum est atteint)
On montre de la même façon que le supremum est atteint
G(p) = sup G(q) = L∗
q∈P
Dualité VI
(min-max) =⇒ (u, p) PS de L sur U × P
Soit maintenant L∗ := I(u) = G(p)
Par définition,
I(v) = sup L(v, q)
=⇒ (L(u, q) ≤ I(u) = L∗
∀q ∈ P )
=⇒ (L(v, p) ≥ G(p) = L∗
∀v ∈ U )
q∈P
G(q) = inf L(v, q)
v∈U
En appliquant la définition de PS on conclut que (u, p) est PS de L
sur U × P
Interprétation de la méthode d’Uzawa I
Le problème dual de
inf J(v)
F (v)≤0
s’écrit pour Q := RM
+
sup G(q) := inf L(v, q)
q∈Q
v∈V
(Π0 )
Le multiplicateur de Lagrange p est une solution du problème dual
Interprétation de la méthode d’Uzawa II
On peut montrer sous des hypothèses très générales que
G 0 (q) = F (uq ),
avec uq solution de (Π0 )
En remplaçant cette expression dans (U2) on conclut
pn+1 = ΠQ (pn + µG 0 (pn )),
ce qui montre que la méthode d’Uzawa n’est rien d’autre que la
méthode du gradient avec projection pour le problème dual
A noter que cette fois-ci on a à faire à un problème de maximisation,
d’où le changement de signe