Un document sur l`optimisation des fonctions convexes.
Transcription
Un document sur l`optimisation des fonctions convexes.
8 Chapitre 4 Chapitre 4 Optimisation des fonctions convexes D6: Un sous-ensemble C de IRn est dit convexe si, pour tout (a, b) ∈ C 2 , [a, b] ⊂ C (c’est-à-dire pour tout λ ∈ [0, 1], λa + (1 − λ)b ∈ C). D7 : Une fonction réelle f définie sur C convexe est dite convexe si, pour tout (a, b) ∈ C 2 et pour tout λ ∈ [0, 1], f (λa + (1 − λ)b) ≤ λf (a) + (1 − λ)f (b). Propriétés : 1) Si C est un convexe de IRn et (fi )i∈I , une famille quelconque de fonctions convexes alors a) sup fi est convexe ; i∈I b) si I est fini et si (λi )i∈I est une famille de réels positifs, alors P λi fi est convexe. i∈I 2) Si C est un convexe de IRn , si f est une fonction convexe de C sur IR et si ϕ est une fonction convexe croissante sur IR, alors ϕ ◦ f est une fonction convexe. Preuve des propriétés : 1)a) fi (λa + (1 − λ)b) ≤ λfi (a) + (1 − λ)fi (b) ≤ λ(sup fi )(a) + (1 − λ)(sup fi )(b). Ceci est vérifié pour tout i ∈ I donc (sup fi )(λa + (1 − λ)b) ≤ λ(sup fi )(a) + (1 − λ)(sup fi )(b). 1)b) λi ≥ 0 donc λi fi (λa + (1 − λ)b) ≤ λi λfi (a) + λi (1 − λ)fi (b). En faisant la somme, on a: X ( i λi fi )(λa + (1 − λ)b) ≤ λ( X i λi fi )(a) + (1 − λ)( X λi fi )(b). i 2) f (λa + (1 − λ)b) ≤ λf (a) + (1 − λ)f (b) et, en utilisant la croissance, puis la convexité de ϕ, on a : ϕ (f (λa + (1 − λ)b)) ≤ ϕ (λf (a) + (1 − λ)f (b)) ≤ λϕ(f (a)) + (1 − λ)ϕ(f (b)). 2 Optimisation des fonctions convexes 9 Caractérisation des fonctions convexes différentiables TH5 : Soit Ω un ouvert convexe de IRn et f une fonction de Ω sur IR. 1) Si f est différentiable sur Ω, alors f est convexe si et seulement si, pour tout (x, y) ∈ Ω2 , f (y) − f (x) ≥ h∇f (x), y − xi. 2) Si f est de classe C 2 sur Ω, alors f est convexe sur Ω si et seulement si, pour tout x ∈ Ω, la matrice ∇2 f (x) est positive. Preuve du TH5 : 1) Si f est convexe, pour θ ∈]0, 1[, on a : f (x + θ(y − x)) = f ((1 − θ)x + θy) ≤ (1 − θ)f (x) + θf (y) d’où f (x + θ(y − x)) − f (x) ≤ θ(f (y) − f (x)). Or f (x + θ(y − x)) = f (x) + θdx f (y − x) + θky − xkε(θ(y − x)). En simplifiant par θ > 0, on obtient : dx f (y − x) + ky − xkε(θ(y − x)) ≤ f (y) − f (x) et en faisant tendre θ vers 0, on a alors : dx f (y − x) ≤ f (y) − f (x). Réciproquement, si f (b) ≥ f (a) + da f (b − a) pour tout (a, b) ∈ Ω2 , alors, avec b = y et a = x + θ(y − x), puis avec b = x et a = x + θ(y − x), f (y) ≥ f (x + θ(y − x)) + dx+θ(y−x) f (y − x) × (1 − θ) f (x) ≥ f (x + θ(y − x)) + dx+θ(y−x) f (y − x) × (−θ). On multiplie la première inégalité par θ, la deuxième par (1 − θ) et on fait la somme : θf (y) + (1 − θ)f (x) ≥ (θ + 1 − θ)f (x + θ(y − x)) soit f ((1 − θ)x + θy) ≤ (1 − θ)f (x) + θf (y). 2) On applique la formule de Taylor-Mac-Laurin à l’ordre 2 en x : il existe θ ∈]0, 1[ tel que : 1 f (y) = f (x) + dx f (y − x) + d2x+θ(y−x) f (y − x, y − x). 2 Or d2x+θ(y−x) f (y − x, y − x) ≥ 0 donc f (y) ≥ f (x) + dx f (y − x) et f est convexe. Réciproquement, si f est convexe, alors, pour tout h ∈ IRn et pour tout t tel que x + th ∈ Ω, f (x + th) ≥ f (x) + dx f (th). 10 Chapitre 4 Or f (x + th) = f (x) + dx f (th) + 12 t2 d2x f (h, h) + t2 khk2 ε(th). D’où : d2x f (h, h) + 2khk2 ε(th) ≥ 0 et en faisant t → 0, on obtient finalement d2x f (h, h) ≥ 0. 2 Minimum global d’une fonction convexe. TH6 : Soit C un convexe de IRn , f une fonction convexe de C sur IR et a ∈ C, alors 1) un minimum local est un minimum global ; 2) si f est de classe C 1 sur C et si C est ouvert, alors a ∈ ArgC min f si et seulement si ∇f (a) = 0. Preuve du TH6 : 1)f (x + θ(y − x)) ≤ (1 − θ)f (x) + θf (y) donc f (x + θ(y − x)) − f (x) ≤ θ(f (y) − f (x)). Si x est un minimum local, alors, pour θ assez petit, on a f (x + θ(y − x)) − f (x) ≥ 0. Donc f (y) − f (x) ≥ 0 et ceci pour y quelconque. Donc x est un minimum global. 2) Si a ∈ ArgC min f , alors f (y) ≥ f (a) pour tout y ∈ C. Or C est ouvert, donc a est aussi minimum local et ∇f (a) = 0. Réciproquement, si ∇f (a) = 0, i.e. da f = 0, comme f (y) ≥ f (a) + da f (y − a) pour tout y ∈ C, on a donc, pour tout y ∈ C, f (y) ≥ f (a) et a est un minimum global de f sur C. 2 Exercices 1 8. Soit a ∈ IRn tel que kak < 1 et soit f : IRn → IR, x 7→ (1 + kxk2 ) 2 − ha, xi. Montrer que f est convexe et déterminer ArgIRn min f . 9. Soit ϕ : Ω ⊂ IRn → IR. Pour tout y ∈ IRn , on pose ϕ∗ (y) = sup(hy, xi − ϕ(x)). x∈Ω a) Montrer que ϕ∗ est convexe. p . Montrer que ϕ est convexe ; déterminer ϕ∗ (y) b) Soit p ∈]1, +∞[ et ϕ(x) = kxk p et montrer que ϕ∗∗ = ϕ. (On utilisera q tel que p1 + 1q = 1). c) Soit ϕ(x) = 12 hAx, xi + hb, xi + c où A est une matrice symétrique définie positive. Montrer que ϕ est convexe ; déterminer ϕ∗ (y) et montrer que ϕ∗∗ = ϕ. Optimisation des fonctions convexes 11 10. Soit C ⊂ IRn un convexe fermé non vide et b ∈ IRn . Soit π = ArgC min N où N (x) = kx − bk2 . a) Montrer que : i) π est non vide ; ii) si p ∈ π, pour tout c ∈ C, hp − b, p − ci ≤ 0. (On utilisera F (λ) = kλc + (1 − λ)p − bk2 ). iii) π contient exactement 1 élément, noté p(b). iv) Si hu − b, u − ci ≤ 0 pour tout c ∈ C, alors u = p(b). b) Déduire de a) que, b ∈ / C si et seulement si il existe w ∈ IRn tel que hw, bi < inf hw, ci. c∈C