1 Calcul de dérivées et mise sous forme exploitable

Transcription

1 Calcul de dérivées et mise sous forme exploitable
Faculté des Sciences de TOURS
Préparation à l’Agrégation
ANALYSE
Mini-cours de calcul différentiel par l’exercice
1
Calcul de dérivées et mise sous forme exploitable
Le problème du calcul différentiel c’est moins de savoir si une fonction est différentiable
(ou dérivable) – car il existe des théorèmes simples pour vérifier cette propriété – que de
savoir calculer la dérivée et surtout d’être capable de la mettre sous une forme exploitable.
Car calculer une dérivée n’est pas un but en soi, ce n’est qu’une étape qui peut être suivie
d’une (ou de plusieurs) autre(s) où la manipulation de la dérivée sera nécessaire. Il est
donc important de maîtriser le sens de la dérivée [ici la difficulté est algébrique] voire de
décider sous quelle forme on l’appréhende.
La première définition de la dérivabilité d’une fonction f : O → Rp , où O est un
ouvert de Rn , en un point x0 ∈ O est la suivante :
“f est dérivable en O s’il existe une application linéaire L : Rn → Rp telle que :
f (x0 + h) = f (x0 ) + L(h) + o(h) ,
où, si | · | désigne une norme sur Rn , o(h) est une quantité telle que o(h)/|h| → 0 quand
h → 0.
Outre le côté un peu austère de cette définition, plusieurs remarques en découle :
— Cette définition est un développement limité de f au voisinage de x0 . Alors pourquoi ne pas calculer L de cette manière quand cela s’y prête ?
— Le fait que L soit une application linéaire suggère que l’on peut soit utiliser L
tel quel (approche “intrinsèque” où l’on ne choisit pas de bases), soit choisir des
bases de Rn et Rp [en général les bases canoniques de ces espaces] et considérer
la matrice de L dans ces bases (en toute rigueur, il faut alors remplacer x, h par
X, H les matrices colonnes de leurs coordonnées). Une dernière possibilité, dans le
cas où p = 1 est d’utiliser le “théorème de représentation” qui nous dit qu’il existe
a ∈ Rn tel que L(h) = ha, hi si h·, ·i est un produit scalaire sur Rn .
Ces deux remarques conduisent aux deux méthodes directes de calcul de la différentielles : soit via un développement limité que le lecteur pourra tester sur les exemples :
(i) x ∈ RN 7→ 21 hAx, xi − hb, xi où A est une matrice N × N et b ∈ RN ,
(ii) M ∈ GLN (R) 7→ M −1 ,
Pour l’exercice (i), il est important de bien déterminer l’application linéaire L notée f 0 (x0 )
dans la suite, la matrice jacobienne Df (x0 ) et le gradient ∇f (x0 ), c’est-à-dire le vecteur
a ci-dessus et de bien sentir la différence entre ces objets.
Le calcul des dérivées partielles, donc de la matrice de l’application linéaire L (dite
matrice jacobienne), est plus classique et nous ne proposons pas d’exemple d’exercice sauf
dans le cadre de la troisième méthode, qui est l’utilisation du théorème de composition
que l’on pourra tester sur les exemples :
(iii) x ∈ R 7→
classe C 1 .
R h2 (x)
h1 (x)
f (x, t)dt si h1 , h2 : R → R et f : R2 → R sont des fonctions de
(iv) Si f : R2 → R est une fonction dérivable, calculer les dérivées partielles de
l’application g : R2 → R définie par :
g(r, θ) = f (r cos(θ), r sin(θ)) .
On pourra soit calculer directement les dérivées partielles soit repasser par les matrices
jacobiennes.
Il est à noter que, pour la dérivée seconde, on peut procéder de même, en privilégiant
quand c’est possible l’utilisation des dérivées partielles. Ce qui n’exclut pas de mettre la
matrice (symétrique) :
!
∂ 2f
2
,
D f (x) :=
∂xi ∂xj i,j
sous une forme utilisable. Exemple d’utilisation :
(v) Soit f : R → R une fonction de classe C 2 , croissante et convexe. On note ||x||2 =
2
n
i=1 xi . Montrer que la fonction g : R → R définie par :
Pn
g(x) = f (||x||2 ) ,
est convexe, i.e. hD2 g(x)h, hi ≥ 0 pour tout x, h ∈ Rn .
Il est néanmoins des exemples où le dévellopement limité semble nécessaire :
(vi) Si S + est l’ouvert convexe 1 des matrices n × n symétriques définies positives,
prouver que l’application ψde S + × Rn dans R définie par :
ψ(M, p) = hM −1 p, pi
est convexe.
2
Le théorème des Accroissements Finis (TAF)
La première difficulté du TAF est de bien comprendre ce qu’est une norme d’application linéaire. Une première étape (simple) est de remarquer que si L : Rn → Rp est une
application linéaire et si | · |, || · ||, sont des normes sur Rn et Rp respectivement alors il
existe une constante C telle que :
||L(x)|| ≤ C|x| pour tout x ∈ Rn .
1. on pourra démontrer cette affirmation
La preuve de cette inégalité est simple en écrivant x = x1 e1 + x2 e2 + · · · + xn en où les
ei sont les vecteurs de la base canonique de Rn et les xi sont les coordonnées de x dans
cette base. Alors, grâce à la linéarité de L et l’inégalité triangulaire :
||L(x)|| = ||x1 L(e1 ) + x2 L(e2 ) + · · · + xn L(en )||
≤ |x1 |.||L(e1 )|| + |x2 |.||L(e2 )|| + · · · + |xn |.||L(en )||
≤ ||x||∞ (||L(e1 )|| + ||L(e2 )|| + · · · + ||L(en )||)
puisque ||x||∞ = maxi (|xi |). Donc quand | · | est la norme infinie, l’inégalité est réalisée
pour C = ||L(e1 )|| + ||L(e2 )|| + · · · + ||L(en )||. Dans les autres cas, on utilise l’équivalence
des normes.
On peut alors introduire :
|||L||| := sup
x6=0
||L(x)||
,
|x|
qui est une norme d’application linéaire (exo ?). Il est à noter que, dans l’utilisation du
TAF, et même si l’énoncé fait souvent référence à cette norme ||| · |||, on n’a besoin dans
99% des cas que de l’inégalité obtenue ci-dessus (de manière assez simple ?) sans avoir à
manipuler (et surtout sans avoir à calculer des normes ||| · |||). Mais nous introduisons
cette notion pour nous simplifier la vie ( !) puisque nous nous restreindrons ici au cas des
fonctions de classe C 1 , i.e. des fonctions dérivables sur O telles que x 7→ f 0 (x) est continu,
ce qui signifie que :
|||f 0 (x) − f 0 (x0 )||| → 0 quand x → x0 ,
pour tout x0 ∈ O.
L’avantage quand on suppose que f est de classe C 1 est de pouvoir écrire :
f (y) − f (x) =
Z 1
0
Z 1
d
f 0 (ty + (1 − t)x)(y − x)dt .
[f (ty + (1 − t)x)] dt =
dt
0
Évidemment ceci présuppose que tous les points de la forme ty + (1 − t)x pour t ∈ [0, 1]
(qui est, par définition, l’intervalle [x, y]) sont dans O : c’est l’hypothèse géométrique du
TAF.
Il en résulte ensuite, par l’inégalité triangulaire, que :
|f (y) − f (x)| ≤
Z 1
|f 0 (ty + (1 − t)x)(y − x)|dt .
0
Si on sait que |||f 0 (z)||| ≤ M pour tout z ∈ [x, y] ou ||f 0 (z)(h)|| ≤ M.|h| pour tous
z ∈ [x, y] et h ∈ Rn alors :
|f (y) − f (x)| ≤ M |y − x| .
Il faut réinsister sur le fait que dans 99% des cas, seule l’inégalité “banale” ||f 0 (z)(h)|| ≤
M.|h| est utile. On n’a donc pas besoin d’avoir un recours fin à la norme d’application
linéaire.
Quelques exercices d’applications :
(i) Soit f : Rn → R définie par :
f (x) = exp(−||x||2 ) ,
où ||x||2 =
Pn
i=1
x2i . Démontrer que, pour tous x, y ∈ Rn :
|f (x) − f (y)| ≤ C|x − y| ,
pour une certaine constante C. Déterminer la meilleure constante C possible.
(ii) En utilisant la fonction g(x) = ||x|| et le théorème des accroissements finis, redémontrer la deuxième inégalité triangulaire pour la norme euclidienne standard.
(iii) Soit f : Rn \ {0} → R une fonction dérivable. On suppose que f se prolonge par
continuité en 0 et on note f˜ ce prolongement. Montrer que, si l’on a de plus :
lim f 0 (x) = L,
x→0
alors f˜ est dérivable en 0 et f˜0 (0) = L. Application ?
(iv) Soit Ω un ouvert connexe par arc de RN et f : Ω → Rp une fonction de classe C 1 .
Si x, y ∈ Ω et si γ : [0, 1] → Ω est un chemin tel que γ(0) = x et γ(1) = y, prouver que :
sup |||f 0 (z)|||.l(γ) ,
|f (x) − f (y)| ≤
z∈γ([0,1])
où l(γ) est la longueur du chemin γ, i.e.
R1
0
|γ̇(t)|dt.
(v) [Plus délicat] Soit f : O ⊂ Rn → Rn une fonction de classe C 1 et x̄ ∈ O un point
où f 0 (x̄) [application linéaire de Rn dans Rn ] est inversible. On introduit la fonction
T : O → Rn définie par :
T (x) = x − [f 0 (x̄)]−1 f (x) .
On suppose d’abord que f (x̄) = 0. Prouver qu’il existe r > 0 tel que, si |x0 − x̄| < r, la
suite définie par la relation de récurrence
xk+1 = T (xk ) ,
converge vers x̄. Estimer précisément |xk − x̄|.
Maintenant, on veut plus supposer que f (x̄) = 0. Prouver que s’il existe r, M > 0,
0 < b < 1 tels que, pour tous x, y ∈ B(x0 , r), on ait :
|||[f 0 (x)]−1 ||| ≤ M
,
|||f 0 (x) − f 0 (y)||| ≤
b
M
et |f (x̄)| < r(1 − b)/M ,
alors l’équation f (x) = 0 a une solution unique dans B(x0 , r). Application ?
3
Formule de Taylor et applications
La meilleure façon d’appréhender la formule de Taylor est sans doute sous sa forme
avec reste intégral. Dans R, on écrit le théorème fondamental de l’Analyse :
f (x + h) = f (x) +
Z h
0
f 0 (x + t)dt ,
puis on intègre par parties. Par exemple, si f est de classe C 2 , on écrit f 0 (x+t) = 1.f 0 (x+t),
on intègre le 1 en (t − a) où a est une constante d’intégration et on dérive f 0 (x + t), ce
qui donne :
0
0
f (x + h) = f (x) + (h − a)f (x + h) + af (x) −
Z h
(t − a)f 00 (x + t)dt .
0
Comme on ne veut pas qu’il apparaisse de dérivées au point x + h, le bon choix est a = h,
ce qui donne :
Z
h
f (x + h) = f (x) + f 0 (x)h −
(t − h)f 00 (x + t)dt .
0
Pour obtenir la formule de Taylor à l’ordre 2, on fait apparaître f 00 (x) dans l’intégrale :
−
Z h
00
(t − h)f (x + t)dt = −
0
Z h
00
00
(t − h)(f (x + t) − f (x))dt −
0
Z h
(t − h)f 00 (x)dt ,
0
ce qui conduit en calculant la derniere intégrale à l’expression bien connue :
Z h
1 00
2
(t − h)(f 00 (x + t) − f 00 (x))dt .
f (x + h) = f (x) + f (x)h + f (x)h −
2
0
0
L’intérêt de cette formule de Taylor est (évidemment) que l’on a explicitement le reste
sous forme d’une intégrale facile à estimer.
Dans Rn , rien ne change : on utilise simplement l’idée mise en place ci-dessus dans le
cadre du TAF en considérant la fonction t 7→ f (x + th) où x ∈ O, h ∈ Rn (suffisamment
petit) et t ∈ [0, 1] ce qui donne :
f (x + h) − f (x) =
Z 1
f 0 (x + th)hdt .
0
L’intégration par partie se fait de manière analogue puisqu’on a affaire à une fonction de
la variable réelle t. Exo : le faire !
Applications :
(i) Soit f : O → R une fonction de classe C 2 et x0 ∈ O un point de minimum local de
f . Prouver que f 0 (x0 ) = 0 [ou Df (x0 ) = 0 ou ∇f (x0 ) = 0] et que D2 f (x0 ) ≥ 0. Puis
prouver réciproquement que si x0 est un point de O où f 0 (x0 ) = 0 et D2 f (x0 ) ≥ ηId pour
un certain η > 0 alors x0 ∈ O un point de minimum local de f .
(ii) Soit f : R → R une fonction de classe C ∞ . Montrer que, pour tout x ∈ R, h > 0 :
|f (x + h) + f (x − h) − 2f (x)| ≤ Ch2 M (x, h) ,
où C est une constante à expliciter et M (x, h) = sup[x−h,x+h] |f (2) (t)|.
(iii) Soit f : Rn → R une fonction de classe C 2 . On suppose que f, ∇f, D2 f sont bornés
sur Rn et on pose :
M0 := sup |f (x)| , M1 := sup |∇f (x)| , M2 := sup |||D2 f (x)||| ,
x∈Rn
x∈Rn
x∈Rn
où la norme ||| · ||| est celle de la matrice en tant qu’application linéaire. Prouver que :
M12 ≤ 4M0 .M2 .
4
Théorème des fonctions implicites
Le but de ce théorème est de prouver que, sous certaines conditions et localement,
l’ensemble des points où :
F (x, y) = 0 ,
peut s’écrire sous la forme plus explicite :
y = f (x) .
Mais comment retenir les conditions ?
La fonction F doit être suffisamment régulière, i.e. de classe C 1 . C’est une condition
naturelle car on va vouloir dériver. Ensuite on écrit que, si c’est le cas :
F (x, f (x)) = 0 .
Et on dérive :
Dx F (x, f (x)) + Dy F (x, f (x)).Df (x) = 0 .
C’est un bon exercice de se convaincre du bien fondé de cette égalité et du bon ordre
des termes car les "matrices" Dy F (x, f (x)) et Df (x) ne commutent pas. Deux manières :
composer F et x 7→ (x, f (x) en calculant les matrices jacobiennes (leurs formes) ou faire
un DL !
Ensuite si on veut avoir Df (x), il faut pouvoir résoudre et donc écrire :
Df (x) = −[Dy F (x, f (x))]−1 .Dx F (x, f (x)) .
Pour cela, il est mieux en général que Dy F (x, f (x)) soit inversible...
Pratique :
(i) Faire un développement limité pour a proche de 0 de la solution x(a) [proche de 10]
de l’équation :
xe−ax = 10 .
On calculera les premiers termes puis on expliquera comme obtenir les autres.
(ii) Étudier les solutions de l’équation :
x3 + px + 1 = 0
pour p proche de 0.
Un exercice pour les “wizards” : inf-convolution.
Soit u : Rn → R une fonction de classe C 2 . On suppose que u, Du et D2 u sont bornés
sur Rn . On pose :
|x − y|2
}.
uε (x) = infn { u(y) +
y∈R
ε2
Le but est de montrer que uε est de classe C 2 pour ε assez petit et on pourra proceder
comme suit :
(i) Étudier le problème d’optimisation pour x fixé (on pourra se rapporter au mini-cours
d’optimisation) : montrer que l’infimum est atteint en un seul point y(x) si ε est assez
petit.
(ii) Utiliser le théorème des fonctions implicites pour prouver que x 7→ y(x) est de classe
C 1 (la première question à se poser est : quelle équation satisfait y(x) ?).
(iii) En déduire le résultat.
5
Une incursion vers les formes différentielles
Le but de cette section est de discuter la question suivante : si g = (g1 , · · · , gn ) est une
fonction de classe C 1 sur Rn , existe-t-il une fonction f telle que g = ∇f ?
La réponse est généralement non car, g étant C 1 , f est de classe C 2 et le Théorème
de Schwartz implique que :
∂ 2f
∂ 2f
(x) =
(x) ,
∂xi ∂xj
∂xi ∂xj
pour tout x ∈ Rn et 1 ≤ i, j ≤ n ce qui donne des conditions nécessaires sur g :
∂gj
∂gi
(x) =
(x) ,
∂xi
∂xj
pour tout x ∈ Rn et 1 ≤ i, j ≤ n.
Cet ensemble de conditions nécessaires est-il suffisant ? Dans Rn (ou dans un ouvert
étoilé), la réponse est oui !
On choisit arbitrairement le point 0 comme point de base. Si f existe, on devrait avoir :
f (x) − f (0) =
Z 1
h∇f (tx), xidt =
0
Z 1
hg(tx), xidt .
0
Et donc on va montrer que cette formule donne effectivement une fonction de classe C 1
∂f
:
[ce qui est clair ?] dont le gradient est g. Pour cela, on commence par calculer ∂x
i
Z 1X
Z 1
n
∂gk
∂f
gi (tx)dt .
(x) =
(tx)txk dt +
∂xi
0 k=1 ∂xi
0
Puis on utilise la condition nécessaire qui conduit à :
Z 1X
Z 1
n
∂f
∂gi
gi (tx)dt .
(x) =
(tx)txk dt +
∂xi
0 k=1 ∂xk
0
Enfin on remarque que l’intégrande pour les deux intégrales vaut exactement
Ce qui donne le résultat.
d
[tgi (tx)].
dt
Exercice : Prouver (sans utiliser le résultat) que, si γ : [0, 1] → Rn est un lacet de
classe C 1 alors l’intégrale :
Z
1
hg(γ(t)), γ 0 (t)idt = 0 .
0
(on pourra penser à une intégration par partie). À quelle autre théorie mathématique
cette propriété vous fait-elle penser ?
NB : Dans cette section, on a manipulé sans le dire la forme différentielle : dω =
g1 (x)dx1 + g2 (x)dx2 · · · + gn (x)dxn et l’intégrale de cette forme sur un chemin γ : [a, b] →
Rn :
Z
Z b
dω :=
[g1 (γ(t))γ10 (t) + g2 (γ(t))γ20 (t) · · · + gn (γ(t))γn0 (t)] dt.
γ
a

Documents pareils