texte
Transcription
texte
Analyse microlocale Nguyen Pierre T.E.R. réalisé sous la direction de M. Louis Boutet De Monvel Université Paris VI 2007/2008 Résumé : Dans ce document, on s’intéresse à l’analyse microlocale. Après avoir introduit les outils de base du sujet, on s’intéresse aux opérateurs pseudo-différentiels et à leur résolution. Ensuite, on cherche à améliorer la notion de support singulier et à étudier microlocalement la propagation des singularités de solutions d’opérateurs pseudo-différentiels. Enfin, on évoque les opérateurs non localement résolubles et la conjecture de Trèves-Nirenberg. Table des matières 1 Introduction et outils de base 1.1 Notations et motivations . . . . . . . . . . . . . 1.2 Distributions . . . . . . . . . . . . . . . . . . . 1.3 Analyse de Fourier des distributions tempérées 1.4 Le théorème des noyaux de Schwartz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 2 4 5 9 2 Opérateurs pseudo-différentiels 2.1 Opérateurs différentiels . . . . . . 2.2 Symboles, sommes asymptotiques 2.3 Intégrales oscillantes . . . . . . . 2.4 Opérateurs pseudo-différentiels . 2.5 Calcul symbolique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 11 12 15 19 21 3 Introduction à l’analyse microlocale 3.1 L’idée directrice de l’analyse microlocale 3.2 Résultats de géométrie symplectique . . 3.3 Le front d’onde . . . . . . . . . . . . . . 3.4 Propagation des singularités . . . . . . . 3.5 Opérateurs non localement résolubles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 24 24 26 29 31 . . . . . . . . . . . . . . . 1 Chapitre 1 Introduction et outils de base 1.1 Notations et motivations Les équations aux dérivées partielles apparaissent naturellement dans toutes les branches de la physique. Très heuristiquement, on peut essayer d’expliquer ce phénomène par leur localité . En effet, au voisinage de x, F (x, ∂f ) ne dépend que de f ; et la physique (qui est à la fois la motivation et le champ d’application naturel de la théorie des équations aux dérivées partielles) n’aime pas les interactions instantanées à distance, toujours mal comprises 1 . Les équations aux dérivées partielles surviennent ainsi dans pratiquement toutes les tentatives de modélisation, que ce soit en dynamique des structures, en mécanique des fluides, en théorie de la gravitation, en électromagnétisme, en physique quantique ou en théorie de la diffusion. Pour la suite, on introduit les notations suivantes. Par la lettre Ω, on désignera toujours un ouvert de Rn . Si α est un multi-indice, i.e. un élément de Nn , on définit la longueur de α comme étant la somme α1 + · · · + αn , où α = (α1 , · · · , αn ). On la notera généralement |α|. On définit également la factorielle de α comme étant α! := α1 ! · · · αn !. Si f est une fonction à valeurs dans Ω, on note ∂ α l’opérateur différentiel ∂f α1 ∂f αn α ∂ = . ··· ∂x1 ∂xn De façon similaire (et tout aussi naturelle !) si x est un vecteur de Rn on convient que : xα = xα1 1 · · · xαnn de sorte que si f est Taylor suivante : suffisamment différentiable sur un voisinage de x, on a la formule de Z 1 X X (∂ α f )(x) (1 − θ)m (m+1) x α f (x + h) = h + f (x + θh) dθhm+1 α! m! 0 0≤j≤m |α|=j P où bien sûr f (m+1) (x) désigne |α|=m+1 ∂xα f (x). En étendant cette notation à tous les entiers, on peut réécrire la formule de Taylor précédente ainsi : X f (j) (x)h Z 1 (1 − θ)m + f (m+1) (x + θh) dθhm+1 f (x + h) = j! m! 0 0≤j≤m avec des conventions évidentes. 1. Ainsi Newton devait concéder qu’il n’aimait pas l’idée d’interaction gravitationnelle à distance dans sa loi de gravitation universelle, mais qu’il n’avait pas trouvé mieux. Un autre exemple est donné par le paradoxe EPR et la controverse entre Einstein et Bohr ; Albert Einstein n’a jamais accepté le concept d’influence instantanée à distance impliqué par l’interprétation de Copenhague de la mécanique quantique, concept qu’il qualifiait d’action surnaturelle à distance . 2 Si on note ∂ ∂xk l’opérateur de dérivée partielle par rapport à la k-ième variable, on introduit la notation : Dk = −i ∂ ∂xk dont l’intérêt apparaı̂tra au paragraphe 3 avec la transformée de Fourier. Enfin, si α est un multiindice, on définit l’opérateur de dérivation d’ordre α : Dα = D1α1 · · · Dnαn . Notre objectif dans ce T.E.R. est de parvenir à une assez bonne compréhension de la théorie des opérateurs pseudo-différentiels. Nous commencerons par des remarques simples ; dans Rn (ou sur une carte quelconque) un opérateur différentiel partiel linéaire d’ordre m s’écrit dans sa forme la plus générale : X aα (x)∂xα u P (x, ∂x )u = |α|≤m où les aα sont indéfiniment dérivables. Une équation aux dérivées partielles est de la forme P (x, ∂x )u = v où v est une fonction quelconque sur Rn , voire une distribution. L’analyse de Fourier nous permet, en un sens que l’on précisera, de diagonaliser les opérateurs différentiels à coefficients constants. L’une des idées conduisant à la théorie des symboles et des opérateurs pseudo-différentiels est de remarquer que si la transformée de Fourier ne diagonalise plus les opérateurs différentiels à coefficients non constants, on peut toujours approximer l’action de P sur des distributions (fonctions généralisées) ou des sommes asymptotiques (nouvelle notion d’approximation) par son symbole principal. En fait, ce constat pourra encore se généraliser à des opérateurs plus généraux, définis par des intégrales . Pour pouvoir développer cette théorie des opérateurs pseudo-différentiels, nous devrons donner du sens à ces intégrales pas forcément convergentes, appelées intégrales oscillantes ; ceci sera fait grâce à la théorie des distributions. On décrira ensuite le calcul symbolique et les quantifications sous-jacentes. Pour aller plus loin, nous verrons qu’il est très fructueux de localiser l’action de P dans R2n . C’est à cet effet que nous définirons le front d’onde d’une distribution, obtenant ainsi un premier résultat sur la propagation des singularités. Pour finir, nous aborderons le problème de Hans Lewy : ∂u ∂u +z = v. ∂ z̄ ∂t Il se trouve que cette équation, pour v adéquatement choisie, n’a pas de solutions locales, même dans l’espace des distributions. L’exhibition d’un tel opérateur (dans les années 1950) posait un réel problème aux mathématiciens de l’époque ; ainsi, il existait un opérateur, tout ce qu’il y a de plus raisonnable (et même extrêmement raisonnable, puisqu’il apparaı̂t de manière tout à fait naturelle dans l’étude de la cohomologie du faisceau des fonctions holomorphes 2 ), qui n’était même pas résoluble localement, alors qu’intuitivement on aurait souhaité que tout opérateur possède des solutions, au moins locales. C’est Lars Hörmander qui le premier saura éclairer d’un jour nouveau ces phénomènes en leur donnant une interprétation géométrique intrinsèque que nous tenterons d’expliquer. Celle-ci motiva par la suite la conjecture de Trèves-Nirenberg (depuis démontrée par Nils Dencker). Dans ce premier chapitre d’introduction, on s’attache à donner les définitions essentielles. Pour des démonstrations, le lecteur se référera à un cours d’analyse fonctionnelle. 2. Même si la terminologie actuelle ne fut mise au point que dans les années 1950, ces problèmes avaient déjà été abordés auparavant, par exemple avec l’étude du phénomène de Hartogs. 3 1.2 Distributions Afin de pouvoir modéliser des phénomènes physiques extrêmes comme les sauts ou traduire mathématiquement l’existence de solutions faibles d’équations aux dérivées partielles 3 , les physiciens et les ingénieurs (notamment Dirac et Heaviside, en vue de la physique théorique) ont très rapidement été amenés à considérer des objets mathématiques qui n’étaient pas à proprement parler des fonctions, mais qui permettaient de mener à bien des calculs autrement inextricables. C’est le mathématicien français Laurent Schwartz (Paris, 1915 - Paris, 2002) qui va le premier donner une théorie rigoureuse de ces nouveaux objets mathématiques, qui généralisent la notion de fonction. Définition 1.2.1. : Soit Ω un ouvert de Rn . On note D(Ω) et on appelle espace des fonctions de test l’ensemble des fonctions indéfiniment dérivables à support compact inclus dans Ω. Remarque 1.2.2. : Il n’est pas tout à fait évident que D(Ω) est non vide. Pour exhiber un élément de D(Ω), on peut regarder la fonction Rn 3 t 7−→ χ||t||≤1 e − 1 1−||t||2 et vérifier qu’elle appartient bien à D(Ω) pour Ω la boule ouverte de centre 0 et de rayon 1. Définition 1.2.3. : Soit Ω un ouvert de Rn . On dit que T est une distribution sur Ω (et on note T ∈ D0 (Ω)) si T est une forme linéaire continue sur l’espace D(Ω) 4 . En d’autres termes, pour tout K compact inclus dans Ω, il existe une constante CK et un entier NK tels que pour toute fonction φ à support compact inclus dans K on ait : | < T, φ > | ≤ CK sup ||∂ α φ||∞ . |α|≤NK Exemples 1.2.4. : Un exemple très important est le suivant ; soit f une fonction localement intégrable sur Ω, on définit Tf la distribution associée à la fonction f par : Z < Tf , φ >= f (t)φ(t) dt. Ω On vérifie facilement que c’est une distribution ; on vérifie (un peu moins facilement) que l’application qui à une fonction f localement intégrable associe la distribution Tf est injective. Donnons d’autres exemples. Historiquement, l’exemple le plus important fut sans doute le suivant. On définit une distribution δ0 (la distribution de Dirac) de D0 (R) par : < δ0 , φ >= φ(0). Un autre exemple important est la distribution de Heaviside : Z ∞ < H, φ >= φ(t) dt 0 qui est en un certain sens (voir plus bas) une primitive de δ0 . Définition 1.2.5. : Soit T une distribution, on suppose qu’il existe un entier N tel que pour tout compact K l’entier NK de la définition peut être pris égal à N . On appelle alors ordre de la distribution l’entier N minimal pour cette propriété. 3. Exemple : solutions faibles de l’équation des cordes vibrantes. 4. L’espace DK (Rn ), aussi noté D(K), des fonctions C ∞ à support dans K compact est un espace de Fréchet (espace complet dont la métrique découle d’une famille dénombrable séparante de semi-normes) ; D(Rn ) n’en est pas un, on parle de limite inductive d’espaces de Fréchet. Notons que sa topologie est vraiment horrible (par exemple elle n’est même pas métrisable). En revanche, pour les semi-normes déduites d’une exhaustion, D(Ω) est un espace de Fréchet. 4 Exemple 1.2.6. : La distribution δ0 de Dirac est d’ordre 0. Avant de passer à l’opération fondamentale sur les distributions (transformée de Fourier) on décrit quelques autres opérations possibles : 1) La multiplication par une fonction C ∞ : < f T, φ >:=< T, f φ >. 2) La dérivation : < ∂ α T, φ >:= (−1)|α| < T, ∂ α φ >. 3) La restriction : si U est un ouvert de Rn inclus dans Ω, on définit pour toute fonction φ C ∞ à support compact inclus dans U < T|U , φ >:=< T, φ >. Notons que ces définitions ne sont pas posées au hasard. En effet, elles sont compatibles avec les règles que l’on connaı̂t pour les distributions associées à des fonctions localement intégrables (essentiellement, règle d’intégration par parties). On retiendra que les intégrations par parties formelles sont souvent un bon point de départ pour l’intuition en théorie des distributions. On termine cette introduction aux distributions par la notion de support, sur laquelle nous reviendrons lorsqu’il s’agira de définir le front d’onde : Définition 1.2.7. : Soit φ une fonction de D(Rn ). Le support de φ est le complémentaire de l’ensemble des points x tels qu’il existe un voisinage de x sur lequel la fonction soit nulle (c’est par conséquent un fermé). Définition 1.2.8. : Soit T ∈ D0 (Rn ). Le support de T est le complémentaire de l’union des ouverts Ω de Rn tels que pour toute fonction φ de D(Rn ) à support dans Ω, on ait < T, φ >= 0. Un théorème très important (que nous admettrons ici, voir un cours d’analyse fonctionnelle) est le théorème de partition de l’unité : Théorème 1.2.9. : (Partition de l’unité) Soit Ω un ouvert de Rn , K un compact ⊆ Ω. On suppose K ⊆ Ω1 ∪ · · · ∪ Ωm , où les Ωj sont des ouverts ⊆ Ω. Alors pour tout 1 ≤ j ≤ m il existe une fonction ϕj C ∞ à support compact de Ωj dans [0, 1] telle que : m X (i) ϕj = 1 sur un voisinage de K. j=1 (ii) 0 ≤ m X ϕj ≤ 1 sur Ω. j=1 On en déduit la proposition suivante, qui peut sembler banale, mais difficile à montrer sans le théorème précédent : Proposition 1.2.10. : Soit Ω un ouvert de Rn et u une distribution sur Ω. Alors u est nulle sur le complémentaire de son support (et même résultat pour les fonctions). 1.3 Analyse de Fourier des distributions tempérées On commence par introduire un espace de distributions mieux approprié à ce que l’on veut faire par la suite, l’espace de Schwartz. Commençons par la définition : Définition 1.3.1. : Soit Ω un ouvert de Rn . On dit qu’une fonction f appartient à l’espace de Schwartz (noté S(Rn ) 5 ) sur Rn si f est de classe C ∞ et que de plus toutes ses dérivées sont à 5. S comme sphérique, et non comme Schwartz, comme on serait tenté de le croire de prime abord ! Cette dénomination est justifiée par un théorème énoncé par Schwartz dans [SCH] qui dit que Pour qu’une distribution T ∈ D0 , distribution sur Rn , soit sphérique, il faut et il suffit qu’elle soit prolongeable en une distribution sur S n . 5 décroissance rapide, i.e. : ∀α, ∀β, xα ∂ β f ∈ L∞ (Rn ). Un exemple d’une telle fonction de Rn dans R est donné par : 2 x 7−→ e−||x|| . Il est très facile de voir que l’exponentielle n’est pas un élément de S(Rn ). Donnons quelques propriétés essentielles de S(Rn ) ; (i) S(Rn ) contient l’espace des fonctions tests (fonctions C ∞ à support compact). (ii) Il contient tous les éléments du type polynôme multiplié par une gaussienne. (iii) C’est un sous-espace vectoriel de Lp pour tout 1 ≤ p ≤ ∞, dense dans Lp pour 1 ≤ p < ∞. (iv) S(Rn ) est stable par multiplication, dérivation, multiplication par un polynôme. De plus ces opérations induisent des applications continues de l’espace de Schwartz dans lui-même. (v) Pour les semi-normes naturelles, l’espace de Schwartz est un espace de Fréchet. Rappelons la définition de la transformée de Fourier d’une fonction u ∈ S(Rn ) : Définition 1.3.2. : Soit u ∈ S(Rn ). Alors la transformée de Fourier de u, notée û, est l’application : Z e−ixξ u(x) dx. û : ξ 7−→ Rn On la notera occasionnellement F(u). L’espace de Schwartz satisfait de nombreuses propriétés intéressantes pour la transformée de Fourier, dont la plus fondamentale est que la transformée de Fourier définit un isomorphisme (continu) d’espaces vectoriels de S(Rn ) dans lui-même. Nous ne démontrerons pas l’importante formule d’inversion de Fourier, qui permet connaissant û de retrouver u : Théorème 1.3.3. : (Formule d’inversion de Fourier) Soit u ∈ S(Rn ). Pour tout x dans Rn , on a l’identité : Z 1 u(x) = û(ξ)eixξ dξ. (2π)n Rn Corollaire 1.3.4. : Si on note ŭ (lire ˘ˆ u c̆ech ) l’application x 7−→ u(−x), on a u = û. La formule suivante permet de ramener des problèmes différentiels à des problèmes algébriques : Proposition 1.3.5. : Avec les notations du premier paragraphe, on a, pour tout u dans S(Rn ) : α α d (D x u)(ξ) = ξ û(ξ). On va à présent s’intéresser au dual topologique de S(Rn ), noté comme il se doit S 0 (Rn ), l’espace des distributions tempérées, dont on va voir qu’il a de très bonnes propriétés vis à vis de la transformée de Fourier (que, du reste, nous n’avons pas encore définie sur S 0 (Rn )). Définition 1.3.6. : L’espace S 0 (Rn ) des distributions tempérées est le dual topologique de l’espace de Fréchet S(Rn ), i.e. l’ensemble des distributions T telles que pour tout ϕ dans S(Rn ) on a une majoration par une semi-norme du type : | < T, ϕ >S 0 (Rn ),S(Rn ) | ≤ C0 sup |α|+|β|≤N0 x∈Rn 6 |xα Dxβ φ|. Notons que l’on a une injection canonique de S(Rn ) dans tous les Lp , 1 ≤ p ≤ ∞. Les résultats qui suivent, donnés sans démonstration, peuvent être considérés comme les résultats fondamentaux de l’analyse de Fourier : Théorème 1.3.7. : La transformée de Fourier se prolonge naturellement en un isomorphisme ˘ ˆ a toujours cours, par la formule : de S 0 (Rn ), où la formule u = û < Tb, φ >S 0 (Rn ),S(Rn ) =< T, φb >S 0 (Rn ),S(Rn ) qui provient comme d’habitude d’une intégration par parties formelles. Notons que si u est une distribution à support compact, sa transformée de Fourier est la fonction définie pour chaque ξ par û(ξ) =< u(x), e−ix.ξ > où l’action de u sur x −→ e−ix.ξ est définie par extension de la dualité 6 . Proposition 1.3.8. : La formule de dérivation reste valable, à savoir que : α αT , φ > 0 n b [ <D S (R ),S(Rn ) =< T (ξ), ξ φ(ξ) >S 0 (Rn ),S(Rn ) . Proposition 1.3.9. : (théorème de Plancherel) La transformée de Fourier se prolonge en un isomorphisme unitaire de L2 (Rn ), qui est de plus une isométrie à condition de faire un changement d’échelle : √ √ ||f / 2π||2 = ||fb 2π||2 . Un résultat important est l’effet de la transformation de Fourier sur l’exponentielle d’une matrice symétrique réelle définie positive (donc diagonalisable en base orthonormée avec toutes ses valeurs propres strictement positives). Proposition 1.3.10. : Soit A une matrice symétrique réelle définie positive de dimension n. Soit u : x 7−→ e−<Ax,x> . Alors : û(ξ) = 1 π n/2 −1 e− 4 <A ξ,ξ> . 1/2 (det A) Démonstration : Il suffit de découper habilement l’exponentielle qui apparaı̂t dans la formule 1 −1 donnant û(ξ) pour faire apparaı̂tre e− 4 <A ξ,ξ> , l’intégrale restante se calculant en diagonalisant A en base orthonormée. On a un résultat similaire, que nous admettrons, qui donne l’effet de la transformation de Fourier sur une exponentielle complexe. Proposition 1.3.11. : Soit Q une matrice symétrique réelle non dégénérée de dimension n. Soit u : x 7−→ e−i<Qx,x> . Alors : π π n/2 ei 4 sgn(Q) − i <Q−1 ξ,ξ> û(ξ) = e 4 (det Q)1/2 où sgn(Q) désigne la signature de Q (nombre de valeurs propres strictement positives moins nombre π de valeurs propres strictement négatives). Le terme ei 4 sgn(Q) , parfois appelé terme de phase dans la littérature, provient de l’exponentielle complexe. L’exemple qui suit, tiré de [EVA], montre comment on peut utiliser la transformée de Fourier pour résoudre des problèmes d’équations aux dérivées partielles. On considère le problème suivant : 6. C’est-à-dire que pour φ ∈ C ∞ (Rn ), < u, φ >=< u, θφ > où θ est une fonction plateau à support compact contenant le support de u. 7 2 ∂ u = x ∂ u + ∂ sur ]0, +∞[×R2 ∂t ∂y ∂x2 u = δ(x0 ,y0 ) sur {t = 0} × R2 On applique la transformée de Fourier en x, y (mais pas en t). On obtient alors pour û(t, ξ, η) l’équation : ∂ ∂ û = −η û − ξ 2 û ∂t ∂ξ qui se résout par variation de la constante : Rt û(t, ξ + tν, η) = û(0, ξ, η)exp(− 0 (ξ + sη)2 ds) = û(0, ξ, η)exp(−1/2 < Bt (ξ, η), (ξ, η) >) 2t t2 où Bt = . Comme û(0, ξ, η) = F(δ(x0 ,y0 ) ), en appliquant la transformée de Fourier t2 2t3 /3 inverse il vient : u(t, x, y − tx) = δ(x0 ,y0 ) ∗ F −1 (exp(−1/2 < Bt (ξ, η), (ξ, η) >)) ce qui donne √ (x − x0 )2 3(x − x0 )(y − y0 ) 3(y − y0 )2 3 exp − + − u(t, x, y − tx) = 2πt3 t t2 t3 dont on déduit immédiatement u(t, x, y). Pour terminer, nous démontrons une version du théorème de Paley-Wiener qui nous sera utile lorsqu’il s’agira d’interpréter le front d’onde. Théorème 1.3.12. : (Théorème de Paley-Wiener) a) Soit u une distribution à support compact inclus dans Ω un ouvert de Rn . Alors u est C ∞ en x0 si et seulement si au voisinage de x0 , pour tout N , pour tout ξ, il existe une constante CN telle que |û(ξ)| ≤ CN (1 + |ξ|)−N . b) Soit u une distribution sur Ω. Alors u est C ∞ au voisinage de x0 (i.e. il existe un voisinage V de x0 tel que la restriction de u à V soit C ∞ ) si et seulement s’il existe un voisinage ω ⊆ Ω de x0 tel que pour toute fonction φ ∈ D(ω), pour tout N , pour tout ξ, il existe une constante CN c telle que |φu(ξ)| ≤ CN (1 + |ξ|)−N . Démonstration : Rappelons déjà que si u est à support compact, alors û est C ∞ et toutes ses dérivées sont à croissance polynomiale, i.e. pour tout multi-indice α il existe un entier Nα tel que : |Dα û(ξ)| . (1 + |ξ|)−Nα . Ceci résulte immédiatement de la formule d’extension de la dualité et de la formule de Leibniz. Démontrons à présent a). Supposons u C ∞ au voisinage de x0 . On introduit l’opérateur différentiel suivant : n X ∂2 P =1+ ∂xj 2 j=1 qui vérifie P e−ix.ξ = (1 + |ξ|2 )e−ix.ξ . En intégrant par parties dans l’expression de û(ξ), on obtient la majoration souhaitée. Réciproquement, si û est à décroissance rapide au voisinage de x0 , alors en écrivant u par la formule de la transformée de Fourier inverse, on voit que u est indéfiniment dérivable au voisinage de x0 . Le point b) découle immédiatement du point a). 8 1.4 Le théorème des noyaux de Schwartz Suivant [SAF], nous énoncerons le théorème des noyaux de Schwartz sous cette forme : Théorème 1.4.1. : (Théorème des noyaux de Schwartz) Soit A un opérateur linéaire continu de S(Rn ). Alors il existe une famille de distributions tempérées A(x, .) (dépendant du paramètre x ∈ Rn ) telle que : ∀v ∈ S(Rn ), ∀x ∈ Rn , Av(x) =< A(x, .), v > Définition 1.4.2. : On appelle la famille {A(x, .)}x∈Rn le noyau de Schwartz de l’opérateur A. Notons que si A est un opérateur linéaire continu de S 0 (Rn ), alors pour tout u dans S 0 (Rn ), l’application S(Rn ) 3 v 7−→< u, Av >=< u(x), < A(x, y), v(y) >> définit une distribution tempérée. Définition 1.4.3. : Soit A un opérateur linéaire continu sur S(Rn ). On définit sur S 0 (Rn ) un opérateur t A par : ∀ u ∈ S(Rn ), ∀ v ∈ S 0 (Rn ), < t Au, v >=< u, Av > . On appelle cet opérateur le transposé de A. Proposition 1.4.4. : Soit A un opérateur linéaire continu sur S(Rn ). Si le noyau de Schwartz de A peut être considéré comme une distribution A(., y) dépendant de façon C ∞ de y ∈ Rn , i.e. s’il existe une famille de distributions A(., y) telle que pour tout u, v ∈ S(Rn ), < A(., y), u > soit dans S(Rn ), et Z Z < A(x, y), u(x) > v(y) dy = u(x) < A(x, y), v(y) > dx alors t A possède un noyau de Schwartz, donné par la formule t A(x, y) = A(y, x). Démonstration : Si on appelle B l’opérateur donné par le noyau de Schwartz A(y, x), on a clairement : < Bu(x), v(x) >=< u(x), Av(x) >=< t Au(x), v(x) > donc pour tout u ∈ S(Rn ), Bu =t Au donc t A = B ce qui prouve que t A possède un noyau de Schwartz et donne la forme de celui-ci. Exemples 1.4.5. : • Soit u une distribution tempérée, on définit pour f ∈ S(Rn ) : < u(x − y), f (y) >:=< u(y), f (x − y) > . En particulier pour la distribution δ, on a < δ(x − y), f (y) >=< δ(y), f (x − y) >= f (x − 0) = f (x) i.e. δ(x − y) est le noyau de Schwartz de l’opérateur identique. • Le noyau de la transformation de Fourier F est e−ix.ξ , qui est symétrique en x et en ξ ; ce qui justifie a posteriori la formule < F(T ), φ >=< T, F(φ) >. Remarque 1.4.6. : Dans la suite, on sera naturellement amenés à s’intéresser à des opérateurs sur S(Rn ) du genre : Z Z Af (x) = eiφ(x,y,ξ) a(x, y, ξ)f (y) dydξ Ω×Rn où φ et a (respectivement, la fonction de phase et la fonction d’amplitude) satisfont certaines propriétés. Le noyau de Schwartz de l’opérateur A est alors donné par une intégrale de la forme : Z eiφ(x,y,ξ) a(x, y, ξ) dξ Rn 9 qui n’a aucune raison d’avoir du sens a priori. Plus en avant dans le texte, nous tâcherons, sous certaines conditions, de donner du sens à ce type d’intégrale, appelée intégrale oscillante, et qui permet de définir la plupart des opérateurs pseudo-différentiels. 10 Chapitre 2 Opérateurs pseudo-différentiels 2.1 Opérateurs différentiels Ce paragraphe consacré aux opérateurs différentiels est une introduction aux méthodes utilisées dans l’étude, plus subtile, des opérateurs pseudo-différentiels, qui sont en quelque sorte une généralisation des opérateurs différentiels. Définition 2.1.1. : En accord avec les notations introduites au début du texte, un opérateur différentiel de degré m est donné par une expression de la forme : X D= aα (x)Dα |α|≤m où les aα sont des fonctions C ∞ de la variable x ∈ Rn , appelées coefficients de l’opérateur D. Le calcul que l’on va faire à présent justifie à lui seul l’introduction de la transformée de Fourier. Soit D un opérateur différentiel défini comme ci-haut. On introduit la définition suivante : Définition 2.1.2. : Soit D un opérateur différentiel. On définit son symbole (ou symbole total ) comme étant la fonction σ de 2n variables définie par : X σm (x, ξ) = aα (x)ξ α . |α|≤m Dans le même ordre d’idées, on appelle symbole principal de l’opérateur différentiel D l’application σm définie par : X σm (x, ξ) = aα (x)ξ α . |α|=m On peut remarquer que σm (x, ξ) est le coefficient dominant du polynôme de la variable t e−itξ D(eitξ ) (le calcul est facile, il est bien tensorisé), donnant ainsi une description intrinsèque du symbole principal. Une formule classique d’analyse de Fourier donne : α f )(x) = xα fb(x). \ (D En utilisant l’inversion de Fourier, on en déduit : α (D f )(x) = (2π) −n Z eixξ ξ α fb(ξ) dξ. Par conséquent : (Df )(x) = X aα (x)(2π)−n |α|≤m 11 Z eixξ ξ α fb(ξ) dξ. On peut intervertir la somme et l’intégrale et on obtient : Z −n (Df )(x) = (2π) eixξ fb(ξ)σ(x, ξ)dξ. (2.1) Notons que si les coefficients de l’opérateur différentiel D sont constants, alors la transformée de Fourier de D(f ) vérifie : [)(x) = σ(x)fb(x) (Df P où σ(x) = |α|≤m aα xα . Ce n’est plus vrai dans le cas d’un opérateur différentiel quelconque car les aα n’ont plus aucune raison d’être invariants par changement de coordonnées. La remarque clé pour la théorie des opérateurs pseudo-différentiels est que la formule (2.1) continue à définir un opérateur sur S(Rn ) lorsque σ satisfait certaines propriétés. En fait, il suffit essentiellement que σ appartienne à une des classes de symboles que nous allons définir. 2.2 Symboles, sommes asymptotiques Nous définissons dans cette section les symboles. La notion la plus importante ici est celle de développement asymptotique (définition 2.2.6.). Définition 2.2.1. : Soit Ω un ouvert de Rn . On appelle espace des symboles d’ordre m et on note S m (Ω × Rn ) (S m s’il n’y a pas de risque de confusion) l’ensemble des fonctions a C ∞ sur Ω × Rn telles que pour tous multi-indices α, β, on ait : |Dxα Dξβ a(x, ξ)| . (1 + |ξ|)m−|β| . On pose également S −∞ := T 0 S m . On voit aisément que si m ≤ m0 , S m ⊆ S m . Appelons (Kk )k≥1 un recouvrement de Ω par des compacts, tels que Kk ⊆ int(Kk+1 ) (un tel recouvrement s’appelle une exhaustion) ; S m est un espace de Fréchet muni de la topologie découlant des semi-normes suivantes : pm,k (a) = sup |α|+|β|≤m x∈Kk , ξ∈Rn |Dxα Dξβ a(x, ξ)|(1 + |ξ|)m−|β| . La complétude découle de l’inclusion de tous les S m dans l’ensemble des fonctions C ∞ sur Ω × Rn , qui est un Fréchet. Exemples 2.2.2. : La fonction σ(x, ξ) = P |α|≤m aα (x)ξ α définit un symbole (calcul facile). 0 Remarque 2.2.3. : L’application produit p qui à un couple (a, b) de S m × S m associe la fonction 0 0 ab est une application bilinéaire continue de S m × S m dans S m+m . Ceci découle de la formule de Leibniz pour la dérivation. De plus, l’opérateur différentiel qui à un symbole a de degré m associe Dxα Dξβ a est continu de S m vers S m−|β| , par un calcul similaire. Définition 2.2.4. : Soit a une fonction de Ω × Rn . On dit que a est positivement homogène de degré m en ξ si pour tout λ > 0 on a : a(x, λξ) = λm a(x, ξ). Notons que si a est une fonction positivement homogène de degré m qui vérifie pour tout multiindice α et pour tout ξ de norme 1 : |Dxα a(x, ξ)| . 1 alors pour toute fonction f C ∞ nulle dans un voisinage de 0 et égale à 1 pour |ξ| suffisamment grande, f a est un symbole. 12 De plus, si a est C ∞ et positivement homogène de degré m en ξ pour |ξ| grand (i.e. positivement homogène pour |ξ| ≥ R), alors a est un symbole de degré m. Proposition 2.2.5. : S −∞ est dense dans S m pour la topologie d’espace de Fréchet de S m+ε . Mieux, on peut remplacer S −∞ par Sc l’ensemble des fonctions de E(Ω × Rn ) 1 à support compact en ξ. Démonstration : On introduit χ une fonction C ∞ à support compact valant 1 sur B(0, 1) et nulle sur le complémentaire de B(0, 2) qui reste comprise entre 0 et 1 2 (il est facile d’en construire 2 une partant de la fonction t −→ e−1/(1−||t|| ) ). Alors la suite (χj )j≥1 définie par χj (ξ) = χ(ξ/j) est bornée dans S 0 . En effet : (1 + |ξ|)|β| |Dxα Dξβ χ(ξ/j)| ≤ (1 + |ξ|)|β| j −|β| |Dξβ χ(ξ/j)| ≤ (j + j|ξ/j|)|β| j −|β| |Dξβ χ(ξ/j)| β ≤ sup (1 + |ξ/j|)|β| |Dξ/j χ(ξ/j)| ξ∈Rn d’où le caractère borné de (χj )j≥1 . On fixe a dans S m . On considère alors la suite de symboles (aj )j≥1 donnée par aj (x, ξ) = χj (ξ)a(x, ξ). Il est clair qu’à j fixé, aj ∈ S −∞ . On déduit de la continuité de l’application bilinéaire S 0 × S m −→ S m le caractère borné de la suite (aj )j≥1 dans S m . Comme (aj )j≥1 converge simplement vers a et que l’ensemble {aj , j ≥ 1} ∪ {a} est borné, et que tout borné de S m est relativement compact dans S m+ε (car dans E(Ω × Rn ), ceci se prouve en montrant que les suites convergentes des deux espaces sont les mêmes), on obtient le résultat. Nous avons donc construit un certain nombre d’espaces de fonctions, les S m , et passé en revue quelques unes de leurs propriétés. Dans l’optique de ce qui va suivre, on introduit une nouvelle notion d’approximation, la notion de somme asymptotique. Définition 2.2.6. : Soient (aj )j∈N et a des symboles. On dit que a est somme asymptotique (ou développement asymptotique) des aj s’il existe une suite (mj )j∈N de réels tendant vers −∞ telle que pour tout l ≥ 0, on ait : l X a− aj ∈ S ml+1 . j=0 Cette notion de développement asymptotique sera très importante pour la suite. L’un de ses atouts les plus évidents est que l’on dispose avec elle d’une sorte de complétude . Pour pouvoir démontrer le théorème de complétude, nous aurons besoin des deux lemmes suivants : Lemme 2.2.7. : Soit χ une fonction C ∞ sur Rn à support compact égale à 1 près de 0. On définit une fonction χλ par χλ (ξ) = χ(λξ). Alors pour tout 0 < k ≤ 1 l’ensemble {λ−k (1 − χλ )}0<λ≤1 est borné dans S k . Démonstration : Les fonctions considérées sont indépendantes de x, donc par définition des semi-normes de S k , il nous suffit de montrer que les fonctions (1 + |ξ|)|β|−k λ−k Dξβ (1 − χλ ) sont bornées indépendamment de 0 < λ ≤ 1. 1. Cette notation désigne l’ensemble des fonctions C ∞ sur Ω × Rn . 2. Une telle fonction s’appelle une fonction plateau (nom imagé facile à comprendre si on trace un graphe pour n = 1). Si χ est une fonction plateau, on appelle 1 - χ une fonction de troncature (même remarque). Ces fonctions sont d’un usage constant en analyse fonctionnelle. 13 Comme χ est C ∞ à support compact il existe pour tout β une constante Cβ telle que : |Dξβ (χ − 1)| ≤ Cβ . Par conséquent, par définition de χλ on a : |Dξβ (1 − χλ )| ≤ λ|β| Cβ . De surcroı̂t comme χ est une fonction plateau il existe un R > 0 tel que χ(ξ) = 0 pour |ξ| > R et χ(ξ) = 1 pour |ξ| < 1/R. Si 0 < λ ≤ 1 et χλ (ξ) = 6 1, alors |ξ| ≥ 1/λR et donc : λ−k (1 + |ξ|)−k ≤ ≤ ≤ ≤ ((1 + |ξ|)λ)−k ((1 + 1/λR)λ)−k (λ + 1/R)−k Rk . De plus si Dξβ (1 − χλ ) n’est pas 0, c’est que |ξ| ≤ R/λ et donc : ((1 + |ξ|)λ)|β| ≤ (R + 1)|β| donc finalement |λ−k (1 + |ξ|)|β|−k Dξβ (1 − χλ )| ≤ Cβ (λ(1 + |ξ|))−k (λ(1 + |ξ|))|β| ≤ Cβ Rk (R + 1)|β| et le lemme est prouvé. Lemme 2.2.8. : Soit (Fk )k≥1 une suite décroissante d’espaces de Fréchet (i.e. Fk+1 ⊆ Fk et la topologie de Fk+1 est plus fine que celle induite par la topologie de Fk sur Fk+1 ). Pour tout k de vecteurs de Fk tendant vers 0. Alors il existe une suite (mk )k≥1 on se donne une suite (am k )m≥1 P k telle que pour tout N , la série k≥N am k converge dans Fn . Démonstration : On se donne pk,l une suite fondamentale de semi-normes sur Fk (= famille dénombrable séparante de semi-normes induisant une topologie d’espace complet sur Fk ). Quitte à remplacer pk,l par : sup pk0 ,l0 k0 ≤k l0 ≤l on peut supposer pk,l ≤ pk,l+1 et pk,l ≤ pk+1,l . Comme chaque suite am k tend vers 0 quand m tend −k k vers +∞, on peut choisir une suite (mk )k≥1 croissante telle que pk,k (am k ) ≤ 2 . Avec ce choix, pour tout N entier et l ≤ k on a : −k k pN,l (am k )≤2 P k donc pour tout l ≥ 0 la série k≥N pN,l (am k ) est convergente. Par définition de la topologie d’espace de Fréchet de FN , on a la convergence voulue. Théorème 2.2.9. : Soit (mj )j≥0 une suite de réels tendant vers −∞, et (aj )j≥0 une suite de mj . Alors il existe un symbole a ∈ S maxj≥0 mj , univoquement symboles telle que pour tout j, aj ∈ SP déterminé modulo S −∞ , tel que a ∼ +∞ j=0 aj . Démonstration : Quitte à regrouper des termes, on peut supposer que ak ∈ S −k pour k ≥ 1. On pose : am k = (1 − χ1/m )ak −k+1 quand où χ1/m est définie comme dans le lemme 2.2.7. ; il est clair que am k tend vers 0 dans S m tend vers +∞, car (1 − χ1/m ) tend vers 0 dans S 1 d’après ce même lemme. 14 D’après 2.2.8. nous pouvons donc choisir une suite (mk )k≥1 telle que pour tout N ≥ 1 P le lemme k converge dans S −N +1 . On pose alors : la série k≥N am k a= +∞ X k am k k=0 qui est alors un symbole d’ordre au plus le plus grand des mj (clairement S mj ⊆ S maxj≥0 mj ) et vérifie de plus : X m X X m ak k a− ak = (ak k − ak ) + k<N k≥N k<N k − ak = −χ1/mk ak est dans S −∞ pour tout k. Donc a est un est dans S −N +1 puisque am k développement asymptotique des ak et on a prouvé le théorème. Définition 2.2.10. : Soit a ∈ S m . On dit que a est elliptique si |a| & |ξ|m . Un symbole est dit classique s’il admet un développement en somme asymptotique de symboles homogènes aj de degré m − j. 2.3 Intégrales oscillantes La plupart des opérateurs pseudo-différentiels sont définis par des formules du type : Z Z Af (x) = ei<x−y,ξ> a(x, y, ξ)f (y) dydξ Ω×Rn où a est un symbole. On veut donner un sens à ce type d’intégrales (appelées intégrales oscillantes) en remplaçant le terme de phase par des fonctions plus générales. Ce type d’intégrales généralise en quelque sorte la transformée de Fourier. Considérons une intégrale du type : Z eiφ(x,y,ξ) a(x, y, ξ) dξ on impose des conditions sur φ et a permettant de donner un sens à l’intégrale précédente. Définition 2.3.1. : Une fonction de phase est une fonction φ de Ω × Rn dans C satisfaisant les propriétés suivantes : (i) φ est C ∞ sur Ω × (Rn − {0}). (ii) La partie imaginaire de φ est positive. (iii) φ est homogène de degré 1 en ξ. (iv) φ est sans point critique pour ξ 6= 0, ce qui équivaut à dire que les dérivées partielles de φ ne s’annulent jamais simultanément. Exemple 2.3.2. : La fonction φ(x, y, ξ) =< x − y, ξ > est une fonction de phase : elle est C ∞ , à valeurs réelles, homogène de degré 1 en ξ par bilinéarité et sans point critique. Proposition 2.3.3. : Si m < −n, φ fonction de phase sur Ω × Rn , f C ∞ à support compact, on a une application bien définie : S m −→ C Z a 7−→ eiφ(x,ξ) a(x, ξ)f (x) dxdξ Ω×Rn qui est de plus continue en a. Démonstration : On introduit pour la suite la notation suivante : Z Iφ (a) = eiφ(x,ξ) a(x, ξ) dxdξ. 15 Comme a est un symbole de degré m < −n, le contrôle que l’on a sur la valeur absolue de a assure que a est intégrable sur tout compact, donc que f a est intégrable. Par conséquent si on pose : Z Z (1 + |ξ|)m dξ, |f (t)| dt C= Rn Ω on a : |Iφ (f a)| ≤ C sup |(1 + |ξ|)−m a(x, ξ)| x∈suppf ξ∈Rn ce qui prouve la continuité de l’application a −→ Iφ (f a) (majoration par une semi-norme, ici p0,k où Kk est un compact contenant supp f ). On va maintenant prolonger l’application précédente à S ∞ . Pour ce faire, nous aurons besoin de quelques lemmes : Lemme 2.3.4. : Soit φ une fonction de phase sur Ω × Rn . Il existe un opérateur différentiel L à coefficients dans S −1 tel que L(eiφ ) = eiφ . Démonstration : On commence par remarquer que par définition d’une fonction de phase (point (iv)), la fonction v(x, ξ) définie par : n n X X ∂φ 2 ∂φ 2 2 v(x, ξ) = ∂xj + |ξ| ∂ξj j=1 j=1 ne s’annule jamais (sinon on aurait nullité simultanée de toutes les dérivées). Soit alors χ une fonction plateau 3 sur Rn valant 1 sur B(0, 1) et 0 pour ξ de norme plus grande que 2. On pose : n n X X 1 − χ(ξ) ∂ ∂ |ξ|2 L = χ(ξ) + + iv(x, ξ) ∂ξj ∂xj j=1 j=1 et un calcul élémentaire (tout est essentiellement bien tensorisé) donne que L(eiφ ) = eiφ , ce qu’il fallait démontrer. Notons que nous avons introduit la fonction (1 − χ) pour éviter d’avoir à dériver le long de ξ = 0, où la fonction de phase φ n’est plus forcément sans point critique. Lemme 2.3.5. : Soit L un opérateur différentiel de la forme : L= n X n aj (x, ξ) j=1 X ∂ ∂ + bj (x, ξ) + c(x, ξ) ∂ξj ∂xj j=1 où les aj sont dans S 0 ⊇ S −1 , les bj et c dans S −1 , alors la transposée de L est de la même forme, i.e. s’écrit : n n X X ∂ ∂ t + b0j (x, ξ) + c0 (x, ξ) L= a0j (x, ξ) ∂ξj ∂xj j=1 j=1 où les a0j sont dans S0 ⊇ S −1 , les b0j et c0 dans S −1 . De plus t (t L) = L. P P Démonstration : On pose a0j = −aj , b0j = −bj , c0 = c − nj=1 ∂ξj aj − nj=1 ∂xj bj . On vérifie que l’opérateur différentiel associé satisfait les propriétés de t L, donc lui est égal. De plus, il est évident avec ces formules que t (t L) = L. Cette formule montre également, en utilisant les propriétés de dérivation de symboles, que t L définit une application linéaire continue S m −→ S m−1 . Proposition 2.3.6. : Soient φ une fonction de phase et f une fonction C ∞ à support compact. 3. donc, par définition, C ∞ à support compact. 16 L’application S m −→ C, a 7−→ Iφ (f a) admet un prolongement continu à S ∞ := S Sm. Démonstration : D’après le lemme 2.3.4. il existe un opérateur différentiel L qui fixe eiφ . On peut donc écrire : Z Z Iφ (af ) = eiφ(x,ξ) a(x, ξ)f (x) dxdξ N Z ZΩ×R = Leiφ(x,ξ) a(x, ξ)f (x) dxdξ Ω×RN = < Leiφ , af > = < eiφ ,t Laf > = Iφ (t Laf ) et par une récurrence immédiate, pour tout M ∈ N, on a : Iφ (af ) = Iφ (t LM af ). D’après le lemme 2.3.5., l’opérateur t L (à coefficients dans S −1 ) définit une application continue : t L : S m −→ S m−1 . De façon similaire on a pour tout M une application continue : t M L : S m −→ S m−M et on a vu (proposition 2.3.3.) que si m − M < −n, l’application précédente est bien définie. On peut donc choisir M tel que m − M < −n ce qui permet de définir le prolongement. Remarquons qu’il n’y a pas de choix privilégié de M , puisque l’intégration par parties formelle est valable pour tout m − M < −n, ce qui justifie notre calcul. On peut donc poser la définition suivante : Définition 2.3.7. : Soit a ∈ S ∞ (Ω × Rn ) et f une fonction C ∞ à support compact. On appelle intégrale oscillante l’expression 4 : Z Z eiφ(x,ξ) a(x, ξ)f (x) dxdξ Ω×Rn dont le sens est donné par la proposition précédente : Z Z Z Z iφ(x,ξ) e a(x, ξ)f (x) dxdξ = Ω×Rn eiφ(x,ξ)t LM (a(x, ξ)f (x)) dxdξ Ω×Rn qui a un sens dès que m − M < −n. Notons que l’on pourrait également définir l’intégrale oscillante par densité des symboles à support compact, un peu comme on procède pour définir la valeur principale de 1/x 5 . Ainsi, si χ est une fonction plateau (donc C ∞ ) qui vaut 1 sur B(0, 1) et est nulle sur le complémentaire de B(0, 2), alors on définit une distribution u par : Z Z < u, ψ >= lim eiφ(x,ξ) χ(εξ)a(x, ξ)ψ(x) dxdξ. ε→0 Ω×Rn 4. C’est bien sûr un abus de notation ; l’expression n’a généralement pas de sens en tant qu’intégrale. En toute rigueur, il faudrait noter une intégrale oscillante par des intégrales tildées par exemple. 5. On rappelle que : Z φ(ξ) < vp(1/x), φ >= lim dξ. ε→0 |ξ|≥ε ξ En utilisant le théorème des accroissements finis on remarque que l’intégrale est bien définie pour φ à support compact (on majore par l’intégrale du sup de la dérivée sur le support de φ). Donc la distribution est bien définie. 17 La fonction intégrée est à support compact pour tout ε > 0 donc on n’a pas de problème de définition à ε > 0 fixé. Que se passe-t-il quand ε se rapproche de zéro ? On remarque que si a ∈ S m et que m < −n alors comme précédemment l’intégrale converge uniformément, et converge donc vers l’intégrale (bien définie, comme précédemment) : Z Z eiφ(x,ξ) a(x, ξ)ψ(x) dxdξ. Ω×Rn Nous devons donc nous intéresser au comportement de l’intégrale oscillante pour m ≥ −n. Si L est un opérateur comme dans le lemme 2.3.4., on peut écrire : Z Z < u, ψ >= lim eiφ(x,ξ) (t L)M (χ(εξ)a(x, ξ)ψ(x)) dxdξ. ε→0 Ω×Rn Comme on s’intéresse au comportement de l’intégrale quand ε → 0, sans restreindre la généralité on peut supposer que ε appartient à un certain compact fixe, et on a donc une majoration du type : |Dξα χ(εξ)| . (1 + |ξ|)−|α| . Le point clé est que ce contrôle est uniforme en ε, et comme précédemment on en déduit, en utilisant la forme de (t L)M , que l’intégrale converge uniformément en ε vers : Z Z eiφ(x,ξ) (t L)M a(x, ξ)ψ(x) dxdξ, Ω×Rn donc les deux approches sont équivalentes et fournissent la même définition des intégrales oscillantes. On a ici fait un raisonnement classique d’analyse fonctionnelle, à savoir que partant d’une fonction bien définie sur un sous-espace dense d’un espace de Fréchet (ici les fonctions de C ∞ (Ω × Rn ) à support compact en ξ dans S ∞ , cf. la proposition 2.2.5.), on a construit un prolongement. Par exemple, l’intégrale oscillante (2π) −n Z ei<x,ξ> dξ Rn est la distribution de Dirac δ0 . Les intégrales oscillantes se comportent presque en tout point comme des intégrales classiques ; par exemple, on a (voir [BAH] pour des énoncés précis) des théorèmes très similaires au théorème de Leibniz (dérivation d’une intégrale oscillante) ou au théorème de convergence dominée. A présent que nous pouvons voir les intégrales oscillantes comme des distributions, il est naturel de s’intéresser à leurs singularités. On définit tout d’abord le support singulier d’une distribution : Définition 2.3.10. : Soit u ∈ D0 (Ω), et x0 ∈ Ω. On dit que u est C ∞ au voisinage de x0 s’il existe un ouvert ω contenant x0 tel que la restriction de u à ω soit une fonction C ∞ . On définit alors par négation le support singulier de u comme étant l’ensemble (fermé dans Ω) des points de Ω au voisinage desquels u n’est pas C ∞ . On notera supp sing u le support singulier de u. La proposition suivante découle du théorème de partition de l’unité : Proposition 2.3.11. : Soit u ∈ D0 (Ω), la distribution u restreinte au complémentaire de supp sing u est une fonction C ∞ . On peut maintenant énoncer une proposition qui préfigure les méthodes de phase stationnaire (parfois appelée méthode WKB 6 ), qui dit heuristiquement que si la phase oscille près de x alors 6. Pour Wentzel, Kramers, Brillouin. 18 pour ξ grand les oscillations se compensent et il n’y a pas de singularité. Proposition 2.3.12. : Si on pose : Z eiφ(x,ξ) a(x, ξ) dξ u= Rn alors supp sing (u) ⊆ {x ∈ Ω tels qu’il existe ξ tel que (x, ξ) ∈ supp(a) et dξ φ(x, ξ) = 0}. Démonstration : Supposons que pour tout ξ, dξ φ(x0 , ξ) 6= 0. Alors en multipliant par une fonction plateau Φ dont le support est suffisamment proche de x0 , on a : Z eiφ(x,ξ) b(x, ξ) dξ Φu = Rn où b est un symbole sur le support duquel la différentielle de φ selon ξ ne s’annule pas. Comme précédemment on peut introduire : M = |dξ φ|−2 n X ∂φ ∂ ∂ξj ∂ξj j=1 qui est un opérateur non singulier sur le support de b et vérifie M eiφ = eiφ (calcul bien tensorisé). Donc si f ∈ D(Ω) on a : Z Z < Φu, f >= lim eiφ(x,ξ) (t M )r (b(x, ξ)χ(εξ))f (x) dξdx ε→0 Ω×Rn où χ désigne comme d’habitude une fonction plateau nulle en dehors en B(0, 2). De même que dans un calcul précédent l’intégrale converge uniformément et : Z Φu = (t M )r eiφ(x,ξ) b(x, ξ) dξ Rn et comme (t M )r b(x, ξ) est un symbole d’ordre m − r, et que notre calcul est valable pour tout r, il en résulte que Φu est indéfiniment dérivable. On obtient donc l’inclusion souhaitée. 2.4 Opérateurs pseudo-différentiels L’objectif de ce paragraphe est de donner les principaux résultats sur les opérateurs pseudodifférentiels, en utilisant les sections précédentes sur les symboles et les intégrales oscillantes. Définition 2.4.1. : Un opérateur pseudo-différentiel A d’ordre m est donné par une relation du type : Z −n i<x−y,ξ> D(Ω) 3 u 7−→ Au : x 7−→ (2π) e a(x, y, ξ)u(y) dydξ Ω×Rn où a ∈ S m (Ω × Ω, Rn ). Dans la suite, on désigne parSΨm (Rn ) (Ψm s’il n’y a pas de risque de confusion) l’espace de ces opérateurs. On note Ψ∞ := Ψm . Pour dire que A est associé au symbole a, on notera parfois A = Op a. Définition 2.4.2. : Un opérateur pseudo-différentiel A de noyau de Schwartz KA est dit régularisant si KA est une application C ∞ . Il est dit propre si les projections selon x et y sont propres (i.e. l’image inverse d’un compact est compacte) lorsque restreintes à supp KA , ou de manière équivalente si pour tout compact K ⊆ Ω il existe un autre compact L ⊆ Ω tel que Af = 0 hors de L si f = 0 hors de K, et que Af = 0 dans K si f = 0 dans L. 19 P Un opérateur différentiel (A = |α|≤m aα (x)∂xα ) est un exemple d’opérateur propre (c’est clair car tout opérateur différentiel est local i.e. diminue les supports). On admet le résultat suivant : tout opérateur pseudo-différentiel est égal modulo un opérateur régularisant à un opérateur propre. Comme on néglige généralement l’action des opérateurs régularisants, on s’intéressera essentiellement dans la suite aux opérateurs propres, qui, comme on va vite le constater, ont de bien meilleures propriétés. Les opérateurs pseudo-différentiels ci-avant définis devant agir sur les distributions, on peut commencer par regarder s’ils préservent les fonctions C ∞ ; Proposition 2.4.3. : Si A est un opérateur pseudo-différentiel alors A induit une application continue de D(Rn ) dans l’ensemble des fonctions C ∞ sur Rn . Si A est de plus un opérateur propre, alors l’image de A est incluse dans D(Rn ). Démonstration : A x fixé, l’intégrale oscillante en (y, ξ) définissant Au est bien définie et comme les contrôles sont localement uniformes en x, on obtient une fonction continue de la variable x. On montre par récurrence que Au est indéfiniment dérivable en calculant la dérivée sous forme d’une intégrale oscillante similaire à celle donnant Au. Si de plus A est propre, alors on voit que Au est à support compact. En utilisant les résultats du chapitre 1, paragraphe 4, on peut définir la transposée t A d’un opérateur pseudo-différentiel A par son noyau de Schwartz : Z ei<x−y,ξ> a(x, y, −ξ) dξ. Rn Par transposition, tout opérateur pseudo-différentiel propre induit donc une application de D0 (Rn ) dans lui-même via : < Au, φ >=< u,t Aφ > où les crochets de dualité désignent l’action de D0 (Rn ) sur D(Rn ). L’une des premières propriétés importantes des opérateurs pseudo-différentiels propres est la pseudo-localité. Notons qu’ils ne sont pas locaux (i.e. ne diminuent pas les supports, exemple : opérateur de convolution) en général, contrairement aux opérateurs différentiels. La pseudo-localité se traduit par la proposition suivante : Proposition 2.4.4. : Si A ∈ Ψ∞ alors pour tout u ∈ D0 (Rn ) on a : supp sing Au ⊆ supp sing u. Démonstration : Soit A un opérateur pseudo-différentiel et KA son noyau de Schwartz. Soit u ∈ D0 (Rn ). Soit ε > 0. Il suffit de montrer que les singularités de Au sont dans un ε-voisinage de celles de u. Pour ce faire, on décompose K = K1 + K2 et u = u1 + u2 avec le support de K1 inclus dans {|x − y| < ε/2} et K2 C ∞ , et supp (u1 ) inclus dans un ε/2-voisinage de supp sing u et u2 C ∞ (c’est possible, prendre une fonction plateau sur supp sing u). On a donc : Ku = K1 u1 + K2 u2 + Ku2 . Or supp(K1 u1 ) ⊆ { x tels que |x − y| < ε, y ∈ supp sing u }. Donc K1 u1 est C ∞ ; de même pour Ku2 puisque u2 l’est, et pour K2 u1 car K2 l’est. Donc les singularités de Au sont dans un ε-voisinage de celles de u ce qui fournit le résultat. 20 2.5 Calcul symbolique Cette section compile essentiellement les résultats de [BOU2]. On va montrer que tous les opérateurs pseudo-différentiels de degré m sont de la forme Z −n eix.ξ a(x, ξ)fb(ξ) dξ (2.2) a(x, D)f = (2π) Rn où a est un symbole de degré m. Proposition 2.5.1. : Soit ψ = ψ(x, y, ξ, µ) un symbole de S 0 (Ω × RM × Rn × RM ) tel que ψ = 0 si |y| + |µ|(1 + |ξ|)−1 > 2 et ψ = 1 si |y| + |µ|(1 + |ξ|)−1 < 1. Alors l’application Z eiy.µ ψ(x, y, ξ, µ)a(x, y, ξ, µ) dydµ a −→ J(ψa) = R2M est continue de S m (Ω × RM × Rn × RM ) vers S m (Ω × Rn ), et on a le développement asymptotique : J(ψa) ∼ (2π)M X i−|α| α α! ∂yα ∂µα a(x, y, ξ, µ) |y=µ=0 . Démonstration : La formule de Taylor pour a donne : X a(x, y, ξ, µ) = aα,β (x, ξ) |α|+|β|≤2k y α µβ + r2k (x, y, ξ, µ) α! β! avec r2k (x, y, ξ, µ) = aα,β (x, ξ) = ∂yα ∂µβ a(x, y, ξ, µ) |y=µ=0 Z X (2k)! 1 y α µβ (1 − t)2k−1 ∂yα ∂µβ a(x, ty, ξ, tµ) dt α!β! 0 |α|+|β|=2k où l’intégrale est un symbole d’ordre m − |β|. Par conséquent on peut écrire : J(ψa) = X |α|+|β|<2k 1 aα,β (x, ξ)J(ψy α µβ ) + J(ψr2k ). α!β! En intégrant par parties on remarque que : J(ψy α µβ b) = i|α| J(∂µα ψµβ b) = i|β| J(∂yβ ψy α b). Donc si b ∈ S m−|β| et |α| + |β| = 2k, on a soit |α| ≥ k soit |β| ≥ k donc l’un des deux symboles ∂µα ψµβ b ou ∂yβ ψy α b est de degré plus petit que m − k. Comme de plus ces symboles sont nuls si |y| + |µ|(1 + |ξ|)−1 > 2, un calcul facile montre que J(ψr2k ) est un symbole de degré au plus m + M − k. En particulier J(ψa) ∈ S −∞ si ψa a toutes ses dérivées nulles sur {y = µ = 0}. Pour s’occuper de l’autre terme, on remarque comme précedemment que J(ψy α µβ ) = i|α| J(∂µα ψµβ ) = i|β| J(∂yβ ψy α ). Si α 6= β, alors l’une au moins des deux fonctions ∂µα ψµβ et ∂yβ ψy α est nulle sur le voisinage conique de {y = µ = 0} où ψ = 1, donc J(ψy α µβ ) est bien dans S −∞ . Enfin, si α = β, on a J(ψy α µβ ) = i|α| J(∂yα ψy α ) ∼ i|α| α!J(ψ) car ∂yα ψy α − α!ψ est nul sur le voisinage conique de {y = µ = 0} où ψ = 1. Enfin, on peut calculer un équivalent de J(ψ) (nous ne le ferons pas ici) et voir que J(ψ) ∼ (2π)M . Ceci achève la preuve de la proposition. Théorème 2.5.2. : Soit A ∈ Ψm un opérateur pseudo-différentiel propre. On définit un symbole a de degré m sur (Ω × Rn ) par : a(x, ξ) = e−ix.ξ A(eix.ξ ). 21 Alors A = a(x, D) où a(x, D) désigne l’opérateur différentiel associé à a comme dans (2.2). De plus, si A est de la forme Op b(x, y, ξ), alors on a le développement asymptotique : a(x, ξ) ∼ X i−|α| α α! ∂yα ∂ξα b(x, y, ξ) |x=y . Enfin, le symbole a est univoquement déterminé par A modulo S −∞ . Démonstration : Commençons par montrer que A = a(x, D). En effet, si f est une fonction test sur Ω, alors : Z eix.ξ fb(ξ) dξ. f = (2π)−n Ω Comme A est linéaire continu, en considérant l’intégrale ci-haut comme une intégrale convergente à valeurs dans l’ensemble des fonctions C ∞ sur Ω, on obtient : Z −n A(eix.ξ )fb(ξ) dξ Af = (2π) Ω donc Af = (2π)−n Z a(x, ξ)eix.ξ fb(ξ) dξ Ω donc par définition A = a(x, D). L’idée maintenant est bien sûr d’appliquer la proposition 2.5.1. précédente. Supposons A = Op b. Par propreté de l’opérateur, pour tout compact K ⊆ Ω nous pouvons choisir un compact L ⊆ Ω tel que b(x, y, ξ) = 0 si x ∈ K, y ∈ / L. Alors : Z Z a(x, ξ) = e−x.ξ ei<x−y,µ> b(x, y, µ)eiy.µ dydµ Z Z = ei<x−y,µ−ξ> b(x, y, µ) dydµ et avec les notations précédentes, ceci s’écrit a = (2π)−n J(b(x, x − y, ξ + ν)). On coupe alors l’intégrale en 2 en introduisant une sorte de symbole plateau ρ sur S 0 (R2n ), tel que ρ(ξ, ν) = 1 pour |µ| ≤ 1/3(1 + |ξ|), 0 pour |µ| ≥ 2/3(1 + |ξ|). On pose alors b1 = ρb, b2 = (1 − ρ)b. On peut alors montrer que J(b2 ) ∈ S −∞ . De même, b1 est un symbole de S m (Ω × Ω × R2n ), grâce à des majorations simples sur ρ. Donc si ψ est le symbole de la proposition 2.5.1. on a J(ψb1 ) ∼ J(b1 ). Comme A = a(x, D), on peut appliquer la proposition 2.5.1. qui donne exactement le résultat. Définition 2.5.3. : On appelle la classe de a modulo S −∞ le symbole total de A. Proposition 2.5.4. : Si A ∼ a(x, D), B ∼ b(x, D) sont deux opérateurs pseudo-différentiels de degrés respectifs m et m0 , et que l’un des deux opérateurs est propre, alors A ◦ B est un opérateur pseudo-différentiel de degré m + m0 , et A ◦ B ∼ c(x, D) avec : c(x, ξ) ∼ X i−|α| α α! ∂ξα a(x, ξ)∂xα b(x, ξ). Démonstration : La démonstration étant similaire à celle du théorème 2.5.2. nous renvoyons à [BOU2] pour une preuve détaillée. On introduit maintenant le symbole principal de A. Définition 2.5.5. : Soit A ∈ Ψm . Alors on appelle symbole principal de A et on note σm (A) la classe du symbole totalP de A modulo S m−1 . En particulier quand a(x, ξ) admet un développement asymptotique du type ∞ k=0 am−k (x, ξ) où am−k de degré m − k par rapport à ξ, le symbole principal de A est am (x, ξ). 22 Proposition 2.5.6. : On a le formulaire suivant : (i) σm (A∗ ) = σm (A) où < A∗ f, g >=< f, Ag >. (ii) σm+m0 (A ◦ B) = σm (A)σm0 (B) (iii) σm+m0 −1 ([A, B]) = −i{σm (A), σm0 (B)} où [A, B] = AB − BA est le commutateur de A et B et {f, g} le crochet de Poisson : n X ∂f ∂g ∂f ∂g {f, g} = − . ∂xi ∂ξi ∂ξi ∂xi i=1 Démonstration : Ces formules sont immédiates. Définition 2.5.7. : Un opérateur pseudo-différentiel est dit classique si et seulement si son symbole total l’est (i.e. σm (A) n’est jamais nul). On note Ψm cl l’ensemble des opérateurs pseudo-différentiels classiques. Définition 2.5.8. : Un symbole a de degré m est dit elliptique si |a| & |ξ|m , ou de façon équivalente, s’il existe un symbole b de degré −m tel que ab − 1 ∈ S −∞ . En d’autres termes a ne s’annule pas quand ξ 6= 0. Un opérateur pseudo-différentiel est dit elliptique si et seulement si son symbole total l’est. Exemple 2.5.9. : Le laplacien ∆= n X D xj 2 j=1 a pour symbole principal Pn j=1 ξj 2 et est donc elliptique. Nous admettrons le résultat suivant, qui montre l’existence de paramétrixes pour les opérateurs pseudo-différentiels elliptiques (on trouvera une preuve dans [BOU2] par exemple). Théorème 2.5.10. : Soit A un opérateur pseudo-différentiel elliptique de degré m. Alors il existe un opérateur pseudo-différentiel propre de degré −m B tel que AB ∼ BA ∼ Id (au sens où AB− Id et BA− Id sont régularisants). Illustrons l’utilité des paramétrixes en redémontrant un résultat sur le support singulier ; Théorème 2.5.11. : Soit A un opérateur pseudo-différentiel elliptique propre et f une distribution. Alors f est une fonction C ∞ sur tout ouvert sur lequel Af est C ∞ , i.e. supp sing Af ⊆ supp sing f ; les opérateurs pseudo-différentiels elliptiques propres sont pseudo-locaux. Démonstration : Soit B une paramétrixe propre de A. Alors si g = Bf , on a Ag = ABf = (Id+R)f où R est un opérateur régularisant. Donc Ag−f est C ∞ . D’autre part on a f −BAf ∈ C ∞ . Or si Af est C ∞ , alors BAf aussi (proposition 2.4.3.) ; donc si Af est C ∞ , comme f = BAf + h où h C ∞ , f est aussi C ∞ , ce que l’on voulait démontrer. 23 Chapitre 3 Introduction à l’analyse microlocale 3.1 L’idée directrice de l’analyse microlocale Soit f une fonction de Rn à valeurs dans R. En analyse classique (celle que l’on fait depuis le lycée), on a pris l’habitude de s’intéresser au comportement de la fonction uniquement en termes de sa variable x ∈ Rn ; typiquement, on dit qu’une fonction f est dérivable en x0 , analytique au voisinage de x0 , qu’elle possède une singularité en x0 ... Cependant, l’information contenue dans ce type de constatations est limitée. Ainsi, le fait de dire que f possède une singularité en x0 ne nous apprend rien sur la manière dont se comporte cette singularité. L’idée naturelle est par conséquent de coder ce nouveau type d’informations avec une nouvelle variable, que nous noterons ξ. Ainsi, l’ensemble des singularités de la fonction f sera non un sous-ensemble de Rn , comme l’enseigne l’analyse classique, mais un sous-ensemble de Rnx × Rnξ (cet ensemble correspondant à l’espace des phases en physique, au fibré cotangent en géométrie différentielle), où le premier terme du produit cartésien correspond à la variable (habituelle) x, et le second à la codirection ξ. Ainsi une fonction sera lisse en (x0 , ξ0 ) si elle est lisse en x0 dans la codirection ξ0 . L’idée (très féconde) de l’analyse microlocale est de pousser aussi loin que possible l’exploitation de ce constat ; le calcul des opérateurs pseudo-différentiels est local à la fois en x en ξ donc on va chercher à localiser à la fois en x et en ξ (= microlocaliser) plusieurs notions d’analyse. Ainsi, au paragraphe 3, nous raffinerons la notion de support singulier par la notion de front d’onde ; améliorant ainsi l’étude de la propagation des singularités. Il existe cependant au moins une obstruction à cette microlocalisation ; c’est le principe de Heisenberg, dont on peut donner une traduction mathématique approximative en disant qu’il empêche de localiser à la fois en la variable x et en la variable ξ. En général, on se place sur de petits ensembles coniques pour remédier à ce problème. 3.2 Résultats de géométrie symplectique L’introduction de la géométrie symplectique a été largement motivée par la nécessité de donner un formalisme satisfaisant à la mécanique hamiltonienne. Ainsi, pour décrire le mouvement d’un pendule oscillant, on ajoute à sa coordonnée angulaire bien connue sa vitesse angulaire. L’ensemble des valeurs prises par les deux paramètres décrit l’ensemble des états possibles du système, aussi appelé l’espace des phases. Définition 3.2.1. : Un espace vectoriel symplectique (E, σ) est un couple formé d’un espace vectoriel réel et d’une forme bilinéaire alternée non dégénérée. 24 Proposition 3.2.2. : La dimension d’un espace vectoriel symplectique est paire ; de surcroı̂t il existe une base de E dans laquelle la matrice de σ est donnée par : 0 −In . In 0 Définition 3.2.3. : Une variété symplectique consiste en la donnée d’une variété différentielle V et d’une 2-forme différentielle fermée non dégénérée ω. Exemples 3.2.4. : Les exemples classiques sont : (i) (R2n , σ), un espace vectoriel symplectique. (ii) Le fibré cotangent (T ∗ (X), dλ) où λ est la 1-forme différentielle canonique. (iii) Les surfaces orientables. (iv) Les variétés kählériennes... Définition 3.2.5. : Soit V une variété différentielle. Un champ de vecteurs sur V est une section du fibré tangent (union disjointe des espaces tangents) de la variété. Définition 3.2.6. : Soit f ∈ C ∞ (V ). Le hamiltonien de f , noté Hf , est le champ de vecteurs défini par l’identité : ι(Hf )ω = −df où ι(Hf )ω désigne le produit intérieur d’un champ de vecteurs par une forme différentielle. Si g est un autre élément de C ∞ (V ), on définit le crochet de Poisson de f et g par : {f, g} =< ω, Hf ∧ Hg > où ∧ désigne le produit extérieur. La fermeture de ω implique que le crochet de Poisson vérifie la relation de Jacobi : {f, {g, h}} + {g, {h, f }} + {h, {f, g}} = 0. Définition 3.2.7. : Soient (V1 , ω1 ) et (V2 , ω2 ) deux variétés symplectiques, et χ une application de V1 dans V2 . On dit que χ est un symplectomorphisme si c’est un C ∞ difféomorphisme préservant les crochets de Poisson. Le théorème fondamental de la géométrie symplectique est le suivant, qui permet, au moins localement, de toujours se ramener au cas (R2n , σ) 1 , on travaillera donc par la suite essentiellement localement où la plupart des objets dont on aura besoin auront des expressions explicites maniables dans un système de coordonnées. Théorème 3.2.8. : (Théorème de Darboux) Une variété symplectique (V, ω) est localement symplectomorphe à (R2n , σ). On peut donc se fixer un système de coordonnées, dans lequel un champ de vecteurs est donné par une expression du style : n X ∂ X(x) = aj (x) . ∂xj j=1 On définit les courbes intégrales de ce champ de vecteur comme étant les solutions maximales de l’équation différentielle : γ 0 = X(γ). (3.1) 1. On ne définira donc pas rigoureusement ici les opérateurs pseudo-différentiels sur les variétés ; voir les derniers chapitres de [JOS] pour plus de détails. 25 Les courbes intégrales satisfont la propriété suivante : en chaque point, le vecteur tangent à la courbe intégrale est donné par le champ en ce point. On définit enfin le flot d’un champ de vecteurs comme étant le flot de l’équation différentielle (3.1), c’est-à-dire l’application (t, m) 7−→ Φ(t, m), où Φ(., m) est une solution maximale du problème de Cauchy γ 0 = X(γ), γ(0) = m. Dans le système de coordonnées canoniques (x1 , ...xn , ξ1 , ...ξn ), la forme différentielle ω a pour forme : n X ω= dxi ∧ dξi i=1 et donc le champ hamiltonien sur Rnx × Rnξ s’écrit : n X ∂p ∂ ∂p ∂ − Hp = ∂xj ∂ξj ∂ξj ∂xj j=1 et le crochet de Poisson de f et g deux fonctions de l’espace des phases (= espace des observables) est donné dans le système de coordonnées canoniques par : n X ∂f ∂g ∂f ∂g − . {f, g} = ∂xi ∂ξi ∂ξi ∂xi i=1 Il est évident que le crochet de Poisson de f avec elle-même est nul (on suppose que f est assez différentiable pour vérifier le lemme de Schwarz 2 ). 3.3 Le front d’onde On commence par quelques rappels sur le support singulier : Définition 3.3.1. : Soit u ∈ S 0 (Ω). Le support singulier (défini par négation) de u est le complémentaire de l’union des ouverts O ⊆ Ω tels que la restriction de u à O soit une fonction C ∞ . Encore une fois, c’est un fermé. Proposition 3.3.2. : Soit u une distribution tempérée. La distribution u restreinte au complémentaire du support singulier de u est une fonction C ∞ . Le support singulier d’une distribution u est donc l’ensemble des points où u ne se comporte pas comme une fonction de l’analyse classique. Comme annoncé, cette notion peut être raffinée avec l’idée de microlocalisation décrite précédemment. L’idée est d’attacher à une distribution un nouveau type de support, détectant le lieu des singularités de la distribution, mais dans l’espace de dimension 2n. C’est le front d’onde. Mais avant d’en arriver au front d’onde, on pose quelques définitions : Définition 3.3.3. : Soit X un sous-ensemble de Rn × (Rn − {0}). On dit que X est conique si pour tout t > 0 on a : (x, ξ) ∈ X =⇒ (x, tξ) ∈ X. Ce qui correspond bien entendu à la notion habituelle d’un cône dans R3 . Définition 3.3.4. : Soit u ∈ S 0 (Rn ) à support contenu dans un ouvert Ω. On dit que u est microlocalement de classe C ∞ en un point (x0 , ξ0 ) ∈ Rn × (Rn − {0}) s’il existe un ouvert ω ⊆ Rn avec x0 ∈ ω ⊆ Ω et un cône ξ0 ∈ Γ de Rn − {0} tels que : c ∀φ ∈ C0∞ (ω), ∀N, ∀C, ∀ξ ∈ Γ, |φu(ξ)| ≤ C(1 + |ξ|)−N . 2. Le mathématicien polonais Hermann Armandus Schwarz (1843, Hermsdorf - 1921, Berlin), qui a également laissé son nom à l’inégalité de Cauchy-Schwarz, ne doit pas être confondu avec Laurent Schwartz. 26 Cette définition ne prend bien sûr tout son sens qu’à la lumière du théorème de Paley-Wiener (théorème 1.3.12.) qui montre que le caractère C ∞ se reflète sur la transformée de Fourier. Définition 3.3.5. : Soit u une distribution. On appelle front d’onde de u et on note W F (u) 3 l’ensemble des (x, ξ) où u n’est pas microlocalement de classe C ∞ . Proposition 3.3.6. : Le front d’onde est un fermé conique de T ∗ (Ω) ' Ω × Rn . Démonstration : C’est un fermé car son complémentaire est, pratiquement par définition du front d’onde, un ouvert. Il est conique ; soit en effet (x0 , ξ0 ) de Rn × (Rn − {0}) tel que u ne soit pas microlocalement de classe C ∞ au voisinage de (x0 , ξ0 ). S’il existait un t > 0 tel que (x0 , tξ0 ) ne soit pas dans le front d’onde, alors u serait microlocalement de classe C ∞ au voisinage de (x0 , tξ0 ). Mais alors le cône Γ que l’on obtient contient également t/tξ0 et on voit que (x0 , ξ0 ) ne serait pas dans le front d’onde. C’est absurde, d’où le résultat. Donnons quelques exemples de calculs de fronts d’onde avant de continuer : Exemples 3.3.7. : • Dans Rn , le front d’onde de δ est 0 × Rn − {0}. En effet, si x0 6= 0, il suffit de choisir ω contenant x0 et pas 0 pour que les φδ soient nuls, donc à décroissance rapide ; réciproquement, si φ(0) 6= 0, la transformée de Fourier de φδ = φ(0)δ est la constante φ(0) qui n’est pas à décroissance rapide (puisqu’elle ne décroı̂t dans aucune direction...). • Soit 1 ⊗ δ la distribution définie dans le plan par : Z < 1 ⊗ δ, φ >= φ(x, 0) dx. R Il est évident que 1 ⊗ δ est bien une distribution. Son front d’onde est donné par l’ensemble des (x1 , x2 , ξ1 , ξ2 ) tels que x2 = ξ1 = 0. En effet, on calcule : Z c 1 , ξ2 ) = φu(ξ e−ix1 .ξ1 φ(x1 , 0) dx1 R et un calcul simple donne le résultat (on vérifie que la fonction de (ξ1 , ξ2 ) obtenue n’est à décroissance rapide dans un cône que si (0, ±1) ne sont pas adhérents à ce cône). • La distribution associée à l’indicatrice du demi-plan supérieur (fonction localement intégrable) a le même front d’onde que la distribution précédente (géométriquement, c’est évident ; sinon, un petit calcul donne le résultat). Le théorème suivant montre que le front d’onde contient toute l’information contenue dans le support singulier (c’en est donc un raffinement). Théorème 3.3.8. : La projection sur Ω de W F (u) est supp sing u. Démonstration : Ceci résulte quasiment directement de la définition. Si x0 ∈ / supp sing u, la c fonction φu est à décroissance rapide dans toutes les directions dès que le support de φ est assez proche de x0 , donc aucun (x0 , ξ0 ) n’est dans le front d’onde. Réciproquement, si aucun (x0 , ξ0 ) n’est dans le front d’onde , on peut pour tout ξ0 trouver un ouvert ω contenant x0 et un cône Γ contenant ξ0 tels que : c ∀φ ∈ C0∞ (ω), ∀N, ∀C, ∀ξ ∈ Γ, |φu(ξ)| ≤ C(1 + |ξ|)−N . On utilise alors le fait que les cônes x0 recouvrent la sphère de Rn , qui est compacte car Rn est de dimension finie. D’après le théorème de Borel-Lebesgue, on peut donc trouver un certain ensemble J fini de couples (ωj , Γj ) tels que les cônes Γj recouvrent la sphère unité. Soit alors φ une fonction 3. WF pour wave front. 27 c est alors C ∞ à support compact dans l’union des ωj . Par choix des couples (ωj , Γj ), la fonction φu à décroissance rapide. Ce qui, d’après le théorème de Paley-Wiener, nous assure que u est C ∞ au voisinage de x0 , et démontre le théorème. De même que la notion de support se généralise des fonctions aux distributions, on va maintenant définir le front d’onde d’un opérateur pseudo-différentiel. Définition 3.3.9. : Soit A ∈ Ψm , et a(x, ξ) son symbole total. Alors on définit le front d’onde (ou micro-support 4 ) de A, noté W F (A), comme étant le complémentaire de l’ensemble des points (x, ξ) tels qu’il existe un voisinage de x et un voisinage conique de ξ sur lequel on a pour tout N : |a(x, ξ)| . (1 + |ξ|)−N . Par construction, W F (A) détecte les directions dans lesquelles A n’élimine pas les singularités. Il est clair que W F (AB) ⊆ W F (A) ∩ W F (B). Définition 3.3.10. : Un opérateur A ∈ Ψm est dit micro-elliptique en (x, ξ) si σm (x, ξ) 6= 0. Proposition 3.3.11. : Un opérateur A ∈ Ψm est micro-elliptique en (x, ξ) si et seulement s’il existe B ∈ Ψ−m cl tel que (x, ξ) n’appartienne ni à W F (AB − Id) ni à W F (BA − Id). On dit que B est une micro-paramétrixe de A. Démonstration : Similaire à la preuve de l’existence d’une paramétrixe pour un opérateur elliptique ; nous l’admettons. Définition 3.3.12. : Soit A ∈ Ψm cl . On appelle variété caractéristique de A et on note char(A) l’ensemble : char(A) = σm (A)−1 (0). Théorème 3.3.13. : Si u ∈ D0 (Rn ), alors : W F (u) = \ char(A). Au∈C ∞ Démonstration : Supposons que (x0 , ξ0 ) n’appartienne pas au front d’onde de u, alors il existe c soit à décroissance rapide dans la direction ξ0 donc en choisissant ψ ∈ C ∞ (S n−1 ) φ telle que φu telle que : ξ0 ψ 6= 0 |ξ0 | c à décroissance rapide dans toutes les directions dans supp ψ, on peut choisir un opérateur et φu pseudo-différentiel A de symbole total ξ . φ(y)ψ |ξ| Un tel opérateur vérifie clairement Au ∈ C ∞ et (x0 , ξ0 ) ∈ / W F (Au). D’où l’inclusion dans un sens. Dans l’autre sens, on suppose A micro-elliptique en (x0 , ξ0 ) et Au ∈ C ∞ , de sorte qu’en appliquant une micro-paramétrixe B pour A en (x0 , ξ0 ) on a : u + Bu ∈ C ∞ et (x0 , ξ0 ) ∈ / W F (B). Soient φ, ψ des fonctions plateau telles que : ξ ξ0 supp φ(x − x0 )ψ − ∩ W F (B) = ∅. |ξ| |ξ0 | 4. Il existe un lien entre le micro-support de A et le front d’onde de son noyau de Schwartz, sur lequel nous n’insisterons pas ici, voir par exemple [BOU2]. 28 Soit alors S de symbole total φ(y − x0 )ψ ξ ξ0 − |ξ| |ξ0 | alors S est tel que W F (S) ∩ W F (B) = ∅ donc Su ∈ C ∞ par pseudo-localité de S. Ce qui signifie exactement que (x0 , ξ0 ) ∈ / W F (u), ce qu’il fallait démontrer. 3.4 Propagation des singularités La théorie de la propagation des singularités étudie dans quelle mesure le front d’onde d’une solution à une équation aux dérivées partielles à un temps t est déterminé par le front d’onde initial. En physique, le principe de Huygens est un résultat sur la propagation des singularités : en dimension d’espace-temps paire, la solution élémentaire de l’équation des ondes a pour support le bord du cône du futur 5 . La théorie générale est très riche et bien développée quand les équations sont linéaires. Les résultats que l’on va énoncer par la suite sont ceux qui ont marqué l’apparition du front d’onde en mathématiques. 0 n Théorème 3.4.1. : Soit A ∈ Ψm cl un opérateur différentiel classique propre. Soit u ∈ D (R ). Alors : W F (Au) ⊆ W F (u) ∩ W F (A). Ce théorème dit que les opérateurs pseudo-différentiels sont micro-locaux (condition plus forte que la pseudo-localité, qui porte sur le support singulier, mais moins forte que la localité, qui porte sur le support). De plus, on a : W F (u) ⊆ W F (Au) ∪ char(A). Démonstration : Si (x0 , ξ0 ) ∈ / W F (u), alors il existe B 0 micro-elliptique en (x0 , ξ0 ) tel que B 0 u ∞ 00 soit C . Soit B une micro-paramétrixe de B 0 en (x0 , ξ0 ). Si B = B 00 B 0 on a Bu ∈ C ∞ et de plus le symbole total de B est constant égal à 1 près de (x0 , ξ0 ), c’est-à-dire que B = Id + R avec (x0 , ξ0 ) ∈ / W F (R). Donc ABu est C ∞ et de plus BAu = ABu + [B, A]u. Mais comme (x0 , ξ0 ) ∈ / W F ([B, A]) (car [B, A] = (Id + R)A − A(Id + R) = RA − AR) on peut choisir S microelliptique en (x0 , ξ0 ) tel que W F (S) ∩ W F (R) = ∅ et dans ce cas SBAu ∈ C ∞ . Comme SB est micro-elliptique en (x0 , ξ0 ), le résultat suit. La réciproque est plus simple. Si (x0 , ξ0 ) ∈ / W F (A), on peut simplement prendre S microelliptique en (x0 , ξ0 ) tel que W F (SA) ⊆ W F (A) ∩ W F (S) = ∅ donc SA est dans ψ −∞ . Ceci implique que SAu ∈ C ∞ , et notre résultat. Pour démontrer l’autre résultat, on utilise encore la micro-ellipticité. Si (x0 , ξ0 ) n’appartient pas à W F (Au) ∪ char(A), alors A est (définition de la variété caractéristique) elliptique en (x0 , ξ0 ) et (x0 , ξ0 ) n’est pas dans le front d’onde de Au. Soit B une micro-paramétrixe de A au voisinage de (x0 , ξ0 ). Il est clair que (x0 , ξ0 ) ∈ / W F (BAu). Mais BAu = u + Ru avec (x0 , ξ0 ) ∈ / W F (R), donc (x0 , ξ0 ) ∈ / W F (Ru). Donc (x0 , ξ0 ) ∈ / W F (u), ce que nous voulions prouver. Nous avons donc montré que si Au est C ∞ alors le front d’onde de u est inclus dans la variété caractéristique de A. La question naturelle que l’on se pose alors est : quels sous-ensembles de la variété caractéristique sont possibles ? La réponse, due à Hörmander, est que le front d’onde de u s’écrit comme union de courbes intégrales du hamiltonien du symbole principal de A 6 . 5. C’est faux en dimension impaire, ainsi les ondes planes ne vérifient pas le principe de Huygens. 6. Notons que Hörmander avait en réalité démontré bien plus ; il avait démontré que tout sous-ensemble fermé de la variété caractéristique pouvant s’écrire comme union de courbes intégrales était possible. Nous ne démontrerons pas ce résultat profond. 29 Théorème 3.4.2. : Soit A un opérateur pseudo-différentiel classique propre de symbole réel, et soit u ∈ D0 (Rn ) tel que Au soit C ∞ . Alors W F (u) est union de courbes intégrales du hamiltonien de σm (A). Démonstration : Avant de donner la démonstration, quelques remarques. On a sur le cotangent un champ de vecteurs, donné par le hamiltonien du symbole principal de A. L’idée géométrique du théorème est que si un point du cotangent n’est pas dans le front d’onde, alors si on suit la courbe intégrale du hamiltonien en ce point on restera hors du front d’onde. De même si un point est dans le front d’onde, les autres points de la courbe intégrale du hamiltonien associée y seront également. Il y a en gros deux méthodes pour prouver ce résultat. La première consiste à développer la théorie des opérateurs Fourier intégraux (en gros, opérateurs pseudo-différentiels pour lesquels la phase n’est pas forcément linéaire) et à se ramener au cas où A = Dx1 , auquel cas le résultat est pratiquement évident. La seconde (et c’est celle que nous adopterons ici) consiste à utiliser les commutateurs, combinés avec le calcul symbolique développé ci-avant. La preuve est assez longue et nous admettrons un point délicat d’analyse fonctionnelle. Avant de commencer on note que comme Hσm (A) σm (A) = 0 donc que σm (A) est constant le long des courbes intégrales du hamiltonien de A ; en particulier la variété caractéristique est invariante sous le flot du champ hamiltonien. Les courbes intégrales incluses dans la variété caractéristique sont appelées les bicaractéristiques ; la variété caractéristique est donc une union de bicaractéristique. Pour plus de commodité on note désormais am = σm (A). Si B est un opérateur différentiel elliptique d’ordre 1 − m, alors W F (BAu) = W F (u) et si B a pour symbole principal b alors Hbam = bHam + am Hb . Donc si on est dans la variété caractéristique (i.e. si am = 0) alors Hbam = bHam est un multiple non nul de Ham donc aura les mêmes courbes intégrales. Il nous suffit par conséquent de prouver le théorème pour un opérateur A d’ordre 1. Comme le front d’onde est un fermé il nous suffit, par connexité, de montrer que si un point est dans le front d’onde alors au voisinage de ce point on reste sur la bicaractéristique passant par ce point. On se ramène donc à une preuve locale. Soit x0 un point et φ une fonction plateau valant 1 au voisinage de x0 , et ψ une autre fonction plateau valant 1 au voisinage de x0 et dont le support est contenu dans l’ensemble des points où φ vaut 1. Alors si Au est C ∞ , ψA(φu) l’est également. Comme ψA(φu) a un noyau à support compact et les mêmes bicaractéristiques que A au voisinage de x0 , on se ramène au cas où A a un noyau à support compact. D’après les résultats de calcul symbolique du chapitre 2, le symbole principal de [A, B] (A d’ordre m, B d’ordre m0 ) est donné par −iHam bm0 . Considérons alors l’opérateur Dt − A. Si (x0 , ξ0 ) n’est pas dans le front d’onde de u, alors il existe un opérateur classique d’ordre 0 B 0 , micro-elliptique en (x0 , ξ0 ), tel que B 0 u soit C ∞ . On cherche une famille B(t, x, Dx ) d’opérateurs qui soient pseudo-différentiels pour tout t, dont le symbole total varie de façon lisse en t, qui commutent avec Dt − A et qui vérifient B 0 (x, Dx ) = B(0, x, Dx ). On en déduit que (Dt − A)(Bu) est C ∞ et que Qu|t=0 l’est également. Il existe un théorème (que nous admettrons) qui garantit qu’alors pour tout t, Bu est C ∞ . En d’autres termes, W F (u) ⊆ {b0 (t, x, ξ) = 0} pour tout t. Soit γ(x0 ,ξ0 ) (t) la bicaractéristique passant en (x0 , ξ0 ). On va montrer que b0 (t, γ(x0 ,ξ0 ) (t)) est nul si et seulement si b0 (0, x0 , ξ0 ) l’est, ce qui prouvera le théorème (modulo le théorème de régularité, cf. [JOS]). Pour construire B, on remarque que le symbole principal de [Dt − A, B] est : ∂b0 − Ha1 b0 ∂t et on veut que cette quantité soit nulle et que b0 (0, x, ξ) = b(x, ξ). Ce n’est jamais qu’une équation aux dérivées partielles linéaire du premier ordre que l’on résout en fixant b le long des courbes intégrales de (1, Hp1 ), qui sont de la forme (t, γ(−t)) où γ(t) est une courbe intégrale de Ha1 . Donc b est soit nul soit non nul le long des courbes intégrales ce qui est le résultat attendu. Pour construire les termes d’ordre inférieur, on procède par récurrence ; si on a construit tous les termes jusqu’à un certain ordre, le terme suivant du développement asymptotique sera donné 30 par quelque chose comme : ∂b−j − Ha1 b−j = fonction des termes d’ordre supérieur (connus) ∂t que nous pouvons donc résoudre. En sommant asymptotiquement on obtient B commutant avec Dt − A à des termes lisses près ce qui prouve le résultat. On peut même raffiner un peu. Posons Au = f ; si f est C ∞ , alors on a le résultat suivant, que nous admettrons : Théorème 3.4.3. : Soit A un opérateur pseudo-différentiel d’ordre m, dont le symbole principal est à valeurs réelles. Soit q = |ξ|−1 am (x, ξ) et Hq le champ hamiltonien appliqué. Alors W F (u) \ W F (f ) est inclus dans la variété caractéristique de A et est invariant par le champ hamiltonien engendré par Hq dans T ∗ (Ω) \ W F (f ). 3.5 Opérateurs non localement résolubles On va parler dans cette section d’opérateurs non localement résolubles, même dans l’espace des distributions 7 . La découverte de tels opérateurs fut un véritable choc pour les analystes des années 1950, car on n’avait pas alors de bonne explication géométrique de l’existence d’opérateurs comme ceux que l’on va décrire par la suite, qui bien que tout à fait naturels et d’aspect assez peu exotique, n’étaient pas localement résolubles. Le premier opérateur de ce type à être exhibé (en 1957) fut l’opérateur de Hans Lewy, qui est le champ de vecteurs ainsi défini : L0 = ∂ ∂ ∂ +i + i(x1 + ix2 ) . ∂x1 ∂x2 ∂x3 Il existe des fonctions f C ∞ telles que L0 u = f n’ait pas de solution, même locales, même dans l’espace des distributions. Le plus choquant est que cet opérateur a une expression simple (métamathématique) et possède de plus une interprétation naturelle (équation de Cauchy-Riemann sur le bord du domaine pseudo-convexe {(z1 , z2 ) ∈ C2 , |z1 |2 + 2Im(z2 ) < 0}). Pire encore, ce champ de vecteurs ne s’annule pas, donc ne pâtit pas des pathologies habituelles pour les opérateurs à caractéristique multiple. En 1960, Lars Hörmander exhibe les conditions géométriques de non-résolubilité liées au contreexemple de Lewy ; soit P un opérateur différentiel de symbole principal p, s’il existe un point (x, ξ) tel que p(x, ξ) = 0 et {Rep, Imp}(x, ξ) > 0, alors P est non localement résoluble au voisinage de x. On calcule facilement le symbole principal de L0 , et on trouve l0 (x, ξ) = iξ1 − ξ2 − (x1 + ix2 )ξ3 donc Re(l0 ) = −ξ2 − x1 ξ3 , Im(l0 ) = ξ1 − x2 ξ3 . On a donc : 3 X ∂f ∂g ∂f ∂g {Re(l0 ), Im(l0 )} = − ∂xi ∂ξi ∂ξi ∂xi i=1 et un calcul facile donne l0 (x, ξ) = −2ξ3 . Donc la condition est satisfaite ; pour tout x, il existe un point du cotangent (x1 , x2 , x3 , ξ1 , ξ2 , ξ3 ) tel que le symbole principal soit nul et le crochet de Poisson des parties réelles et imaginaires soit strictement positif. Ceci nous donne une condition nécessaire de locale résolubilité. Bien sûr cette condition est loin d’être suffisante. On peut considérer par exemple l’opérateur de type Mizohata : M3 = Dt + it3 Dx . 7. Cette partie s’inspire très largement de l’article [LER], qui va beaucoup plus loin dans la description de cette riche théorie. 31 On peut démontrer qu’il n’est pas localement résoluble. Cependant, il est assez facile de vérifier que si p(x, ξ) = 0 alors {Rep, Imp}(x, ξ) ≤ 0. Par contre, l’opérateur : M1 = Dt + itDx satisfait la condition de non-résolubilité précédente. En fait, il existe une condition nécessaire et suffisante de résolubilité locale, qui fut conjecturée par Louis Nirenberg et François Trèves en 1971. Cette condition, connue sous le nom de condition (ψ), est la suivante. SoitPP un opérateur de type principal, par exemple dξ p 6= 0 (la vraie définition est dp ∧ α 6= 0, où α = ξj dxj ). La condition (φ) s’énonce comme suit : Pour tout z ∈ C, Im(zp) ne change pas de signe de − à + le long des bicaractéristiques orientées de Re(zp). Il serait impossible de ne serait-ce qu’esquisser les idées d’une preuve ici. On se contentera donc de savoir que c’est en 2004 que Nils Dencker a établi la conjecture de Trèves-Nirenberg, parachevant ainsi un travail qui s’étale sur près de cinquante ans (de Hörmander (1960) à Dencker (2004) en passant par Beals et Fefferman (qui démontrent la conjecture pour les opérateurs différentiels), Trépreau (la condition (φ) implique la résolubilité pour les opérateurs microdifférentiels), Lerner (résultats sur les pertes de dérivées)). 32 Références [BAH] Mohamed Amine Bahayou, Introduction à l’analyse microlocale des EDPs linéaires, cours à l’université d’Ouargla, 2005. [BON] Jean-Michel Bony, Front d’onde et opérations sur les distributions, cours donné aux journées mathématiques X-UPS de l’École Polytechnique, 2003. [BOU1] Claude Bardos et Louis Boutet De Monvel, From the atomic hypothesis to microlocal analysis, 2002. [BOU2] Louis Boutet De Monvel, A course on pseudo-differential operators and their applications, cours donné à l’université de Duke, 1974. [EVA] Larry Evans et Maciej Zworski, Lectures on semi-classical analysis, cours à l’université de Berkeley, 2003. [HOR1] Lars Hörmander, The Analysis of Linear Partial Differential Operators I : Distribution Theory and Fourier Analysis, Springer-Verlag, 1985. [HOR3] Lars Hörmander, The Analysis of Linear Partial Differential Operators III : Pseudodifferential operators, Springer-Verlag, 1985. [JOS] Mark Suresh Joshi, Introduction to pseudo-differential operators, 1999. [LER] Nicolas Lerner, Solving pseudo-differential equations, Higher Education Press, 2002. [SAF] Yurij Safarov, Distributions, Fourier transform and microlocal analysis, Bath LMS Instructional Conference on Partial Differential Equations, 2000. [SCH] Laurent Schwartz, Théorie des distributions et transformation de Fourier, Annales de l’université de Grenoble, 1947. 33