Théorie de la Mesure et Intégration
Transcription
Théorie de la Mesure et Intégration
Université Pierre & Marie Curie (Paris 6) Licence de Mathématiques L3 UE LM364 Intégration 1 & UE LM365 Intégration 2 Année 2011–12 Théorie de la Mesure et Intégration Amaury Lambert 1 1. Responsable des deux UE. Mél : [email protected] Table des matières I LM364 – Intégration 1 5 1 Suites, ensembles et suites d’ensembles 1.1 La droite achevée . . . . . . . . . . . . . . 1.2 Rappels sur les suites et séries numériques 1.3 Ensembles . . . . . . . . . . . . . . . . . . 1.3.1 Terminologie . . . . . . . . . . . . 1.3.2 Opérations classiques . . . . . . . . 1.3.3 Suites de parties d’un ensemble . . 1.3.4 Fonctions et fonctions indicatrices . . . . . . . . 6 6 6 7 7 8 8 9 2 Théorie des cardinaux 2.1 Cardinaux, équipotence, dénombrabilité . . . . . . . . . . . . . . . . . . 2.2 Cardinaux classiques et propriétés . . . . . . . . . . . . . . . . . . . . . . 12 12 14 3 Tribus de parties d’un ensemble 3.1 Définitions et exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Tribu engendrée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3 Tribus image et image réciproque . . . . . . . . . . . . . . . . . . . . . . 17 17 18 19 4 Fonctions mesurables 4.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Exemples et opérations stables pour la mesurabilité . . . . . . . . . . . . 4.3 Fonctions étagées, en escalier, réglées . . . . . . . . . . . . . . . . . . . . 21 21 21 22 5 Le cas borélien 5.1 (Rappels de) Topologie . . . . . . . . . . 5.2 Tribu borélienne et fonctions boréliennes 5.3 L’ensemble triadique de Cantor . . . . . 5.4 Une partie de R non borélienne . . . . . . . . . 26 26 29 30 32 6 Mesures 6.1 Définitions et propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2 Mesure de Lebesgue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3 Autres définitions et autres propriétés . . . . . . . . . . . . . . . . . . . . 34 34 37 38 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . TABLE DES MATIÈRES 3 7 Intégrale des fonctions positives 7.1 Intégrale des fonctions étagées positives . . . . . . . . . . . . . . . . . . . 7.2 Intégrale des fonctions mesurables positives . . . . . . . . . . . . . . . . . 41 41 43 8 Intégrale des fonctions de signe quelconque 8.1 Intégrale des fonctions mesurables de signe quelconque . . . . . . . . . . 8.2 Les grands théorèmes de convergence . . . . . . . . . . . . . . . . . . . . 8.3 Intégrale des fonctions à valeurs complexes . . . . . . . . . . . . . . . . . 49 49 51 54 9 Applications 9.1 Intégrale de Lebesgue et intégrale de Riemann 9.2 Dérivées et primitives . . . . . . . . . . . . . . 9.3 Intégrales dépendant d’un paramètre . . . . . 9.4 Applications . . . . . . . . . . . . . . . . . . . 9.4.1 Dérivation sous la somme . . . . . . . 9.4.2 Convolution . . . . . . . . . . . . . . . 9.4.3 Transformée de Fourier . . . . . . . . . . . . . . . . 56 56 58 60 62 62 62 62 . . . . . . 63 63 64 64 64 65 66 10 Inégalités et espaces L p 10.1 Inégalité de Jensen . . . . . . . . . . 10.2 Inégalités de Hölder et de Minkowski 10.2.1 Semi-normes L p , p ∈ [1, +∞] 10.2.2 Inégalité de Hölder . . . . . . 10.2.3 Inégalité de Minkowski . . . . 10.3 Espace L p et espace Lp . . . . . . . II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . LM365 – Intégration 2 11 Construction d’une mesure 11.1 Quelques rappels et nouvelles définitions . . . . . . . . . . . . . 11.1.1 Rappels . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.1.2 Définitions utiles dans le cadre de l’unicité des mesures . 11.1.3 Définitions utiles dans le cadre de l’existence des mesures 11.2 Unicité d’une mesure . . . . . . . . . . . . . . . . . . . . . . . . 11.2.1 Théorème de la classe monotone et corollaires . . . . . . 11.2.2 Applications . . . . . . . . . . . . . . . . . . . . . . . . . 11.3 Existence d’une mesure . . . . . . . . . . . . . . . . . . . . . . . 11.3.1 Théorème de Caratheodory . . . . . . . . . . . . . . . . 11.3.2 Applications . . . . . . . . . . . . . . . . . . . . . . . . . 69 . . . . . . . . . . 70 70 70 70 72 72 72 74 76 76 77 12 Tribu produit et mesure produit 12.1 Tribu produit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.1.1 Cas général . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.1.2 Le cas borélien . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 80 80 83 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . TABLE DES MATIÈRES 12.1.3 Sections . . . . . . . . . . . . 12.2 Mesure produit . . . . . . . . . . . . 12.3 Théorèmes de Fubini . . . . . . . . . 12.3.1 Théorème de Fubini–Tonelli . 12.3.2 Théorème de Fubini–Lebesgue 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 85 87 87 88 13 Mesure image et changement de variable 13.1 Mesure image . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.2 Formule du changement de variable . . . . . . . . . . . . . . . . . . . . . 90 90 93 14 Les espaces Lp 14.1 Les espaces de Banach Lp . . . . . . . . . . . . . . 14.1.1 Convergence dans Lp et convergence simple 14.1.2 Complétude des espaces Lp . . . . . . . . . 14.2 L’espace L2 et les espaces de Hilbert . . . . . . . . 14.2.1 L’espace de Hilbert L2 (µ) . . . . . . . . . . 14.2.2 Théorème de projection . . . . . . . . . . . 14.2.3 Lemme de Riesz–Fisher . . . . . . . . . . . 14.3 Théorème de Radon–Nikodym . . . . . . . . . . . . 14.4 Dualité Lp –Lq . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 96 96 98 99 99 100 102 103 106 15 Régularité et théorèmes de densité 109 15.1 Régularité d’une mesure sur un espace métrique . . . . . . . . . . . . . . 109 15.2 Théorèmes de densité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 16 Produit de convolution 114 16.1 Convolution de mesures et de fonctions positives . . . . . . . . . . . . . . 114 16.2 Convolution de fonctions boréliennes de signe quelconque . . . . . . . . . 116 17 Transformée de Fourier 119 17.1 Définition et premières propriétés . . . . . . . . . . . . . . . . . . . . . . 119 17.2 Injectivité de la transformée de Fourier . . . . . . . . . . . . . . . . . . . 120 Première partie LM364 – Intégration 1 5 Chapitre 1 Suites, ensembles et suites d’ensembles 1.1 La droite achevée Définition 1.1 On appelle droite achevée l’ensemble R̄ := R ∪ {−∞} ∪ {+∞}. On considérera toujours la droite achevée comme l’espace métrique associé à l’une des distances du type d(x, y) := |f (x) − f (y)| où f (x) = √xx2 +1 si x ∈ R et f (±∞) = ±1. Autrement dit, R̄ est muni de la topologie usuelle de R, complétée avec les notions usuelles de convergence vers +∞ et vers −∞. La droite achevée est munie d’un ordre total que le lecteur aura deviné : pour tous x ≤ y ∈ R, −∞ < x ≤ y < +∞. La droite achevée est également munie des opérations algébriques usuelles, avec les conventions suivantes : +∞ + ∞ = +∞, −∞ − ∞ = −∞, a + ∞ = +∞, a − ∞ = −∞, pour tout a ∈ R, ainsi que 0 × ∞ = 0, et a ∈]0, ∞] ⇒ a × ∞ = +∞, a ∈ [−∞, 0[ ⇒ a × ∞ = −∞. Remarque 1.2 Tout au long de ce cours, il faudra acquérir le réflexe de NE JAMAIS ÉCRIRE aucune des opérations interdites suivantes : (+∞) − (+∞), ainsi que (−∞) − (−∞), et encore (±∞)/(±∞). Une suite numérique est une suite à valeurs dans R ou dans R̄. 1.2 Rappels sur les suites et séries numériques Définition 1.3 On dit que a ∈ R̄ est une valeur d’adhérence de la suite (un ) s’il existe une suite extraite (uϕ(n) ) qui converge vers a. 6 CHAPITRE 1. SUITES, ENSEMBLES ET SUITES D’ENSEMBLES 7 Exemple 1.4 Les valeurs d’adhérence de la suite (cos(πn/2)) sont −1, 0 et 1. Celles de la suite ((−1)n + n1 ) sont −1 et +1. Notation 1.5 (importante) Lorsqu’une suite (un ) est croissante (resp. décroissante), on notera souvent limn ↑ un (resp. limn ↓ un ) sa limite, pour rappeler que la suite est monotone, et surtout pour indiquer que cette limite existe donc toujours (dans R̄). Définition 1.6 La borne supérieure (∈ R̄) de l’ensemble des valeurs d’adhérence de la suite (un ) est aussi une valeur d’adhérence de (un ). On la note limn→∞ un ou lim supn→∞ un . C’est donc la plus grande valeur d’adhérence de (un ) et elle vérifie lim un = lim ↓ (sup uk ) = inf (sup uk ). n n k≥n n k≥n De façon analogue, la plus petite valeur d’adhérence de (un ) est notée limn→∞ un ou lim inf n→∞ un ... Définition 1.7 On dit que la série Pn de terme général (un ) est absolument convergente si la suite des sommes partielles ( k=0 |uk |)n converge dans R, ce que l’on note également P |u | < ∞. n n Théorème 1.8 Si la série de terme général (un ) est absolument P convergente, alors elle est convergente, c’est-à-dire que la suite des sommes partielles ( nk=0 uk )n converge dans R. Proposition 1.9 La somme de la série de terme général un ≥ 0 (c’est-à-dire la limite de la suite des sommes partielles, qui existe toujours dans R̄+ ) ne dépend pas de l’ordre de sommation. Soit une bijection ϕ : N −→ On veut montrer que la suite Sn0 := PN. n uϕ(k) a même limite dans R̄+ que Sn := k=0 uk . P Soit n ≥ 0 et N := max{ϕ(0), . . . , ϕ(n)}. Alors Sn0 = uϕ(0) + · · · + uϕ(n) ≤ N j=0 uj = 0 0 SN , donc Sn ≤ SN ≤ S∞ . Faisant tendre n → ∞ on obtient que S∞ ≤ S∞ . L’inégalité opposée s’obtient par symétrie. 2 Démonstration. P n k=0 1.3 1.3.1 Ensembles Terminologie Soit E un ensemble. Mettons-nous d’accord sur un peu de terminologie. – A ⊆ E sera appelé sous-ensemble ou partie de E ; – P(E) := {parties de E} ; – A ⊆ P(E) sera appelé famille de parties de E ou classe de parties de E plutôt qu’ensemble de sous ensembles de E ou partie de P(E) ; – dans quelques rares cas, nous serons amenés à considérer des ensembles de familles de parties, que l’on appellera alors collections de familles de parties de E. CHAPITRE 1. SUITES, ENSEMBLES ET SUITES D’ENSEMBLES 1.3.2 8 Opérations classiques Recensons quelques opérations classiques sur les parties d’un ensemble E. Soient A1 et A2 deux parties de E. – La réunion de A1 et A2 , notée A1 ∪ A2 : ∀x ∈ E, x ∈ A1 ∪ A2 ⇔ ∃i ∈ {1, 2}, x ∈ Ai – L’intersection de A1 et A2 , notée A1 ∩ A2 : ∀x ∈ E, x ∈ A1 ∩ A2 ⇔ ∀i ∈ {1, 2}, x ∈ Ai – Le complémentaire de A1 , noté cA1 : ∀x ∈ E, x ∈ cA1 ⇔ x ∈ / A1 – La différence de A1 avec A2 , notée A1 \ A2 et dite différence propre dans le cas où A2 ⊆ A1 : ∀x ∈ E, x ∈ A1 \ A2 ⇔ x ∈ A1 et x ∈ / A2 – La différence symétrique de A1 et A2 , notée A1 ∆A2 : ∀x ∈ E, x ∈ A1 ∆A2 ⇔ x ∈ A1 ∪ A2 et x ∈ / A1 ∩ A2 . Remarque 1.10 Remarquer l’association de la réunion avec le quantificateur « ∃ », de l’intersection avec le quantificateur « ∀ », ainsi que l’association du passage au complémentaire avec la négation et de l’inclusion avec l’implication : A1 ⊆ A2 ssi ∀x ∈ E, x ∈ A1 ⇒ x ∈ A2 . Exercice 1.11 Montrer les identités suivantes : @ c (A1 ∪ A2 ) = cA1 ∩ cA2 c (A1 ∩ A2 ) = cA1 ∪ cA2 A1 \ A2 = A1 ∩ cA2 A1 ∆A2 = (A1 ∪ A2 ) \ (A1 ∩ A2 ) = (A1 \ A2 ) ∪ (A2 \ A1 ). 1.3.3 Suites de parties d’un ensemble Nous allons définir ici les notions de limite, limite supérieure et limite inférieure d’une suite de parties. Soit (An ) une suite de parties de E. Définition 1.12 On rappelle que la suite (An ) est dite croissante (resp. décroissante) lorsque pour tout entier n, An ⊆ An+1 (resp. An+1 ⊆ An ). Dans ce cas, la limite de la suite (An ) est définie naturellement comme la réunion (resp. l’ intersection) de tous les An : [ \ lim An := An (resp. An ). n→∞ n n Par analogie avec le cas réel, on notera cette limite lim ↑ (resp. lim ↓) pour faire référence au fait que la suite (An ) est croissante et que la limite est donc la réunion (resp. l’intersection) de tous ses éléments. CHAPITRE 1. SUITES, ENSEMBLES ET SUITES D’ENSEMBLES 9 Définition 1.13 On définit les deux parties de E suivantes : [ \[ lim sup An (ou lim An ) := lim ↓ Ak = Ak , n→∞ n→∞ n→∞ k≥n n k≥n S où la notation lim ↓ fait référence au fait que la suite k≥n Ak n est décroissante, si bien que sa limite existe toujours (et est l’intersection de tous ses éléments, ce qu’indique la dernière égalité) ; \ [\ Ak = Ak , lim inf An (ou lim An ) := lim ↑ n→∞ n→∞ n→∞ k≥n n k≥n T où la notation lim ↑ fait référence au fait que la suite k≥n Ak n est croissante, si bien que sa limite existe toujours (et est la réunion de tous ses éléments, ce qu’indique la dernière égalité). Remarque 1.14 On peut aussi caractériser la limite supérieure et la limite inférieure par les assertions suivantes : pour tout x ∈ E, x ∈ lim sup An ⇔ ∀n ∃k ≥ n, x ∈ Ak n→∞ ⇔ {n : x ∈ An } est infini. ⇔ ∃n ∀k ≥ n, x ∈ Ak x ∈ lim inf An n→∞ ⇔ {n : x ∈ / An } est fini. Noter que lim inf n An ⊆ lim supn An . Définition 1.15 On dit que la suite (An ) converge si lim inf n An = lim supn An . Lorsque c’est le cas on définit limn An := lim inf n An = lim supn An . Remarque 1.16 Soit A la limite d’une suite (An ) qui converge. Alors A est caractérisée par : ∀x ∈ A ∃n0 ∀n ≥ n0 x ∈ An ∀x ∈ / A ∃n1 ∀n ≥ n1 x ∈ / An . Exercice 1.17 Montrer les deux égalités suivantes lim sup cAn = c (lim inf An ) n n c lim inf An = n 1.3.4 c (lim sup An ). n Fonctions et fonctions indicatrices Définition 1.18 On appelle indicatrice ou fonction indicatrice de la partie A, et l’on note 1A , la fonction @ CHAPITRE 1. SUITES, ENSEMBLES ET SUITES D’ENSEMBLES 10 1A : E −→ {0, 1} x 7−→ 0 1 si si x∈ /A x ∈ A. Remarque 1.19 Noter que 1cA = 1 − 1A . Proposition 1.20 Au sens de la convergence simple, lim 1An = 1lim A n n n et lim 1An = 1limn An n Dém. Pour tout x ∈ E, lim 1An (x) = 1 ⇔ ∀n ∃k ≥ n, 1Ak (x) = 1 n ⇔ ∀n ∃k ≥ n, x ∈ Ak ⇔ x ∈ lim An n ⇔ 1lim A (x) = 1. n n L’autre assertion se démontre de la même manière, ou alors en se servant de l’assertion précédente : lim 1An = lim(1 − 1cAn ) = 1 − lim 1cAn = 1 − 1lim n n n n cA n = 1 − 1c(limn An ) = 1limn An , ce qui achève la démonstration. 2 Remarque 1.21 Conséquence de cette proposition : la suite de parties (An ) converge ssi la suite de fonctions (1An ) converge simplement (et lorsque c’est le cas, la convergence a lieu vers 1limn An ). Définition 1.22 Soient E, F deux ensembles et f : E −→ F . – pour tout A ⊆ E, on note f (A) l’ image directe de A par f : f (A) := {y ∈ F : ∃x ∈ A, f (x) = y}. – pour tout B ⊆ F , on note f −1 (B) l’ image réciproque de B par f : f −1 (B) := {x ∈ E : f (x) ∈ B}. Remarque 1.23 La notation f −1 ne fera que très rarement, sinon jamais, référence à l’application inverse ou réciproque de l’application f dans les cas où elle serait par hasard bijective. Néanmoins, noter la cohérence de ces notations, au sens où si f est bijective, alors on a bien égalité entre l’image réciproque f −1 (B) de B par f et l’image directe f −1 (B) de B par l’inverse f −1 de f . CHAPITRE 1. SUITES, ENSEMBLES ET SUITES D’ENSEMBLES 11 Exercice 1.24 Montrer les formules de Hausdorff(cf feuille de TD). Pour tous I et J @ ensembles d’indices non vides, pour toute famille (Ai )i∈I de parties de E et pour toute famille (Bj )j∈J de parties de F , pour toute fonction f : E −→ F , ! [ [ f Ai = f (Ai ), i i ! f \ Ai ⊆ i \ f (Ai ) i avec égalité si f est injective ; ! f −1 [ Bj = j [ f −1 (Bj ), j ! f −1 \ j Bj = \ f −1 (Bj ), j et pour tout B ⊆ F , c f −1 (B) = f −1 (cB) . Chapitre 2 Théorie des cardinaux 2.1 Cardinaux, équipotence, dénombrabilité Définition 2.1 Deux ensembles E et F sont dits équipotents, ou avoir même cardinal, ou encore même puissance, s’il existe une bijection de l’un sur l’autre. On note alors Card(E) = Card(F ). Définition 2.2 On notera Card(E) ≤ Card(F ) s’il existe une injection de E dans F , c’est-à-dire si E a même puissance qu’une partie de F . Si de plus E et F n’ont pas même puissance, on notera Card(E) < Card(F ). Exemple 2.3 Quelques exemples d’équipotences : – Les ensembles P(E) et {0, 1}E (= ensemble des applications : E −→ {0, 1}) sont équipotents car l’application A 7→ 1A est une bijection de l’un sur l’autre ; – les ensembles N et 2N (entiers pairs) sont équipotents car l’application n 7→ 2n est une bijection de l’un sur l’autre ; – les ensembles N et N×N sont équipotents car on peut bien énumérer de manière injective les couples d’entiers (par exemple en suivant les points des droites d’équation y = −x + c, lorsque c croît dans N) ; – par récurrence, N est équipotent avec tous les produits cartésiens du type Np (p ∈ N? ). @ Théorème 2.4 (théorème de Cantor–Bernstein, admis) Si Card(E1 ) ≤ Card(E2 ) et Card(E2 ) ≤ Card(E1 ), alors Card(E1 ) = Card(E2 ). Remarque 2.5 La relation ≤ est une relation d’ordre. En effet elle est 1. réflexive : il existe une injection de E dans E (l’injection canonique, c’est-à-dire ici l’identité), donc Card(E) ≤ Card(E) ; 2. antisymétrique, grâce au théorème de Cantor–Bernstein ; 3. transitive : si Card(E1 ) ≤ Card(E2 ) et Card(E2 ) ≤ Card(E3 ), alors il existe une injection f1 : E1 −→ E2 et une injection f2 : E2 −→ E3 , donc il existe une injection f3 : E1 −→ E3 qui n’est autre que... f2 ◦ f1 , par conséquent Card(E1 ) ≤ Card(E3 ). @ 12 CHAPITRE 2. THÉORIE DES CARDINAUX 13 Remarque 2.6 Ces énoncés ne sont pas des évidences, car il faut bien garder à l’esprit que les cardinaux ne sont pas des nombres réels (sauf pour le cas très particulier des ensembles finis). La proposition suivante, dont la démonstration est très jolie, assure en particulier qu’il existe une suite infinie strictement croissante de cardinaux : Card(E) < Card(P(E)) < Card(P(P(E))) < · · · Proposition 2.7 Card(E) < Card(P(E)). Soit f : E → P(E). Montrons que f ne peut être surjective (et donc ne peut être bijective). Soit Ω := {x ∈ E : x ∈ / f (x)}. Dém. Montrons que par l’absurde que Ω ne peut avoir d’antécédent par f . Si ∃z ∈ E tel que f (z) = Ω alors – soit z ∈ Ω alors z ∈ / f (z), c’est-à-dire z ∈ / Ω; – soit z ∈ / Ω alors z ∈ f (z), c’est-à-dire z ∈ Ω, ce qui constitue une contradiction. D’autre part il existe clairement une injection de E dans P(E), par exemple celle qui à x associe {x}. 2 Définition 2.8 On définit les notions d’infini et de dénombrable comme suit : – E est dit infini s’il existe x0 ∈ E et une injection de E dans E \ {x0 }, et est dit fini sinon ; – E est dit dénombrable si Card(E) ≤ Card(N) ; – E est dit infini dénombrable si Card(E) = Card(N) ; – E est dit (infini) non dénombrable si Card(E) > Card(N) ; – une partie A de E est dite cofinie si cA est fini. Remarque 2.9 L’ensemble N est (bien !) infini car par exemple l’application f : N −→ N? n 7−→ n + 1 est bien une injection. Définition 2.10 Card(N) est souvent noté ℵ0 (« aleph zéro »). La proposition suivante, laissée en exercice (indication : montrer par récurrence sur n ∈ N? qu’il existe n éléments distincts x1 , . . . , xn de E et une injection in : E → E \ {x1 , . . . , xn }), assure que les ensembles équipotents à N sont les plus petits ensembles infinis au sens des cardinaux. Proposition 2.11 E est infini ssi Card(E) ≥ Card(N). @ CHAPITRE 2. THÉORIE DES CARDINAUX 2.2 14 Cardinaux classiques et propriétés Proposition 2.12 Les ensembles Z, Np (p ∈ N? ) et Q sont dénombrables. Dém. On a déjà vu que Np était équipotent à N. Pour ce qui est de Z, la fonction f : Z −→ N −2n n 7−→ 2n − 1 si si n≤0 n>0 est une bijection. Enfin, rappelons que pour tout x ∈ Q? , ∃!(p, q) ∈ Z? ×N? tel que x = p/q et p∧q = 1. Ainsi la fonction qui à 0 associe (0, 1) et qui est définie sur Q? par f : Q? −→ Z × N? p/q 7−→ (p, q) est une injection de Q dans Z × N? , donc Card(Q) ≤ Card(Z × N? ). Or il existe une injection g : Z → N, donc l’application qui à (x, y) associe (g(x), y) est une injection de Z × N? dans N2 , ce qui montre que Card(Z × N? ) ≤ Card(N2 ) = Card(N), donc Card(Q) ≤ Card(N). 2 Proposition 2.13 Toute réunion dénombrable d’ensembles dénombrables est dénombrable. S Soit E = n∈N En , où pour tout n ∈ N, En est dénombrable. Alors par définition, pour tout n ∈ N il existe une injection ϕn : En → N. Pour tout x ∈ E on définit alors Dém. N (x) := min{n ≥ 0 : x ∈ En } < ∞. Alors la fonction φ : E −→ N2 x 7−→ (N (x), ϕN (x) (x)) est une injection car pour tous x, y ∈ E tels que φ(x) = φ(y), on a N (x) = N (y) =: n puis ϕN (x) (x) = ϕN (y) (y), c’est-à-dire ϕn (x) = ϕn (y), donc x = y, puisque ϕn est injective. Par conséquent, Card(E) ≤ Card(N2 ) = Card(N). 2 Proposition 2.14 Tout produit cartésien fini d’ensembles dénombrables est dénombrable. Pour i = 1, . . . , n, soit Ei dénombrable et une injection ϕi : Ei → N. Alors la fonction Dém. φ: Πni=1 Ei −→ Nn (x1 , . . . , xn ) 7−→ (ϕ1 (x1 ), . . . , ϕn (xn )) est clairement injective donc Card(Πi Ei ) ≤ Card(Nn ) = Card(N). 2 CHAPITRE 2. THÉORIE DES CARDINAUX 15 Proposition 2.15 Tout produit cartésien infini dénombrable d’ensembles non vides (même finis) est non-dénombrable pourvu qu’une infinité d’entre eux ne soient pas réduits à un singleton. Dém. Admettons pour simplifier que pour tout i ∈ N, Card(Ei ) ≥ 2. Alors pour tout i, il existe une injection ϕi : {0, 1} → Ei . Donc l’application φ: {0, 1}N −→ E0 × E1 × · · · (x0 , x1 , . . .) 7−→ (ϕ0 (x0 ), ϕ1 (x1 ), . . .) est injective, donc Card(Πi Ei ) ≥ Card({0, 1}N ) = CardP(N) > Card(N). 2 Théorème 2.16 Les ensembles R et P(N) sont équipotents. Définition 2.17 On dit d’un ensemble équipotent à R qu’il a la puissance du continu. Première étape : montrons que toute partie de R contenant un intervalle ouvert a la puissance du continu. Soit A ⊆ R contenant un intervalle I qu’on écrira sous la forme I =]b − a, b + a[, alors A s’injecte bien sûr dans R, mais R s’injecte aussi dans A par exemple par l’application Dém. φ : R −→ A x 7−→ a √ x +b x2 + 1 . Deuxième étape : montrons que Card(P(N)) ≤ Card([0, 1/2]) dont on sait d’après l’étape précédente que ce cardinal vaut Card(R). Soit l’application φ : {0, 1}N −→ [0, 1/2] X xn x = (xn ) 7−→ . 3n+1 n≥0 Montrons que φ est bien injective. Pour tous x 6= y, soit n := min{k ≥ 0 : xk 6= yk } < ∞. Alors x − y X x − y n n k k |φ(x) − φ(y)| = n+1 + k+1 3 3 k≥n+1 X |xn − yn | yk − xk ≥ − 3n+1 3k+1 k≥n+1 X 1 1 ≥ n+1 − 3 3k+1 k≥n+1 = 1 3n+1 − 1 3n+2 1 1 = > 0, 1 − 1/3 2 · 3n+1 CHAPITRE 2. THÉORIE DES CARDINAUX 16 ce qui prouve que φ(x) 6= φ(y). Troisième et dernière étape : montrons que Card({0, 1}N ) ≥ Card([0, 1[), ce qui équivaut à Card(P(N)) ≥ Card(R). Soit ψ : [0, 1[→ {0, 1}N l’application qui à x ∈ [0, 1[ associe son développement dyadique propre, c’est-à-dire la suite (xn ) de 0 et de 1 définie récursivement par x0 := [2x], et " !# n−1 X x k xn := 2n+1 x − . k+1 2 k=0 Alors comme x = xk k≥0 2k+1 , P ψ est clairement injective (car si ψ(x) = ψ(y), x = y). 2 Chapitre 3 Tribus de parties d’un ensemble 3.1 Définitions et exemples Définition 3.1 Une classe A de parties d’un ensemble E est appelée tribu ou σ-algèbre si (i) elle contient E : E ∈ A ; (ii) elle est stable par passage au complémentaire : pour tout A ⊆ E, A ∈ A ⇔ cA ∈ A; (iii) elle est stable par réunion dénombrable : si (An ) est une famille dénombrable d’éléments de A , alors ∪n An ∈ A . On dit alors que (E, A ) est un espace mesurable. Remarque 3.2 Cette définition a quelques conséquences immédiates : – ∅ ∈ A car ∅ = cE ; – stabilité par intersection dénombrable car ∩n An = c(∪n cAn ) ; – stabilité par différence car A \ B = A ∩ cB ; – stabilité par différence symétrique car A∆B = (A \ B) ∪ (B \ A) ; – stabilité par limite supérieure car limn An = ∩n ∪k≥n Ak ; – stabilité par limite inférieure... Exercice 3.3 Il aurait été équivalent de définir une tribu comme une classe A de parties de E vérifiant (par exemple) les propriétés suivantes : A contient ∅, est stable par passage au complémentaire et est stable par intersection dénombrable. Exemple 3.4 Quelques exemples de tribus : – {∅, E} est une tribu (parfois appelée la tribu grossière) ; – P(E) est bien sûr une tribu (parfois appelée la tribu triviale) ; – si (An )n∈N est une partition de E dénombrable (finie ou infinie), alors A := {∪i∈I Ai : I ⊆ N} est une tribu sur E ; – si A ⊆ E, la plus petite (voir section suivante) tribu contenant A est {∅, E, A, cA} ; 17 CHAPITRE 3. TRIBUS DE PARTIES D’UN ENSEMBLE 18 – enfin, A := {A ⊆ E : A ou cA est dénombrable} est une tribu, ce que nous démontrons ci-dessous. Nous démontrerons uniquement la stabilité par réunion dénombrable. Soient (An )n ∈ A . De deux choses l’une : – soit pour tout n, An est dénombrable et alors ∪n An est dénombrable ; – soit ∃n0 tel que An0 est non dénombrable, et alors cAn0 est dénombrable, donc ∩n cAn ⊆ cAn0 est dénombrable, et par conséquent ∪n An est de complémentaire dénombrable (car égal à ∩n cAn ) ; Dans les deux cas ∪n An ∈ A . 2 Dém. 3.2 Tribu engendrée Proposition 3.5 (et définition) a) l’intersection d’une collection non vide quelconque 1 de tribus de parties de E est elle-même une tribu ; @ 2 b) pour toute classe C de parties de E, l’intersection de toutes les tribus contenant C est (donc 3 ) une tribu : elle est (appelée) la plus petite tribu contenant C , ou tribu engendrée par C , et notée σ(C ) : \ σ(C ) := A. A tribu,C ⊆A Remarque 3.6 – On rappelle que le terme collection désigne un ensemble de famille de parties, c’est-à-dire un ensemble d’ensembles de sous-ensembles de E... ; – je ne devrais pas préciser, mais il faut garder à l’esprit que si A et B sont des familles de parties de E alors C ∈ A ∩ B ssi C ∈ A et C ∈ B (on n’intersecte pas ici les parties de E) ; – le terme de plus petite tribu n’a de sens qu’à la lumière de la définition précédente, car il n’existe pas d’ordre total sur les tribus. Remarque 3.7 – pour toute classe B de parties de E, B ⊆ σ(B), par définition ; – si C est une classe de parties de E et A est une tribu de parties de E telle que C ⊆ A , alors A est élément de la collection des tribus contenant C , donc contient son intersection σ(C ), autrement dit σ(C ) ⊆ A ; – première conséquence, si A est une tribu de parties de E, alors σ(A ) = A ; – deuxième conséquence, si C ⊆ B alors B ⊆ σ(B) implique C ⊆ σ(B), et comme B est une tribu, σ(C ) ⊆ σ(B). Remarque 3.8 (méthodologie) – Si A est une tribu, pour montrer que A = σ(C ), on montre que A ⊆ σ(C ) et que C ⊆ A ; 1. quelconque au sens de « pas forcément dénombrable » 2. au sens de l’inclusion 3. cette collection est non vide car un de ses éléments est P(E) CHAPITRE 3. TRIBUS DE PARTIES D’UN ENSEMBLE 19 – pour montrer que σ(C1 ) = σ(C2 ), on montre que C1 ⊆ σ(C2 ) et que C2 ⊆ σ(C1 ). Définition 3.9 On note B(R), ou Bor(R), et on appelle tribu de Borel sur R la tribu engendrée par les intervalles ouverts. La tribu de Borel sur R̄ est l’ensemble des parties de R prenant l’une des formes A, A∪{+∞}, A∪{−∞} ou A∪{−∞, +∞}, où A ∈ Bor(R). Proposition 3.10 Soit S une partie dense de la droite réelle 4 . Alors Bor(R) est la tribu engendréee par les intervalles du type a) [a, +∞[, a ∈ S; b) ]b, +∞[, b ∈ S; c) ] − ∞, c[, c ∈ S; d) ] − ∞, d], d ∈ S. Il en est de même pour Bor(R̄) avec les intervalles du type [a, +∞],... Dém. [de a)] Soit IS l’ensemble des intervalles de la forme [a, +∞[ pour a ∈ S. Tout d’abord, B(R) contient tous les intervalles fermés de R car est stable par passage au complémentaire donc on a l’inclusion σ(IS ) ⊆ B(R). Soit maintenant a ∈ [−∞, +∞[. Comme S est dense, il existe une suite décroissante (an ) d’éléments de S tels que an 6= a @ pour tout n, et limn ↓ an = a. Comme [an , +∞[∈ IS , on a [an , +∞[∈ σ(IS ), donc par stabilité par réunion dénombrable de la tribu σ(IS ), ]a, +∞[= ∪n [an , +∞[∈ σ(IS ). On démontre avec une suite croissante que [a, +∞[∈ σ(IS ). Maintenant pour tous a, b ∈ [−∞, +∞[, l’intervalle ]a, b[ s’écrit ]a, +∞[\[b, +∞[∈ σ(IS ). Par conséquent I ⊆ σ(IS ), où I est l’ensemble des intervalles ouverts de R et B(R) = σ(I ) ⊆ σ(IS ). 2 3.3 Tribus image et image réciproque Soit f : E1 −→ E2 . Proposition 3.11 Si A2 est une tribu sur E2 , f −1 (A2 ) := {f −1 (Y ), Y ∈ A2 } est une tribu sur E1 , appelée tribu image réciproque (de A2 par f ). Par les formules de Hausdorff : i) f −1 (E2 ) = E1 ∈ f −1 (A2 ) ; ii) pour tout Y ∈ A2 , c(f −1 (Y )) = f −1 (cY ) ∈ f −1 (A2 ) ; iii) pour toute suite (Yn ) ∈ A2 , ∪n f −1 (Yn ) = f −1 (∪n Yn ) ∈ f −1 (A2 ) car ∪n Yn ∈ A2 .2 Dém. Proposition 3.12 Si A1 est une tribu sur E1 , B = {Y ⊆ E2 : f −1 (Y ) ∈ A1 } est une tribu sur E2 , appelée tribu image (de A1 par f ). Remarque 3.13 La tribu image n’est PAS f (A1 ) qui n’est en général pas une tribu. 4. c’est-à-dire telle que tout nombre réel est limite d’une suite à valeurs dans S ; par exemple S = Q CHAPITRE 3. TRIBUS DE PARTIES D’UN ENSEMBLE Dém. Par les formules de Hausdorff également. 20 2 @ Définition 3.14 (et proposition) Soit (E, A ) un ensemble mesurable et X une partie de E. La classe C = {A ∩ X : A ∈ A } de parties de X est une tribu sur X appelée tribu trace de A sur X. Remarque 3.15 Cette définition a surtout de l’intérêt dans le cas où X ∈ / A. La classe C est la tribu image réciproque de A par l’injection canonique i : X → E : en effet pour tout A ∈ A , i−1 (A) = A ∩ X. 2 Dém. Théorème 3.16 (lemme de transport) Soit f : E1 −→ E2 et C une classe de parties de E2 . Alors σ(f −1 (C )) = f −1 (σ(C )). Montrons l’inclusion ⊆. Tout d’abord C ⊆ σ(C ), donc f −1 (C ) ⊆ f −1 (σ(C )). Mais f (σ(C )) est une tribu donc σ(f −1 (C )) ⊆ σ(f −1 (σ(C ))) = f −1 (σ(C )). Montrons maintenant l’inclusion ⊇. Soit B la tribu image de σ(f −1 (C )) par f , c’està-dire B := {Y ⊆ E2 : f −1 (Y ) ∈ σ(f −1 (C ))}. Dém. −1 Alors C ⊆ B, et comme B est une tribu, σ(C ) ⊆ B, puis f −1 (σ(C )) ⊆ f −1 (B). Mais par définition de B, f −1 (B) ⊆ σ(f −1 (C )) donc f −1 (σ(C )) ⊆ σ(f −1 (C )). 2 Chapitre 4 Fonctions mesurables 4.1 Définitions Notation 4.1 Soit f : E1 −→ E2 et B ⊆ E2 . On utilise très fréquemment la notation {f ∈ B} à la place de f −1 (B), ce qui peut se voir comme une écriture condensée de {x : f (x) ∈ B}. Par exemple, dans le cas où E2 = R et B = [a, +∞[, on écrira f −1 (B) sous la forme {f ≥ a}. Définition 4.2 Une fonction f : (E1 , A1 ) −→ (E2 , A2 ) est dite mesurable 1 si f −1 (A2 ) ⊆ A1 (c’est-a-dire : pour tout B ∈ A2 , f −1 (B) ∈ A1 ). Notation 4.3 On notera F (A1 , A2 ) l’ensemble des fonctions mesurables : (E1 , A1 ) → (E2 , A2 ). Remarque 4.4 Si on ne se donne que la tribu A1 , alors la tribu image de A1 par f est la plus grande tribu sur E2 qui rende f mesurable. Si on ne se donne que A2 , alors la tribu image réciproque de A2 par f est la plus petite tribu sur E1 qui rende f mesurable. On note aussi cette tribu σ(f ). Remarque 4.5 Une fonction indicatrice 1A : (E, A ) −→ ({0, 1}, P({0, 1})) est mesurable ssi A ∈ A , ce que l’on dira aussi « A est mesurable » 2 . 4.2 Exemples et opérations stables pour la mesurabilité La proposition suivante est une conséquence du lemme de transport. Proposition 4.6 Soit C une classe de parties de F et B := σ(C ). Alors f : (E, A ) → (F, B) est mesurable ssi f −1 (C ) ⊆ A . L’application f est mesurable ssi f −1 (B) ⊆ A , mais f −1 (B) = f −1 (σ(C )) = σ(f −1 (C )) et σ(f −1 (C )) ⊆ A ssi f −1 (C ) ⊆ A . 2 Dém. 1. sous-entendu par rapport aux deux tribus A1 et A2 2. toujours en référence sous-entendue à la tribu A 21 CHAPITRE 4. FONCTIONS MESURABLES 22 Soit S une partie dense de R. Alors la fonction f : (E, A ) → (R, B(R)) est mesurable ssi {f ≥ a} ∈ A pour tout a ∈ S (et l’on peut bien sûr remplacer {f ≥ a} par {f > a}, {f ≤ a} ou {f < a}). Application. Proposition 4.7 Soient f1 : (E1 , A1 ) → (E2 , A2 ) et f2 : (E2 , A2 ) → (E3 , A3 ). Si f1 et f2 sont mesurables, alors f2 ◦ f1 : (E1 , A1 ) → (E3 , A3 ) est aussi mesurable. Pour tout élément A3 de A3 , on vérifie que (f2 ◦ f1 )−1 (A3 ) = f1−1 (f2−1 (A3 )). @ Comme f2 est mesurable, f2−1 (A3 ) ∈ A2 . De plus, comme f1 est mesurable f1−1 (f2−1 (A3 )) ∈ A1 . 2 Dém. Proposition 4.8 Soit une suite (fn ) de F (A , Bor(R̄)). Alors a) supn fn et inf n fn sont mesurables ; b) lim supn fn et lim inf n fn sont mesurables ; c) Si (fn ) converge simplement vers une fonction f (dans R̄), alors f est mesurable. a) Pour tout a ∈ R, {supn fn ≤ a} = ∩n {fn ≤ a} ∈ A et {inf n fn ≥ a} = ∩n {fn ≥ a} ∈ A . b) D’après a), pour tout n ∈ N, la fonction supk≥n fk est mesurable, donc la fonction lim supn fn = inf n supk≥n fk est mesurable. De même pour lim inf n fn . c) Si fn → f , alors f = lim supn fn , qui est mesurable d’après b). 2 Dém. On peut raffiner le résultat sur la mesurabilité de la limite d’une suite de fonctions mesurables de la manière suivante 3 . Théorème 4.9 Soit C := {x ∈ E : la suite (fn (x))n converge dans R̄}. Alors (C ∈ A et) si C désigne la tribu trace de A sur C alors la fonction f := limn fn : (C, C ) → (R̄, B(R̄)) est mesurable. Dém. On note f ↓ := lim inf n fn et f ↑ := lim supn fn . Alors C est mesurable car C = c{f ↑ 6= f ↓ } = c(∪r∈Q {f ↑ > r} ∩ {f ↓ < r}). Rappelons que la mesurabilité de C n’est pas nécessaire pour définir la tribu trace C . Néanmoins, pour tout borélien B de R̄, f −1 (B) = C ∩(f ↑ )−1 (B) ∈ C . En effet, f −1 (B) = {x ∈ E : f ↓ (x) = f ↑ (x) et f ↑ (x) ∈ B}. 2 4.3 Fonctions étagées, en escalier, réglées Définition 4.10 Une fonction f ∈ F (A , Bor(R)) est dite étagée si elle ne prend qu’un nombre fini de valeurs. Alors il existe une partition finie (Ai , i ∈ I) de E, A -mesurable 4 , P et des nombres réels (αi , i ∈ I) tels que f = i∈I αi 1Ai . 3. Ce résultat est hors de la portée stricte du cours, mais la question à laquelle il répond est tellement naturelle... 4. au sens où Ai ∈ A pour tout i ∈ I CHAPITRE 4. FONCTIONS MESURABLES 23 Notation 4.11 On note E (A ) l’ensemble des fonctions étagées : (E, A ) → (R, B(R)). P Remarque 4.12 Il existe une représentation canonique de f sous la forme i∈I αi 1Ai où les αi sont deux à deux distincts et Ai = {f = αi }. On notera qu’une fonction indicatrice est bien sûr étagée car 1A = 1 · 1A + 0 · 1cA . Proposition 4.13 Pour toutes fonctions étagées f, g et pour tout λ ∈ R, λf + g est étagée (autrement dit E (A ) est un espace vectoriel), ainsi que f g, f ∧ g et f ∨ g. 5 P P On écrit f et g sous la forme f = i∈I αi 1Ai et g = j∈J βj 1Bj . Alors (Ai ∩ P Bj ; (i, j) ∈ I × J) est une partition finie de E et on peut écrire λf + g = (i,j)∈I×J (λαi + βj )1Ai ∩Bj , f g = αi βj 1Ai ∩Bj , etc. 2 Dém. Théorème 4.14 (lemme fondamental d’approximation) Pour toute f ∈ F (A , B(R̄)), il existe une suite (fn ) de fonctions étagées convergeant simplement vers f 6 . De plus, a) si f est positive, on peut choisir la suite (fn ) positive et croissante 7 ; b) si f est bornée, on peut choisir (fn ) de sorte que la convergence soit uniforme 8 . Dém. Commençons par le cas où f est positive. On définit alors n fn := n2 X k−1 k=1 2n 1{(k−1)2−n <f ≤k2−n } + n1{f >n} . Alors pour tout x ∈ E, la suite (fn (x))n est bien (positive et) croissante et converge vers @ f (x), en effet : si f (x) = +∞, alors fn (x) = n → ∞ ; sinon il existe n0 tel que f (x) < n0 , ce qui implique que pour tout n ≥ n0 , |fn (x) − f (x)| ≤ 2−n → 0. Si f est bornée et positive, alors il existe n0 tel que pour tout x ∈ E, f (x) < n0 , donc pour tout x ∈ E, pour tout n ≥ n0 , |fn (x) − f (x)| ≤ 2−n → 0, ce qui n’est autre qu’une convergence uniforme. Si f est de signe quelconque, on écrit f sous la forme f = f + − f − , où f + := f 1{f >0} et f − := −f 1{f <0} . La somme f + − f − n’est jamais indéterminée, car pour tout x ∈ E, au moins un des deux termes f + (x) ou f − (x) est nul. On notera également que f + (et f − , par un même raisonnement) est mesurable car pour tout a ≥ 0, {f + ≥ a} = {f ≥ a} et pour tout a < 0, {f + ≥ a} = E. À présent, comme f + et f − sont positives, il existe deux suites croissantes (un ) et (vn ) de fonctions étagées positives convergeant resp. vers f + et f − . De plus, si l’on utilise la construction de ces suites proposée plus haut, on a un vn = 0, de sorte que l’on peut toujours définir fn := un − vn , qui définit une suite de fonctions étagées convergeant vers f + − f − = f . 5. a ∧ b est une notation alternative pour min(a, b), et a ∨ b pour max(a, b) 6. autrement dit (rappel...) : ∀x ∈ E, fn (x) → f (x) lorsque n → ∞ 7. autrement dit : ∀x ∈ E, ∀n ∈ N, 0 ≤ fn (x) ≤ fn+1 (x) – rien à voir avec des fonctions croissantes, ce qui n’aurait d’ailleurs pas de sens ici... 8. autrement dit (rappel...) : supx∈E |fn (x) − f (x)| → 0 lorsque n → ∞ CHAPITRE 4. FONCTIONS MESURABLES 24 Si f est de signe quelconque mais bornée, f + et f − sont bornées, donc on peut choisir les suites (un ) et (vn ) pour que les convergences vers f + et f − soient toutes deux uniformes. Alors la suite (un − vn ) converge uniformément vers f . 2 Définition 4.15 Une fonction f : [a, b] −→ R est dite en escalier s’il existe une subdivision finie a = a0 < a1 < · · · < an = b de l’intervalle [a, b] telle que f soit constante sur chaque intervalle ]ai , ai+1 [. Remarque 4.16 Les valeurs prises exactement en chaque point a0 , a1 , . . . , an sont sans importance. Remarque 4.17 Une fonction en escalier a toujours pour espace de départ un intervalle compact de R, ce qui en fait un objet beaucoup moins général qu’une fonction étagée. D’ailleurs, une fonction en escalier est toujours un cas particulier de fonction étagée, au sens où elle est un élément de E (Bor([a, b])), car elle ne prend qu’un nombre fini de valeurs et elle est mesurable, en effet : les parties de [a, b] sur lesquelles f est constante sont des intervalles (les singletons sont bien sûr des intervalles) ou des réunions d’intervalles, donc des boréliens, donc l’image réciproque de toute partie de R est toujours un borélien de [a, b]. Le contre-exemple classique de la réciproque est 1Q , qui est étagée mais n’est en escalier sur aucun intervalle de R (non réduit à un point). Remarque 4.18 L’intégrale de Riemann est définie par approximation à partir de l’intégrale des fonctions en escalier, tandis que celle que nous étudions dans ce cours (parfois dite de Lebesgue) est construite à partir des fonctions étagées. Dans le premier cas, on approche l’intégrale d’une fonction quelconque par celle d’une fonction en escalier, c’est-à-dire en découpant l’espace de départ (un intervalle) en petits morceaux (les subdivisions), tandis que dans le second cas, c’est l’espace d’arrivée (qui est toujours R ou R̄) qui est découpé. Cette différence est fondamentale car la première approche ne peut se généraliser facilement à des fonctions ayant un autre espace de départ que R. Mais surtout les espaces de fonctions mesurables (celles qui admettront une intégrale au sens de Lebesgue) sont beaucoup plus grands que celui des fonctions Riemann-intégrables et ils sont stables sous l’action de multiples opérations comme le passage à la limite. Enfin, nous allons définir dans ce cours l’intégrale par rapport à une mesure quelconque, et pas seulement l’intégrale par rapport à la mesure de Lebesgue (celle qui a ceci de commun avec l’intégrale de Riemann qu’elle donne un sens mathématique à la notion physique de volume). Définition 4.19 Une fonction f : [a, b] −→ R est dite réglée si elle est limite uniforme de fonctions en escalier. Remarque 4.20 Toute fonction réglée est mesurable (on dira ici borélienne car les tribus de départ et d’arrivée sont des tribus de Borel) car limite de fonctions mesurables (et même étagées) que sont les fonctions en escalier. Théorème 4.21 (admis) Une fonction f est réglée ssi elle admet une limite à gauche en tout point de ]a, b] et une limite à droite en tout point de [a, b[. CHAPITRE 4. FONCTIONS MESURABLES 25 Corollaire 4.22 Toute fonction f : R −→ R monotone est réglée. Remarque 4.23 Toute fonction monotone est borélienne, car réglée. Mais cela peut se voir directement : toute fonction monotone est borélienne car pour tout a ∈ R, {f ≥ a} est une demie-droite, en effet : si m(a) := inf{x : f (x) ≥ a}, alors dans le cas où f est croissante par exemple, {f ≥ a} coïncide soit avec [m(a), +∞[, soit avec ]m(a), +∞[. Chapitre 5 Le cas borélien 5.1 (Rappels de) Topologie Définition 5.1 Une famille O(E) de parties d’un ensemble E est appelée topologie, et ses éléments des ouverts, si i) elle contient ∅ et E : ∅ ∈ O(E) et E ∈ O(E) ; ii) elle est stable par intersections finies : ∀U, V ∈ O(E), U ∩ V ∈ O(E) ; iii) elle est stable par réunion quelconque 1 : pour tout I ensemble d’indices et pour toute famille d’ouverts (Oi , i ∈ I), ∪i∈I Oi est un ouvert. Les complémentaires des ouverts sont appelés des fermés. Remarque 5.2 Les ouverts ∅ et E sont aussi des fermés ; les fermés sont stables par réunions finies et par intersections quelconques. Définition 5.3 On appelle voisinage de x ∈ E toute partie V de E telle qu’il existe un ouvert O pour lequel x ∈ O ⊆ V. Tout ouvert est donc voisinage de chacun de ses points. Définition 5.4 Dans un espace métrique (E, d), la topologie dite relative à la distance d est constituée des réunions quelconques de parties du type B(x, r) := {y ∈ E : d(x, y) < r} appelée boule ouverte de centre x et de rayon r. Remarque 5.5 Une partie O de l’espace métrique (E, d) est ouverte ssi ∀x ∈ O, ∃r > 0, B(x, r) ⊆ O (un ouvert O d’un espace métrique est la réunion des boules ouvertes contenues dans O). Une partie A de l’espace métrique (E, d) est fermée ssi pour toute suite (xn ) à valeurs dans A et convergeant vers une limite x, x ∈ A. Remarque 5.6 La topologie de R relative à la distance usuelle est donc constituée des réunions quelconques d’intervalles ouverts. 1. au sens où l’on ne fait pas d’hypothèse sur le cardinal de I 26 CHAPITRE 5. LE CAS BORÉLIEN 27 Définition 5.7 (et proposition) Le plus grand ouvert contenu dans A ⊆ E, c’est-àdire la réunion de tous les ouverts contenus dans A, est noté Å et appelé intérieur de A, ou ensemble des points intérieurs à A. En particulier, A est ouvert ssi A = Å. Dans le cas métrique, un point x ∈ E est intérieur à A ssi ∃ε > 0 tel que B(x, ε) ⊆ A. Définition 5.8 (et proposition) Le plus petit fermé contenant A ⊆ E, c’est-à-dire l’intersection de tous les fermés contenant A, est noté Ā et appelé adhérence de A, ou ensemble des points adhérents à A. En particulier, A est fermé ssi A = Ā. Dans le cas métrique, un point x ∈ E est adhérent à A ssi il existe une suite (xn ) à valeurs dans A telle que limn xn = x. Remarque 5.9 Pour tout A ⊆ E, l’intérieur de cA est le complémentaire de Ā et l’adhérence de cA est le complémentaire de Å. Définition 5.10 La frontière de A est le fermé ∂A := Ā \ Å. Définition 5.11 Soient E et F deux espaces topologiques. Une fonction f : E −→ F est dite continue si l’image réciproque par f de tout ouvert est un ouvert (ce qui est équivalent à dire que l’image réciproque par f de tout fermé est un fermé). Proposition 5.12 Soient E et F deux espaces métriques. Une fonction f : E −→ F est dite continue ssi pour toute suite (xn ) de E convergeant vers x, la suite (f (xn )) est aussi convergente et limn f (xn ) = f (x). Définition 5.13 Soit X ⊆ E. La topologie trace 2 de O(E) sur X est constituée des intersections des ouverts de E avec X. Dans le cas métrique, la topologie trace est la topologie relative à la restriction de la distance à X × X. Définition 5.14 La topologie produit de E × F est constituée des réunions quelconques de rectangles à côtés ouverts : O(E × F ) := {∪i∈I Ui × Vi , Ui ∈ O(E), Vi ∈ O(F ), I ensemble d’indices quelconque}. Proposition 5.15 La topologie produit est aussi la plus petite topologie qui rendent les projections canoniques πE et πF continues : πE : E × F −→ E (x, y) 7−→ x et πF : E × F −→ F (x, y) 7−→ y 2. dite aussi topologie induite CHAPITRE 5. LE CAS BORÉLIEN 28 Dans le cas métrique, la topologie produit est la topologie relative à toute distance classique du type d((x, y), (x0 , y 0 )) dE (x, x0 ) + dF (y, y 0 ) p dE (x, x0 )2 + dF (y, y 0 )2 OU OU dE (x, x0 ) ∨ dF (y, y 0 ). := Définition 5.16 On dit qu’une famille dénombrable d’ouverts (ωn )n∈N de E est une base dénombrable d’ouverts si tout ouvert de E s’écrit comme réunion d’éléments de cette famille, autrement dit : ∀O ∈ O(E), ∃I ⊆ N : O = ∪i∈I ωi ; ou de manière équivalente : ∀O ∈ O(E), ∀x ∈ O, ∃n ∈ N : x ∈ ωn ⊆ O. Proposition 5.17 Un espace métrique (E, d) est à base dénombrable d’ouverts ssi il contient une suite dense 3 . On dit alors que E est séparable. Sens ⇒ : soit (xn ) une suite de E telle que pour tout n, xn ∈ ωn . Alors la suite (xn ) est dense, en effet : pour tout x ∈ E, l’ouvert B(x, 1/n) s’écrit comme réunion d’ouverts du type ωi , donc ∃i(n) tel que ωi(n) ⊆ B(x, 1/n). Soit yn := xi(n) , alors d(yn , x) ≤ 1/n, donc yn → x. Sens ⇐ : si (xn ) est une suite dense, alors la famille {B(xn , r), n ∈ N, r ∈ Q?+ } est une base dénombrable d’ouverts car elle s’injecte dans N × Q (qui est dénombrable) et pour tout O ∈ O(E), [ O= B(xn , r), Dém. n,r:B(xn ,r)⊆O ce qui achève la démonstration. 2 Remarque 5.18 Rd est séparable car Qd est une suite dense. Les pavés ouverts (produits d’intervalles ouverts) à extrémités rationnelles forment une base dénombrable d’ouverts de Rd . Définition 5.19 (Borel-Lebesgue) Une partie A d’un espace topologique E est dite compacte si de tout recouvrement ouvert de A on peut extraire un sous-recouvrement fini, autrement dit pour toute famille (Ωi )i∈I d’ouverts de E telle que A ⊆ ∪i∈I Ωi , ∃J fini ⊆ I tel que A ⊆ ∪j∈J Ωj . Théorème 5.20 (Bolzano-Weierstrass) Une partie A d’un espace métrique E est compacte ssi toute suite à valeurs dans A admet au moins une valeur d’adhérence dans A 4. Corollaire 5.21 Tout compact est fermé. De plus, toute partie compacte d’un espace vectoriel normé 5 est bornée. 3. autrement dit : il existe un ensemble dénombrable (une suite, quoi) A tel que Ā = E (A est alors dit dense dans E) 4. autrement dit : admet au moins une sous-suite convergente de limite ∈ A 5. un espace vectoriel normé est un espace métrique, donc topologique CHAPITRE 5. LE CAS BORÉLIEN 29 Théorème 5.22 Dans un espace vectoriel normé de dimension finie, un fermé est compact ssi il est borné. Proposition 5.23 Un fermé contenu dans un compact est compact. L’image d’un compact par une fonction continue est compacte. Remarque 5.24 On rappelle que la topologie de R̄ est la topologie relative à √ la distance d définie par d(x, y) = |f (x) − f (y)| pour tous x, y ∈ R̄, où f (x) = x/ x2 + 1 et f (±∞) = ±1. En particulier, R̄ est compact et [x, +∞] est un compact de R̄. 5.2 Tribu borélienne et fonctions boréliennes Définition 5.25 Si E est un espace topologique, on note Bor(E) ou B(E) et on appelle tribu de Borel ou tribu borélienne, la tribu engendrée par les ouverts de E, autrement dit, B(E) := σ(O(E)). Les éléments de B(E) sont appelés parties boréliennes de E, ou plus simplement boréliens de E. Remarque 5.26 La tribu de Borel est aussi la tribu engendrée par la classe C des fermés de E, en effet : C ⊆ B(E) (donc σ(C ) ⊆ B(E)) car tout fermé est le complémentaire d’un ouvert, qui appartient à B(E), donc appartient aussi à B(E) ; O(E) ⊆ σ(C ) (donc σ(O(E)) ⊆ σ(C )) car tout ouvert est le complémentaire d’un fermé, qui appartient à σ(C ), donc appartient aussi à σ(C ) (même raisonnement). Remarque 5.27 Il existe des parties de R non boréliennes (voir dernière section de ce chapitre). En revanche, si E est dénombrable, muni de la topologie discrète : toute partie est ouverte (et fermée), donc borélienne : B(E) = P(E). Proposition 5.28 Si E admet une base dénombrable d’ouverts (ωn )n∈N , alors Bor(E) = σ({ωn ; n ∈ N}). Par double inclusion : {ωn ; n ∈ N} ⊆ O(E) ⊆ B(E), donc σ({ωn ; n ∈ N}) ⊆ B(E). Dans l’autre sens, on sait que tout ouvert O s’écrit comme réunion d’éléments de {ωn ; n ∈ N}. Comme une telle réunion est forcément dénombrable, O est un élément de σ({ωn ; n ∈ N}). On a donc O(E) ⊆ σ({ωn ; n ∈ N}), ce qui implique B(E) ⊆ σ({ωn ; n ∈ N}). 2 Dém. Corollaire 5.29 La tribu Bor(Rd ) est la tribu engendrée par la classe des pavés ouverts 6 , mais est aussi la tribu engendrée par les pavés ouverts à extrémités à coordonnées dans Q ou dans toute autre partie dense de R. Proposition 5.30 La tribu trace de Bor(E) sur une partie X de E est la tribu engendrée par la topologie trace de X. 6. pavé = produit d’intervalles ; pavé ouvert = produit d’intervalles ouverts CHAPITRE 5. LE CAS BORÉLIEN 30 Soit i : X → E l’injection canonique. La tribu trace est i−1 (B(E)) = i−1 (σ(O(E)) = σ(i−1 (O(E)), par le lemme de transport. Mais i−1 (O(E) n’est autre que la topologie trace, c’est-à-dire {A ∩ X, A ∈ O(E)}. 2 Dém. Définition 5.31 (terminologie) Si E1 et E2 sont des espaces topologiques, en notant Ai := Bor(Ei ), les éléments de F (A1 , A2 ) sont appelés fonctions boréliennes. Proposition 5.32 Soit f : (E, A ) → (F, B). Si F est topologique et B = Bor(F ), alors f est mesurable ssi pour tout ouvert O de F , f −1 (O) ∈ A . Lemme de transport : f −1 (σ(O(F ))) = σ(f −1 (O(F ))), or f est mesurable ssi f −1 (B(F )) ⊆ A , donc ssi σ(f −1 (O(F ))) ⊆ A , c’est-à-dire ssi f −1 (O(F )) ⊆ A . 2 Dém. Corollaire 5.33 Si E et F sont topologiques, alors toute fonction continue est borélienne. Proposition 5.34 Soit f : (E, A ) −→ (R2 , B(R2 )) x 7−→ (f1 (x), f2 (x)) Alors f est mesurable ssi fi ∈ F (A , B(R)) pour tout i = 1, 2. Remarque 5.35 Si C est identifié à R2 , une fonction complexe f est mesurable ssi <(f ) et =(f ) le sont. Sens ⇒ : pour tout i = 1, 2, la projection canonique πi : R2 → R est continue par définition de la topologie produit, donc borélienne, ainsi comme f est mesurable, fi = πi ◦ f est mesurable. Sens ⇐ : on sait que Bor(R2 ) est engendrée (par exemple) par les pavés ouverts. Donc par le lemme de transport, f est mesurable ssi pour tous intervalles ouverts U et V , f −1 (U × V ) ∈ A . Or f −1 (U × V ) = {f1 ∈ U } ∩ {f2 ∈ V }. Mais par hypothèse {f1 ∈ U } ∈ A et {f2 ∈ V } ∈ A , donc leur intersection est aussi dans A . 2 Dém. Pour toutes fonctions f, g ∈ F (A , B(R)) et pour tout λ ∈ R, λf +g est mesurable (autrement dit, F (A , B(R)) est un espace vectoriel), ainsi que les fonctions suivantes : f g, f ∧ g, f ∨ g, f + , f − , |f |, |f |p ,... Il suffit pour le voir d’utiliser la continuité des applications qui à (x, y) associent λx + y, xy, x ∧ y, etc. ainsi que le fait que la composée de deux applications mesurables est mesurable. Applications. 5.3 L’ensemble triadique de Cantor L’ensemble triadique de Cantor est un sous-ensemble de l’intervalle [0, 1]. C’est un exemple de partie de R qui ne contient aucun point isolé mais ne contient pas non plus d’intervalle ouvert. Il est défini comme la limite d’une suite décroissante de réunions CHAPITRE 5. LE CAS BORÉLIEN 31 finies d’intervalles fermés, ce qui en fait un fermé (comme intersection de fermés). Plus précisément, soit A0 l’intervalle [0, 1], A1 la réunion de l’intervalle [0, 1/3] et de l’intervalle [2/3, 1], et plus généralement An+1 la partie de An obtenue en divisant chaque composante connexe de An en trois sous-intervalles de tailles égales et en lui en ôtant le sous-intervalle central. Plus rigoureusement, An+1 := 31 An ∪ 13 (2 + An ). Définition 5.36 Le fermé K := limn ↓ An est appelé ensemble triadique de Cantor. Dans la proposition suivante, on appelle (provisoirement sans précautions mathématiques) « mesure de Lebesgue » d’une partie de R, sa longueur totale. L’objet ultérieur de ce cours sera en partie de donner une définition rigoureuse de ce concept... Proposition 5.37 L’ensemble triadique de Cantor peut s’écrire sous la forme ( ) X xn K= , xn ∈ {0, 2} . 3n n≥1 Il est compact, d’intérieur vide, équipotent à R, de mesure de Lebesgue nulle. Remarque 5.38 Tout ensemble dénombrable est de mesure de Lebesgue nulle, comme réunion dénombrable d’ensembles de mesure nulle (les singletons le constituant). On voit ici que la réciproque est fausse : K est un exemple d’ensemble de mesure de Lebesgue nulle mais non dénombrable. K est fermé borné dans R donc compact. Par une récurrence immédiate, on voit @ que les composantes connexes de An qui sont des intervalles fermés de longueur 3−n dont (n) P x (n) les extrémités sont les nombres réels de la forme nk=1 3kn + 3εnn , où xk ∈ {0, 2} et εn ∈ {0, 1} : pour chaque intervalle, εn = 0 correspond à l’extrémité gauche, et εn = 1 correspond à l’extrémité droite. Montrons l’égalité annoncée par double : Pn inclusion xk ⊇ : pour toute suite (xk ) à valeursPdans {0, 2}, pour tout entier n, k=1 3n ∈ An ⊆ K, xk donc comme K est fermé, la limite ∞ k=1 3n ∈ K. ⊆ : soit x ∈ K et soit x(n) l’extrémité gauche de la composante connexe de An qui contient x. En particulier |x(n) − x| ≤ 3−n . Cherchons une relation entre x(n) et x(n+1) . Lorsqu’on passe de An à An+1 , soit x est dans le sous-intervalle de gauche, auquel cas 2 x(n+1) = x(n) , soit x est dans le sous-intervalle de droite, auquel cas x(n+1) = x(n) + 3n+1 . x n+1 (n+1) (n) (0) On peut donc écrire x = x + 3n+1 , où xn+1 ∈ {0, 2}, et comme x = 0, cela donne P P xk (n) x(n) = nk=1 x3kk , qui converge en croissant vers y := ∞ − x| ≤ 3−n donc k=1 3k . Or |x la suite (x(n) ) converge vers x, ce qui implique y = x. Montrons que K̊ = ∅. Soit x ∈ K et ε > 0. La boule B(x, ε) intersecte cAn pour tout n dès que 3−n < ε. Donc B(x, ε) intersecte ∪n cAn , qui n’est autre que le complémentaire de ∩n An = K. Ainsi, K ne contient aucune boule ouverte centrée sur x, c’est-à-dire que x n’est pas intérieur à K. Dém. CHAPITRE 5. LE CAS BORÉLIEN 32 Montrons que K a la puissance du continu. L’application ? f : {0, 2}N −→ K X xn (xn ) 7−→ 3n n≥1 ? est une injection donc Card(K) ≥ Card({0, 2}N ) = Card(R). D’autre part Card(R) ≤ @ Card(K) puisque K ⊆ R. Enfin K est de mesure de Lebesgue nulle car K = limn ↓ An donc 7 λ(K) = limn ↓ n λ(An ) = limn ↓ 32 = 0. 2 5.4 Une partie de R non borélienne Les tribus sont des familles de parties qui sont destinées à être mesurées. Pour pouvoir mesurer des parties suffisamment compliquées comme celles qui ne peuvent être définies que par des passages à la limite (comme l’ensemble triadique de Cantor), les tribus doivent être assez fines pour être stables par des opérations relativement générales comme le passage au complémentaire, les réunions et intersections dénombrables. Néanmoins, elles ne doivent pas être si fines qu’elles contiennent des parties non mesurables, comme l’exemple qui va suivre. On définit la relation d’équivalence ∼ sur R : x ∼ y ⇔ x − y ∈ Q. En se servant de l’axiome du choix, on peut supposer l’existence d’une partie A de ]0, 1[ qui contient exactement un représentant et un seul de chaque classe d’équivalence de la relation ∼. En particulier, A n’est pas dénombrable, mais surtout nous allons montrer que A ne peut admettre de mesure de Lebesgue. Cette assertion implique (mais est plus forte que) l’assertion suivante : A n’est pas borélienne. En effet, nous verrons (plus tard) que tout borélien admet une mesure de Lebesgue. Montrons par l’absurde que A ne peut admettre de mesure de Lebesgue : soit λ(A) ∈ [0, +∞] la mesure de A (nous verrons que λ est la notation usuelle de la mesure de Lebesgue). Soit [ L := (r + A), r∈Q∩]−1,1[ où r + A = {r + x, x ∈ A}. Comme A admet une mesure, alors chaque partie r + A en admet une aussi, qui vaut d’ailleurs λ(A) par invariance par translation de la mesure de Lebesgue. Comme L est réunion dénombrable de parties admettant une mesure, ce doit être également son cas. Montrons que ]0, 1[⊆ L. Pour tout x ∈]0, 1[, désignons par a = a(x) le représentant de sa classe d’équivalence contenu dans A. Alors en particulier, x − a ∈ Q, et x − a ∈] − 1, 1[, 7. Propriété de continuité de la mesure pour les suites décroissantes dont un élément est de mesure finie, ce que nous verrons bientôt... CHAPITRE 5. LE CAS BORÉLIEN 33 donc r := x − a ∈ Q∩] − 1, 1[, et comme x ∈ r + A, x ∈ L. On a aussi L ⊆] − 1, 2[, donc on en déduit 1 ≤ λ(L) ≤ 3. Montrons que les parties r + A (r ∈ Q) sont deux à deux disjointes. Soient r, s ∈ Q. Si (r + A) ∩ (s + A) 6= ∅, alors il existe a, b ∈ A tels que z = r + a = s + b, donc b − a = r − s ∈ Q. Par conséquent a ∼ b, mais comme a, b ∈ A qui ne contient qu’un représentant de chaque classe d’équivalence, a = b, donc r = s. Par σ-additivité, nous en déduisons X X λ(L) = λ(∪r (r + A)) = λ(r + A) = λ(A). r r Cette somme ne peut être qu’infinie (si λ(A) 6= 0) ou nulle (si λ(A) = 0), ce qui contredit l’inégalité 1 ≤ λ(L) ≤ 3. 2 Chapitre 6 Mesures 6.1 Définitions et propriétés Définition 6.1 Une mesure 1 sur l’espace mesurable (E, A ) est une application µ : A → [0, +∞] qui : (i) associe la valeur 0 à l’ensemble vide : µ(∅) = 0 ; (ii) est σ-additive : pour toute suite (An ) d’éléments de A deux à deux disjoints, X µ(An ). µ(∪n An ) = n On dit que (E, A , µ) est un espace mesuré, et pour tout A ∈ A , on appelle µ(A) la mesure de A. Remarque 6.2 On a besoin de la σ-additivité pour pouvoir calculer la mesure de parties compliquées construites comme limites d’ensembles plus simples que l’on sait mesurer. P Remarque 6.3 Dans l’égalité µ(∪n An ) = n µ(An ), on remarque que l’ordre de sommation (membre de droite) n’intervient pas car la série est à termes positifs, ce qui est cohérent avec le membre de gauche. On remarquera également que la σ-additivité implique l’additivité finiePgrâce à (i) : si l’on définit Ai = ∅ pour tout i ≥ n + 1, alors µ(∪ni=1 Ai ) = µ(∪∞ i=1 Ai ) = i≥1 µ(Ai ) = Pn i=1 µ(Ai ). Proposition 6.4 Une mesure µ sur un (E, A ) vérifie pour tous A, B ∈ A : (i) Additivité finie : µ(A) = µ(A \ B) + µ(A ∩ B) ; (ii) Additivité forte : µ(A ∪ B) + µ(A ∩ B) = µ(A) + µ(B) ; (iii) Sous-additivité : µ(A ∪ B) ≤ µ(A) + µ(B) ; (iv) Croissance : si A ⊆ B, µ(A) ≤ µ(B). Remarque 6.5 En (ii), prendre garde de ne pas écrire µ(A ∪ B) = µ(A) + µ(B) − µ(A ∩ B), qui pourrait être une forme indéterminée, si µ(A ∩ B) = +∞. 1. Il est sous-entendu que nous ne considérons dans ce cours que des mesures positives 34 CHAPITRE 6. MESURES 35 (i) A \ B et A ∩ B sont disjoints et leur réunion est A. (ii) A \ B, A ∩ B et B \ A sont disjoints et leur réunion est A ∪ B, donc Dém. µ(A \ B) + µ(A ∩ B) + µ(B \ A) = µ(A ∪ B), donc en ajoutant µ(A ∩ B) à chaque membre on obtient µ(A \ B) + µ(A ∩ B) + µ(B \ A) + µ(A ∩ B) = µ(A ∪ B) + µ(A ∩ B), mais dans le premier membre, grâce à (i), la somme des deux premiers termes vaut µ(A) et la somme des deux derniers termes vaut µ(B). (iii) Si µ(A) + µ(B) = +∞, l’assertion est évidente, tandis que dans le cas contraire, grâce à (ii), µ(A∪B)+µ(A∩B) < ∞, donc en particulier µ(A∩B) < ∞. Par conséquent on peut retrancher µ(A ∩ B) à l’égalité (ii), ce qui donne µ(A ∪ B) = µ(A) + µ(B) − µ(A ∩ B) ≤ µ(A) + µ(B). (iv) D’après (ii) si A ⊆ B, alors µ(B) = µ(B \ A) + µ(B ∩ A) = µ(B \ A) + µ(A) ≥ µ(A), 2 qui est l’inégalité souhaitée. Proposition 6.6 Une application µ : A → [0, +∞] est une mesure ssi : (i) µ(∅) = 0 ; (ii) µ est finiment additive : pour tous éléments P Ai (i ∈ I) deux à deux disjoints de la tribu A , si I est fini, alors µ(∪i∈I Ai ) = i∈I µ(Ai ). (iii) µ est continue à gauche 2 : pour toute suite croissante (An )n∈N d’éléments de A, µ(lim ↑ An ) = lim ↑ µ(An ). n n Remarque 6.7 On se rappellera qu’ici, la suite (An )n∈N étant croissante, limn ↑ An n’est autre que ∪n An . Dém. Montrons d’abord le sens ⇒ et supposons donc que µ est une mesure. On a déjà vu que (i) et (ii) sont vraies. Montrons la continuité à gauche. Soit (An ) une suite croissante de parties mesurables et soient B0 := A0 , et pour tout entier naturel non nul n, Bn := An \ An−1 . Alors les (Bn ) sont des éléments de A deux à deux disjoints, donc X µ(∪n Bn ) = µ(Bn ). n Mais d’une part, ∪n Bn = ∪n An = limn ↑ An et d’autre part, X n µ(Bn ) = lim n n X k=0 µ(Bk ) = lim µ(∪nk=0 Bk ) = lim µ(An ). n n 2. il s’agit d’une expression figurée qui signifie ‘continue pour les suites croissantes’ et est utilisée par analogie avec les fonctions : R → R pour qui ces deux expressions sont synonymes CHAPITRE 6. MESURES 36 Montrons maintenant ⇐. Soit donc µ vérifiant les trois propriétés de la proposition. Il nous suffit de montrer que µ est bien σ-additive. Soient (An ) mesurables et deux à deux disjointes. Soit Bn := ∪nk=0 Ak , alors (Bn ) est une suite croissante donc µ(∪n Bn ) = limn µ(Bn ). Mais d’une part µ(∪n Bn ) = µ(∪n ∪nk=0 AP k ) = µ(∪n An ), et d’autre part, comme µ est finiment additive, µ(Bn ) = µ(∪nk=0 Ak ) = nk=0 µ(Ak ). Ainsi µ(∪n An ) = µ(∪n Bn ) = lim µ(Bn ) = lim n n n X µ(Ak ) = X µ(An ), n k=0 2 ce qui montre la σ-additivité de µ. Corollaire 6.8 Toute mesureP µ est sous σ-additive, au sens où pour toute suite (An ) d’éléments de A , µ(∪n An ) ≤ n µ(An ). P Soit Bn := ∪nk=0 Ak . Par sous-additivité, µ(Bn ) ≤ nk=0 µ(Ak ). Mais comme la suite (Bn ) croît et converge vers ∪n An , en passant à la limite dans l’inégalité précédente, on obtient Dém. µ(∪n An ) = µ(∪n Bn ) = lim µ(Bn ) ≤ lim n n n X µ(Ak ) = k=0 X µ(An ), n où la deuxième égalité est due à la continuité à gauche des mesures. 2 Exemple 6.9 Quelques exemples de mesures : – la mesure nulle est définie sur P(E) (et donc sur toute autre tribu) par µ(A) := 0 pour tout A ⊆ E ; – la mesure grossière sur P(E) : µ(A) := +∞ dès que A 6= ∅ (et µ(∅) = 0) ; – pour tout a ∈ E, la mesure de Dirac au point a est définie pour tout A ∈ P(E) par 1 si a ∈ A µ(A) := 0 sinon. Cette mesure est souvent notée δa ; – la mesure de comptage sur P(E) : Card(A) si A est fini µ(A) := +∞ sinon, où Card(A) désigne ici le nombre d’éléments de l’ensemble A. – soit un espace mesuré (E, A , µ) et X une partie de E. SI X ∈ A , alors on peut définir la mesure trace µX de µ sur X par µX (A) := µ(A ∩ X) pour tout A ∈ A . Exercice 6.10 Démontrer que la mesure de comptage est bien une mesure en prouvant qu’elle vérifie les trois propriétés de la Proposition 6.6 : elle prend la valeur 0 en ∅, elle est finiment additive et elle est continue à gauche. CHAPITRE 6. MESURES 6.2 37 Mesure de Lebesgue La mesure de Lebesgue est une mesure définie sur la tribu de Borel de Rd . Elle donne un sens mathématique à la notion physique de volume (de surface si d = 2, de longueur si d = 1). Rappelons que cette mesure n’est pas définie sur tout P(Rd ), ce que nous avons démontré au chapitre précédent dans le cas d = 1 à l’aide de l’axiome du choix. d Théorème 6.11 Qd Il existe une unique mesure sur Qdles boréliens de R telle que la mesure de tout pavé i=1 ]ai , bi [ soit égale au produit i=1 (bi − ai ). Cette mesure est appelée mesure de Lebesgue et est ordinairement notée λd , voire λ s’il n’y a pas d’ambiguïté sur la dimension. Remarque 6.12 Montrer qu’il existe une unique mesure qui vérifie certaines propriétés se dit « construire une mesure ». Le théorème dont on se sert pour montrer l’unicité s’appelle théorème de la classe monotone, et celui dont on se sert pour l’existence s’appelle théorème de Caratheodory. Nous énoncerons ces théorèmes au second semestre (Intégration II) et démontrerons même le premier. Pour le moment le théorème qui précède reste admis. Exercice 6.13 Montrer que si A est un borélien de Rd alors tous les translatés de A sont des boréliens (se servir du fait qu’une translation est une application bijective et continue). Proposition 6.14 Soit µ une mesure sur Bor(Rd ) qui vérifie les deux propriétés suivantes : (i) invariance par translation : pour tout borélien A et toute translation f , µ(f (A)) = µ(A) ; (ii) le pavé unité est de mesure 1 : µ [0, 1]d = 1. Alors µ est la mesure de Lebesgue. Nous ne détaillons ici que le cas d = 1. Le cas général est laissé au lecteur. @ a) Nous montrons d’abord par l’absurde que µ est nulle sur les singletons. S’il existe x ∈ R tel que µ({x}) = ε > 0, alors par invariance par translation, µ({y}) = ε pour P tout y ∈ R. Par conséquent, µ(Q ∩ [0, 1]) = y∈Q∩[0,1] ε = +∞, ce qui constitue une contradiction puisque µ(Q ∩ [0, 1]) ≤ µ([0, 1]) = 1. b) D’après ce qui précède, pour tout entier naturel n ≥ 1, X n n X k−1 k 1 1 , = µ 0, = nµ 0, , 1 = µ([0, 1]) = µ n n n n k=1 k=1 Dém. d’où µ(]0, 1/n[) = 1/n. De plus, pour tous entiers k1 ≤ k2 , µ k1 k2 , n n = k2 X j=k1 +1 µ j−1 j , n n = k2 X j=k1 1 k2 − k1 µ 0, = . n n +1 CHAPITRE 6. MESURES 38 c) Soient r < r0 deux rationnels, que l’on peut écrire sous la forme r = p/q et r0 = p0 /q 0 , où p, p0 , q, q 0 sont des entiers. Alors d’après ce qui précède, 0 0 p p0 pq p q p0 q − pq 0 0 µ (]r, r [) = µ , 0 =µ = , 0 = r0 − r. 0 0 q q qq qq qq d) Passons maintenant à la limite sur les rationnels. Soient a < b deux nombres réels. Alors il existe une suite décroissante (an ) et une suite croissante (bn ), toutes deux constituées de nombres rationnels, dont les limites sont resp. a et b. Alors la suite d’intervalles (]an , bn [) est une suite croissante qui converge vers ]a, b[, donc par continuité à gauche des mesures, µ(]a, b[) = µ(lim ↑]an , bn [) = lim ↑ µ(]an , bn [) = lim ↑ (bn − an ) = b − a, n n n ce qui montre que la mesure de tout intervalle est sa longueur, et garantit ainsi que µ est la mesure de Lebesgue sur R. 2 6.3 Autres définitions et autres propriétés Définition 6.15 Une mesure µ sur un espace mesurable (E, A ) : – est dite finie, ou bornée, si µ(E) < ∞ (ce qui équivaut à : µ(A) < ∞ pour tout A ∈ A ). Le nombre réel µ(E) est alors appelé masse totale de µ ; – est appelée (mesure de) probabilité si sa masse totale vaut 1 ; – est dite σ-finie s’il existe une suite (En ) de parties mesurables de E telles que µ(En ) < ∞ et ∪n En = E ; – est appelée mesure de Borel 3 si E est topologique, localement compact 4 et séparable 5 , que A est la tribu borélienne de E et que µ est finie sur les compacts : µ(K) < ∞ pour tout compact K de E 6 . Remarque 6.16 Si µ est une mesure de Borel alors elle est σ-finie car E étant localement compact et séparable, il peut s’écrire comme réunion dénombrable de compacts (on dit qu’il est σ-compact) : E = ∪n∈N En où tous les En sont compacts donc vérifient µ(En ) < ∞. P En revanche la réciproque est fausse. Soit µ la mesure sur R définie par µ = n αn δxn P (voir Corollaire 6.21) où n αn = ∞ et (xn ) est une suite de réels deux à deux distincts et de limite x finie. Alors µ est une mesure σ-finie (prendre En = R \ {xk ; k ≥ n}) mais elle n’est pas de Borel car tout voisinage compact de x est de mesure infinie. Proposition 6.17 (Continuité pour les suites décroissantes de mesure finie) Si (An ) est une suite décroissante de A telle que µ(An ) < ∞ à partir d’un certain rang, 3. ou parfois mesure de Radon. En fait, le terme « mesure de Radon » fait référence à une forme linéaire positive sur un espace de fonction continues à support compact. Le théorème de représentation de Riesz assure que toute mesure de Radon est en fait une intégrale par rapport à une mesure de Borel 4. autrement dit : pour tout point x ∈ E, il existe un ouvert contenant x et inclus dans un compact de E 5. rappel : admettant une suite dense 6. rappel : un compact est fermé donc borélien CHAPITRE 6. MESURES 39 alors lim ↓ µ(An ) = µ(lim ↓ An ), n n qui n’est autre que µ(∩n An ). Remarque 6.18 Un corollaire immédiat de la proposition précédente est que les mesures finies sont continues à droite. La mesure de Lebesgue est un exemple de mesure non continue à droite : si An := [n, +∞[, alors (An ) est une suite décroissante de limite ∅, mais comme (λ(An )) est identiquement égale à +∞, elle converge vers +∞, et non pas vers λ(∅) = 0. Dém. Par hypothèse, il existe n0 tel que pour tout n ≥ n0 , µ(An ) < ∞. Soit alors Bn := An0 \ An . La suite (Bn ) est croissante et converge vers An0 \ ∩n An , donc µ(An0 )−µ(∩n An ) = µ(lim ↑ Bn ) = lim ↑ µ(Bn ) = lim ↑ (µ(An0 )−µ(An )) = µ(An0 )−lim ↓ µ(An ), n n n n 2 ce qui donne bien µ(∩n An ) = limn ↓ µ(An ). Proposition 6.19 Pour toute suite (An ) d’éléments de la tribu A , si µ est une mesure finie (ou s’il existe B de mesure finie tel que An ⊆ B à partir d’un certain rang), alors µ lim inf An ≤ lim inf µ(An ) ≤ lim sup µ(An ) ≤ µ lim sup An . n n n n La première inégalité reste valable sans les hypothèses qui précèdent. Soit Bn := ∩k≥n Ak . Alors (Bn ) est une suite croissante qui converge vers lim inf n An , donc µ(lim inf n An ) = limn ↑ µ(Bn ). Or Bn ⊆ An donc µ(Bn ) ≤ µ(An ) et par conséquent limn µ(Bn ) = lim inf n µ(Bn ) ≤ lim inf n µ(An ), ce qui assure la première inégalité. Concernant les limites supérieures, supposons que µ est finie (mais sous l’hypothèse plus faible de l’énoncé, la démonstration est la même). Alors @ c µ lim sup An = µ(E) − µ lim inf An ≥ µ(E) − lim inf µ(cAn ) Dém. n n n = µ(E) − lim inf (µ(E) − µ(An )) = lim sup µ(An ), n où l’inégalité est due à la conclusion précédente. Terminons ce chapitre par la n 2 Proposition 6.20 a) Si (µn ) est une suite croissante de mesures, au sens où pour tout A ∈ A , µn (A) ≤ µn+1 (A), alors l’égalité µ(A) := limn ↑ µn (A) ∈ [0, +∞] définit une mesure µ sur A . b) Tout combinaison linéaire dénombrable, à coefficients positifs, de mesures, est une mesure. CHAPITRE 6. MESURES 40 Pour b), il suffitPde montrer qu’une combinaison linéaire finie, à coefficients positifs, de mesures, soit nk=0 αk µk , est toujours une mesure, car alors a) impliquera b). En effet, une combinaison linéaire à coefficients positifs dénombrable est simplement la limite croissante d’une suite de sommes partielles. La démonstration se fait (par exemple) sur le même modèle que celle qui suit. @ Démontrons a) grâce à la Proposition 6.6. (i) comme µn (∅) = 0, µ(∅) = limn µn (∅) = 0. (ii) pour tout ensemble d’indices fini I, pour toutes parties mesurables (Ai )i∈I deux à deux disjointes, l’additivité finie de chaque µn s’écrit X µn (∪i∈I Ai ) = µn (Ai ). Dém. i∈I L’additivité finie de µ s’obtient en faisant tendre n → ∞ dans chaque membre (car le membre de droite est une somme finie). (iii) soit maintenant une suite croissante (Ak ) d’éléments de la tribu A . La suite doublement indicée (µn (Ak )) est croissante en k ET en n, ce qui garantit que l’on peut @ intervertir les limites en n et en k, d’où : µ lim ↑ Ak = lim ↑ µn lim ↑ Ak = lim ↑ lim ↑ µn (Ak ) = lim ↑ lim ↑ µn (Ak ) = lim ↑ µ(Ak ), k n k n k k n où la deuxième égalité est due à la continuité à gauche de chaque mesure µn . k 2 Corollaire 6.21 Pour toute P suite (xn ) d’éléments d’un ensemble E, pour toute suite (αn ) de nombre réels positifs, n αn δxn est une mesure sur P(E). Remarque 6.22 Le résultat précédent montre que l’on peut définir sur n’importe quel espace des mesures qui sont un peu moins élémentaires que les exemples généraux donnés dans la première section. Chapitre 7 Intégrale par rapport à une mesure des fonctions mesurables positives 7.1 Intégrale des fonctions étagées positives Notation 7.1 Pour tout espace mesurable (E, A ), on notera E+ (A ) l’ensemble des éléments de E (A ) (fonctions étagées) à valeurs positives. Définition 7.2 Pour toute fonction f ∈ R E+ (A ), on appelle intégrale de f par rapport à une mesure µ sur (E, A ), et l’on note E f dµ l’élément de [0, +∞] Z X f dµ := αµ({f = α}), E α∈f (E) avec la convention habituelle 0 × ∞ = 0. Remarque 7.3 La définition P précédente ne dépend (heureusement) pas de la représen- @ tation de f sous la forme f = i∈I αi 1Ai , car on a toujours l’égalité Z X αi µ(Ai ). f dµ = E i∈I Notation 7.4 On notera indifféremment l’intégrale de f par rapport à la mesure µ sous une des formes suivantes Z Z Z f dµ, f (x) dµ(x), f (x) µ(dx), E E E voire en omettant l’indice E du signe intégral. Proposition 7.5 Pour tout f ∈ E+ (A ), Z f dµ < ∞ ⇔ µ({f 6= 0}) < ∞. E 41 CHAPITRE 7. INTÉGRALE DES FONCTIONS POSITIVES Dém. P Soit f = i∈I αi 1Ai . Alors X αi µ(Ai ) < ∞ ⇐⇒ ∀i ∈ I 42 (αi 6= 0 ⇒ µ(Ai ) < ∞) i∈I X ⇐⇒ µ(Ai ) < ∞ i∈I:αi 6=0 ! [ ⇐⇒ µ < ∞, Ai i∈I:αi 6=0 2 S ce qui achève la démonstration, car i∈I:αi 6=0 Ai = {f 6= 0}. R Exemple 7.6 Si f est nulle alors E f dµ = 0. Si µ = δa , alors Z X f dµ = αµ({f = α}) = f (a). E α∈f (E) Si µ est la mesure de Lebesgue sur R, Z 1Q dλ = λ(Q) = 0. R R Proposition 7.7 L’application f 7→ E f dµ du cône E+ (A ) dans R̄+ jouit des propriétés suivantes : R R R (i) additivité : (f + g) dµ = f dµ + g dµ ; R R (ii) positive homogénéité : pour tout réel positif a, R(af ) dµ =R a f dµ ; (iii) croissance : pour tous f, g ∈ E+ (A ), f ≤ g ⇒ f dµ ≤ g dµ. P P Soient f = i∈I αi 1Ai et g = j∈J βj 1Bj , où les αi , βj sont des réels positifs ou nuls, et (Ai )i∈I , (Bj )j∈J sont des partitions finies de E. (i) Remarquons que (Ai ∩ Bj )(i,j)∈I×J est une partition finie de E et que X f +g = (αi + βj )1Ai ∩Bj . Dém. (i,j)∈I×J Par conséquent, Z X (f + g) dµ = (αi + βj )µ(Ai ∩ Bj ) E i,j = X = X αi µ(Ai ∩ Bj ) + i,j αi X µ(Ai ∩ Bj ) + j∈J X i∈I X βj µ(Bj ) j∈J Z f dµ + E X j∈J αi µ(Ai ) + Z = βj µ(Ai ∩ Bj ) i,j i∈I = X g dµ. E βj X i∈I µ(Ai ∩ Bj ) CHAPITRE 7. INTÉGRALE DES FONCTIONS POSITIVES 43 P (ii) Pour tout a ≥ 0, af = i∈I aαi 1Ai , d’où Z Z X X (af ) dµ = aαi µ(Ai ) = a αi µ(Ai ) = a f dµ. E i∈I E i∈I R (iii) En R écrivant g = f +R (g − f ),Roù g − f est étagée positive, d’après (i), f dµ + (g − f ) dµ, donc g dµ ≥ f dµ. 7.2 R g dµ = 2 Intégrale des fonctions mesurables positives Notation 7.8 Pour tout espace mesurable (E, A ), on notera F+ (A ) l’ensemble des élémnets de F (A , Bor(R̄)) (fonctions mesurables à valeurs dans R̄) à valeurs positives. Définition 7.9 Pour tout f ∈ F+ (A ), on appelle intégrale de f par rapport à µ, et l’on R note 1 E f dµ l’élément de [0, +∞] Z Z f dµ := sup g dµ : g ∈ E+ (A ), g ≤ f . E Si R E E f dµ < ∞, on dira que f est intégrable. Proposition 7.10 R R (croissance de l’intégrale) Pour toutes f, g ∈ F+ (A ), si f ≤ g, alors E f dµ ≤ E g dµ. Dém. Si ϕ ∈ E+ (A ) est telle que ϕ ≤ f alors ϕ ≤ g donc Z Z sup ϕ dµ : ϕ ∈ E+ (A ), ϕ ≤ f ≤ sup ϕ dµ : ϕ ∈ E+ (A ), ϕ ≤ g E E 2 ce qui est l’inégalité recherchée. Théorème 7.11 (Théorème de Beppo Levi, ou de convergence monotone) Si (fn ) est une suite croissante de F+ (A ), alors nous savons que f := limn ↑ fn ∈ F+ (A ), mais surtout Z Z f dµ = lim ↑ fn dµ. E R n E Corollaire 7.12 L’intégrale E f dµ est la limite des intégrales suite arbitraire de fonctions étagées positives croissant vers f . R E fn dµ, où (fn ) est une R Remarque 7.13 Le corollaire précédent assure qu’on aurait pu définir E f dµ comme la limite (et non la borne supérieure etc.) des intégrales de toute suite de fonctions étagées positives croissant vers f , mais l’inconvénient est qu’il aurait fallu auparavant montrer que cette limite ne dépend effectivement pas de la suite de fonctions choisie. 1. la même notation est encore utilisée, car il s’agit d’un prolongement de l’intégrale initialement définie pour les fonctions étagées positives, aux fonctions mesurables positives CHAPITRE 7. INTÉGRALE DES FONCTIONS POSITIVES 44 Montrons d’abord l’inégalité ≥. Comme pour tout ≤ f , par croissance de l’intégrale on a également Z Z Z fn dµ ≤ fn+1 dµ ≤ f dµ, Dém. du théorème de Beppo Levi. entier n, on a fn ≤ fn+1 E E E R R ce qui prouve en passant à la limite que limn ↑ E fn dµ ≤ E f dµ. Montrons maintenant l’autre inégalité. Par définition de l’intégrale de f , ilR suffit de montrerR que pour toute fonction étagée positive ϕ telle que ϕ ≤ f , on a ϕ dµ ≤ limn ↑ E fn dµ. Soit alors a ∈ [0, 1[ et En := {aϕ ≤ fn }. Comme ϕ ≤ f , on a l’égalité E = ∪n En , en effet : – sur {f = 0}, fn = ϕ = 0 pour tout entier n, donc {f = 0} ⊆ En et par conséquent {f = 0} ⊆ ∪n En ; – sur {f > 0}, aϕ < f car ϕ ne prend que des valeurs finies. Donc pour tout x ∈ {f > 0}, il existe un rang N (x) tel que pour tout n ≥ N (x), aϕ(x) ≤ fn (x), autrement dit x ∈ En , et par conséquent x ∈ ∪n En . P En conclusion, E = {f = 0} ∪ {f > 0} ⊆ ∪n En . Or en notant ϕ = i∈I αi 1Ai , Z X Z X αi 1Ai ∩En dµ = aαi µ(Ai ∩ En ). aϕ1En dµ = a E i∈I E i∈I Ainsi comme les En croissent vers E, par continuité à gauche de la mesure, limn ↑ µ(Ai ∩ En ) = µ(Ai ) pour tout i ∈ I, ce qui s’écrit, I étant fini, Z Z X aϕ1En dµ = aαi µ(Ai ) = a ϕ dµ. lim ↑ n E E i∈I D’autre part En = {aϕ ≤ fn }, donc aϕ1En ≤ fn , d’où Z Z Z aϕ1En dµ ≤ fn dµ ≤ lim ↑ fn dµ. E n E E En se servant des deux équations qui précédent et notamment en passant à la limite dans la dernière inégalité, on trouve Z Z fn dµ. a ϕ dµ ≤ lim ↑ E n E L’inégalité cherchée est donc prouvée, car a est arbitrairement proche de 1. 2 Proposition 7.14 (Lemme de Fatou) Pour toute suite (fn ) de F+ (A ), nous savons que lim inf n fn ∈ F+ (A ), mais surtout Z Z lim inf fn dµ ≤ lim inf fn dµ. E n n E Remarque 7.15 Pour fn = 1An où An ∈ A , le lemme de Fatou se traduit par une inégalité que nous connaissions déjà @ µ lim inf An ≤ lim inf µ(An ). n n CHAPITRE 7. INTÉGRALE DES FONCTIONS POSITIVES 45 Soit gn := inf k≥n fk et g := lim inf n fn = limn ↑ gn . Comme g est la limite de la suite croissante (gn ), le théorème de Beppo Levi assure que Z Z g dµ = lim ↑ gn dµ. Dém. n E E R R D’autre part, gn ≤ fn donc par croissance de l’intégrale, E gn dµ ≤ E fn dµ et Z Z lim inf gn dµ ≤ lim inf fn dµ. n n E Mais d’après ce qui précède, lim inf n l’inégalité souhaitée. R E g dµ = limn E n R g dµ = E n R E g dµ, ce qui fournit 2 Proposition 7.16 Les propriétés de positive homogénéité et d’additivité passent (comme celle de croissance) aux intégrales de fonctions mesurables positives. En d’autres termes pour tout a ≥ 0 et pour tout f ∈ F+ (A ), Z Z Z Z Z g dµ. f dµ + (f + g) dµ = (af ) dµ = a f dµ et E E E E E Comme f et g sont mesurables et positives, il existe d’après le lemme fondamental d’approximation des suites croissantes (fn ) et (gn ) de fonctions étagées positives croissant vers f et g respectivement. La proposition se prouve en écrivant les propriétés de positive homogénéité et d’additivité pour ces fonctions étagées et en appliquant à chaque suite d’intégrales le théorème de Beppo Levi. 2 @ P Proposition 7.17 Pour toute suite (fn ) de F+ (A ), nous savons que n fn ∈ F+ (A ), mais surtout ! Z XZ X fn dµ. fn dµ = Dém. E n n E P Il suffit de poser gn := nk=0 fk , d’utiliser l’additivité de l’intégrale et d’appliquer le théorème de Beppo Levi à la suite croissante (gn ). 2 @ Dém. Corollaire 7.18 Pour tout f ∈ F+ (A ), l’application ν : A −→ [0, +∞] Z A 7−→ f 1A dµ E est une mesure sur (E, A ) appelée mesure de densité f par rapport à µ. R R Notation 7.19 On note souvent A f dµ à la place 2 de E f 1A dµ. 2. ce qui d’ailleurs est cohérent avec le cas trivial A = E... CHAPITRE 7. INTÉGRALE DES FONCTIONS POSITIVES 46 Vérifions les deux propriétés caractérisant les mesures. Tout d’abord ν(∅) = 0 car f 1∅ est la fonction étagée nulle partout. Montrons à présent que ν est σ-additive. Soient (An ) une suite d’éléments de A deux à deux disjoints. D’après la proposition qui précède le corollaire, nous pouvons échanger sommation et intégrale de sorte que Z Z X ν (∪n An ) = f 1∪n An dµ = f 1An dµ Dém. E E n = Z X E f 1An dµ = XZ n n f 1An dµ = E X ν(An ), n 2 ce qui achève la démonstration. Proposition 7.20 Si µ est finie alors pour tout f ∈ F+ (A ), f bornée =⇒ f intégrable. Si f est bornée, il existe un nombre réel positif a tel que f ≤ a1E , donc aµ(E) < ∞, car par hypothèse µ est finie. Dém. R E f dµ ≤ 2 Proposition 7.21 (Inégalité de Markov) Pour tout f ∈ F+ (A ), pour tout a > 0, Z 1 f dµ. µ ({f ≥ a}) ≤ a E Dém. Comme f ≥ a1{f ≥a} , par croissance R E f dµ ≥ aµ({f ≥ a}). 2 Proposition 7.22 Pour tout f ∈ F+ (A ), Z f dµ = 0 ⇐⇒ µ({f 6= 0}) = 0. E Pour le sens ⇒, Rsoit An := {f ≥ 1/n}. Par l’inégalité de Markov, µ(An ) ≤ n An f dµ, donc comme E f dµ = 0, µ(An ) = 0. Or A := {f 6= 0} = limn ↑ An , donc par continuité à gauche de µ, µ(A) = limn ↑ µ(An ) = 0. Traitons maintenant le sens ⇐. Par additivité Z Z Z Z f dµ = f dµ + f dµ = f dµ, cA E A A R car f est nulle sur cA, donc si µ(A) = 0 on a bien E f dµ = 0. On pouvait aussi procéder de la manière suivante, qui est un peu moins simple, mais peut servir d’entraînement. On commence par montrer la proposition pour une fonction étagée positive ϕ : Z X X ϕ dµ = 0 ⇔ αi µ(Ai ) = 0 ⇔ αi µ(Ai ) = 0 Dém. R E i:αi 6=0 i∈I ⇔ X i:αi 6=0 µ(Ai ) = 0 ⇔ µ (∪i:αi 6=0 Ai ) = 0 ⇔ µ({ϕ 6= 0}) = 0. CHAPITRE 7. INTÉGRALE DES FONCTIONS POSITIVES 47 Maintenant soit f ∈ F+ (A ) et (fn ) une suite croissante d’éléments de E+ (A ) convergeantR vers f . Montrons la double implication en commençant par ⇒. Supposons donc R que E f dµ = 0. Pour tout entier n, comme 0 ≤ fn ≤ f , on a également E fn dµ = 0. D’après ce qui précède, on a donc µ({fn 6= 0}) = 0. Si nous montrons que la suite {fn 6= 0} converge en croissant vers {f 6= 0}, alors la continuité à gauche de µ impliquera µ({f 6= 0}) = 0. La croissance de cette suite de parties est due à la croissance de la suite (fn ), en effet si fn (x) 6= 0 alors fn+1 (x) 6= 0 car fn+1 (x) ≥ fn (x). Montrons que la limite A de cette suite, qui n’est autre que sa réunion, est {f 6= 0} par double inclusion. Si x ∈ A, il existe n tel que fn (x) 6= 0, mais comme f (x) ≥ fn (x), on a aussi f (x) 6= 0. Réciproquement, si f (x) 6= 0 alors comme f (x) est la limite de la suite réelle (fn (x))n , à partir d’un certain rang fn (x) 6= 0. Montrons enfin l’inégalité opposée. Si µ({f 6= 0}) = 0, alorsR comme {fn 6= 0} ⊆ {f 6= 0} pour tout n, on a aussi µ({fn 6= 0}) R= 0, ce qui implique E fn dµ = 0. Le théorème de Beppo Levi permet de conclure que E f dµ = 0. 2 Remarque 7.23 Noter que le raisonnement qui permet de montrer que la suite {fn 6= 0} converge vers {f 6= 0} ne tient plus si la suite (fn ) converge vers f sans croître, en effet avec fn (x) = xn sur l’intervalle [0, 1] : on a {fn 6= 0} =]0, 1] pour tout n, donc la limite de cette suite est ]0, 1], alors que si f désigne la limite de la suite (fn ) alors {f 6= 0} = {1}. Notation 7.24 (importante) Au lieu d’écrire µ({f 6= 0}) = 0, on notera souvent f = 0 µ-presque partout ou f = 0 µ-p.p. De manière générale, soit N ∈ A tel que µ(N ) = 0, et une certaine propriété P (x) qui dépend de x ∈ E. Si {x ∈ E : P (x) est fausse} ⊆ N , on dira que P (x) est vraie « pour µ-presque tout x », ou « µ(dx)-presque partout », ou que P est vraie µ-p.p. L’ensemble N est appelé ensemble négligeable, ou µ-négligeable. Les ensembles dénombrables, l’ensemble triadique de Cantor, sont des ensembles λ-négligeables. Dans certains contextes, une partie de E sera dite négligeable même si elle n’est pas mesurable mais si elle est incluse dans une partie mesurable de mesure nulle. Proposition 7.25 Pour tous f, g ∈ F+ (A ), Z Z f = g µ-p.p. ⇒ f dµ = g dµ. E Dém. E On pose h := max(f, g) − min(f, g) 0 sur {min(f, g) < ∞} sur {f = g = ∞}. Comme {f = g} = {h = 0}, par passage au complémentaire {h 6= 0} R = {f 6= g} donc µ({h 6= 0}) = 0 (ce qui s’écrit aussi h = 0 µ-p.p.), par conséquent E h dµ = 0 (par la Proposition 7.22). Mais comme max(f, g) = min(f, g) + h, par additivité on a Z Z Z Z max(f, g) dµ = min(f, g) dµ + h dµ = min(f, g) dµ. E E E E CHAPITRE 7. INTÉGRALE DES FONCTIONS POSITIVES 48 Et comme f ∧ g ≤ f ≤ f ∨ g et f ∧ g ≤ g ≤ f ∨ g, par croissance on a Z Z Z Z max(f, g) dµ = min(f, g) dµ = f dµ = g dµ, E E E E 2 ce qui achève la démonstration. Proposition 7.26 Pour tout f ∈ F+ (A ), Z f dµ < +∞ =⇒ µ({f = +∞}) = 0. E R R Soit A := {f = +∞}. Par contraposée, si µ(A) 6= 0, alors E f dµ ≥ A f dµ = (+∞)µ(A) = +∞. Autre possibilité (pour l’entraînement...) : se servir de l’inégalité de Markov. Soit R An := {f ≥ n}, alors A = limn ↓ An . Or par l’inégalité de Markov, µ(A1 ) ≤ E f dµ < +∞. Or comme toute mesure, µ est continue pour les suites décroissantes (on dit aussi continue à droite) dont un des termes est de mesure finie, R donc µ(A) = limn ↓ µ(An ). Mais par l’inégalité de Markov à nouveau, µ(An ) ≤ n−1 E f dµ −→ 0 quand n → ∞. 2 Dém. Corollaire 7.27 (Lemme de Borel–Cantelli) Soit (An ) une suite d’éléments de A . Alors X µ(An ) < +∞ =⇒ µ lim sup An = 0. n n≥0 R P P µ(A ) = f dµ < ∞. Donc par le 1 . Par hypothèse, Soit f := n A n n n E résultat précédent, µ({f = +∞}) = 0. Montrons que lim supn An = {f = +∞}. Dém. X 1An (x) < ∞ ⇔ 1An (x) = 0 à partir d’un certain rang n0 n ⇔ ∃n0 , ∀n ≥ n0 , x ∈ cAn ⇔ x ∈ lim inf cAn ⇔ x 6∈ lim sup An . n n Exemple 7.28 (mesure de comptage) L’intégration par rapport à la mesure de comptage sur N est tout simplement la sommation de série. En effet u ∈ F+ (P(N)) est tout simplement une suite (un ) de réels positifs et pour tout N ∈ N, la suite ϕN := (un 1n≤N ) est une fonction étagée positive qui converge en croissant vers u. Donc si m désigne la mesure de comptage sur (N, P(N)), alors Z Z ϕN dm = lim u dm = lim N N →∞ N N →∞ N X n=0 un m({n}) = lim N →∞ N X n=0 un = X n un . Chapitre 8 Intégrale des fonctions mesurables de signe quelconque et l’espace L 1(µ) 8.1 Intégrale des fonctions mesurables de signe quelconque On rappelle que F (A ) désigne l’ensemble des fonctions mesurables : (E, A ) → (R̄, Bor(R̄)). R + Définition 8.1 Pour tout f ∈ F (A ), on dira que f admet une intégrale si f dµ < E R R ∞ ou E f − dµ < ∞, et l’on définit alors l’intégrale de f par rapport à µ, notée 1 E f dµ, l’élément de R̄ suivant Z Z Z + f − dµ. f dµ − f dµ = E E E R + R − R Si les deux intégrales E f dµ et E f dµ sont finies, autrement dit E | f | dµ < ∞, ou encore dit | f | est µ-intégrable, alors on dira (un peu) plus simplement que f est µ-intégrable. En particulier, Z Z f dµ ≤ | f | dµ. E E Par définition, Z Z Z Z Z Z + − + − f dµ = f dµ − f dµ ≤ f dµ + f dµ = | f | dµ, Dém. de l’inégalité. E E E E E E f dµ ≤ E | f | dµ. 2 R R Proposition 8.2 Soient g, h ∈ F+ (A ) tels que E g dµ < ∞ ou E h dµ < ∞. Alors min(g, h) < ∞ µ-p.p. et f := (g − h)1{min(g,h)<∞} qui est bien définie (et vaut d’ailleurs g − h µ-p.p.) admet une intégrale Z Z Z f dµ = g dµ − h dµ. par additivité. De même, on démontre que − E E R R E E 1. encore ! 49 CHAPITRE 8. INTÉGRALE DES FONCTIONS DE SIGNE QUELCONQUE 50 R R Supposons que E h dµ < ∞ (la démonstration est identique si c’est E g dµ qui est finie), alors h < ∞ µ-p.p. par la Proposition 7.26 (donc min(g, h) < ∞ µ-p.p.). Ensuite par définition de f , on a f − ≤ h, donc f − est µ-intégrable. Enfin, comme @ f + + h = f − + g, par additivité Z Z Z Z + − f dµ + h dµ = f dµ + g dµ, Dém. E E E E égalité à laquelle on peut retrancher les deux intégrales de f − et de h, qui sont finies, ce qui donne Z Z Z Z + − f dµ − f dµ = g dµ − h dµ, E E E E qui R est bien Rdéfini dans ] − ∞, +∞], ce qui implique que f admet bien une intégrale égale à E g dµ − E h dµ. 2 Définition 8.3 (et proposition) L’espace L 1 (E , A , µ), noté aussi L 1 (µ), des foncR tions µ-intégrables, est un espace vectoriel et l’application f 7→ E f dµ est une forme linéaire positive donc croissante. Remarque 8.4 Bien noter L 1 car la notation L1 fera plus tard référence à un autre espace. Pour tous f, g ∈ L 1 (µ), pour tout λ ∈ R, | λf + g | ≤ | λ |.| f | + | g | donc λf + g est intégrable par additivité. De plus, en se servant des égalités du type f = f + − f − appliquées à f , g et f + g, on obtient f + g = (f + g)+ − (f + g)− = f + − f − + g + − g − et par conséquent (f + g)+ + f − + g − = (f + g)− + f + + g + , Dém. d’où en passant aux intégrales, Z Z Z Z Z Z + − − − + g + dµ. f dµ + g dµ = (f + g) dµ + f dµ + (f + g) dµ + E E E E E E Comme toutes ces quantités sont finies, on peut les retrancher à loisir ce qui donne Z Z Z Z + − f dµ + g dµ, (f + g) dµ − (f + g) dµ = E E E R R E R autrement dit E (f + g) dµ = E f dµ + E g dµ. De même, en utilisant les égalités (λf )+ = λf + , (λf )− = λf − lorsque λ > 0 et (λf )+ = −λf − , (λf )− = −λf + lorsque λ < 0, et en utilisant la positive homogénéité de l’intégrale sur F+ , on obtient : a) dans le cas λ > 0, Z Z Z Z Z Z + − + − (λf ) dµ = (λf ) dµ − (λf ) dµ = λ f dµ − λ f dµ = λ f dµ, E Z E E E E E E b) dans le cas λ < 0, Z Z Z Z Z − + − + (λf ) dµ = (−λf ) dµ− (−λf ) dµ = (−λ) f dµ−(−λ) f dµ = λ f dµ. E E E E E CHAPITRE 8. INTÉGRALE DES FONCTIONS DE SIGNE QUELCONQUE 51 L’intégrale est donc linéaire. Elle est positive car si f ≥ 0, alors f = f + R bien une R forme et par définition E f dµ = E f + dµ ≥ 0. Elle est donc croissante car si g ≥ h, alors grâce à la Proposition 8.2, (g − h)R1{min(g,h)<∞} R est positive et son intégrale, R qui est Rpositive d’après ce qui précède, vaut E g dµ − E h dµ ≥ 0, ce qui montre que E g dµ ≥ E h dµ. 2 Remarque 8.5 Si m est la mesure de comptage sur N alors L 1 (m) est l’ensemble, souvent noté `1 , des suites dont la série est absolument convergente. Lemme 8.6 Si f = g µ-p.p., alors f est intégrable (resp. admet une intégrale) ssi g est intégrable (resp. admet une intégrale). Comme f = g µ-p.p., on voit facilement que f + = g + µ-p.p. et que Rf − = g − µ- @ p.p.R Il suffit donc de montrer que pour tous f, g positives, si f = g µ-p.p. alors f dµ < ∞ ssi g dµ < ∞. En fait on a déjà montréR mieux (Corollaire 7.25) : si f et g sont positives R et que f = g µ-p.p. alors on a l’égalité f dµ = g dµ dans R̄+ . 2 Dém. 8.2 Les grands théorèmes de convergence Nous allons maintenant donner une version plus générale du théorème de convergence monotone et de ses corollaires, auquel nous ajouterons un dernier théorème de convergence, dit de convergence dominée. Théorème 8.7 Soit g ∈ L 1 (µ) et (fn ) une suite d’éléments de F (A ) telle que pour tout entier n, fn+1 ≥ fn ≥ g µ-p.p. Alors limn ↑ fn est définie µ-p.p. et toute fonction f µ-p.p. égale 2 à limn fn admet une intégrale et vérifie Z Z f dµ = lim ↑ fn dµ. E E Corollaire 8.8 SoitP (ϕn ) une suite d’éléments de F (A ) telle que pour tout entier n, ϕn ≥ 0 µ-p.p. Alors n ϕn admet une intégrale et ! Z X XZ ϕn dµ = ϕn dµ. E n n E P On prend bien sûr fn = nk=0 ϕk qui est positive µ-p.p. car positive sur ∩k {ϕ Pk ≥ 0}, partie mesurable dont le complémentaire P est de mesure inférieure ou égale P +à k µ({ϕk < 0}) = 0. En particulier la fonction n ϕn est définie µ-p.p. et vaut n ϕn µ-p.p. donc admet une intégrale. Le corollaire découle du théorème qui précède et de l’additivité de l’intégrale 2 @ Dém. du corollaire. 2. comme par exemple f = lim inf n fn si l’on veut CHAPITRE 8. INTÉGRALE DES FONCTIONS DE SIGNE QUELCONQUE 52 On prend d’abord g ≡ 0 et on définit A := ∩n≥0 {fn+1 ≥ fn ≥ g}. Alors A est mesurable, avec ! [ X c µ(cA) = µ {fn+1 ≥ fn ≥ g} ≤ µ (c{fn+1 ≥ fn ≥ g}) = 0, Dém. du théorème. n≥0 n≥0 et (fn 1A ) est une suite croissante de fonctions mesurables positives. Soit h sa limite, etf telle que h = f µ-p.p. Alors d’après le théorème de convergence monotone, Z Z Z Z f dµ = h dµ = lim ↑ fn 1A dµ = lim ↑ fn dµ, E n E n E E puisque µ(cA) = 0 (en particulier fn admet bien une intégrale, car fn = fn+ µ-p.p.). Maintenant si g 6≡ 0, on applique bien sûr ce qu’on vient d’obtenir à gn := fn − g ≥ 0 − − − + + − + − + µ-p.p. Comme n = g + gn = g − g + gn − gn = (g + gn ) − (gn + g ), et que gn = 0 R f− − µ-p.p., on a (gn + g ) dµ < ∞, donc fn admet une intégrale. De plus, Z Z Z Z Z Z + + − fn dµ = g dµ + gn dµ − g dµ = g dµ + gn dµ, E E E R E E E R qui converge en croissant vers E g dµ + E (limn ↑ Rgn ) dµ. Or gn = fn − g, donc limn ↑ gRn = (limRn fn ) − g, et comme g R∈ L 1 , la suite ( E fn dµ) converge en croissant vers g dµ + E ((limn fn ) − g) dµ = E (limn fn ) dµ. 2 E Donnons une version plus générale du lemme de Fatou. Proposition 8.9 Soit g ∈ L 1 (µ) et R(fn ) une suite d’éléments de R F (A ). Alors a) fn ≥ g µ-p.p. pour tout n =⇒ (lim inf n fn ) dµ ≤ lim inf n fn dµ et R R b) fn ≤ g µ-p.p. pour tout n =⇒ (lim supn fn ) dµ ≥ lim supn fn dµ. Remarquons que a)⇒ b) en remplaçant fn par −fn et en multipliant les deux membres de l’inégalité par −1. Montrons a) avec g ≡ 0. Il faut bien sûr vérifier que fn admet une intégrale pour tout n et que lim inf R n f−n également admet une intégrale. − Si fn ≥ 0 µ-p.p. alors fn = 0 µ-p.p. et n fn dµ = 0 donc fnP admet une intégrale. Soit alors A := ∪n {fn < 0}, alors A (est mesurable et) µ(A) ≤ n µ({fn < 0}) = 0, donc lim inf fn = 1A lim inf fn + lim inf(fn 1cA ), Dém. n où dans le membre de droite, le premier terme vaut 0 µ-p.p. et le deuxième terme est positif, donc lim inf n fn admet une intégrale, et d’après la première version du lemme de Fatou, Z Z lim inf fn 1cA dµ ≤ lim inf fn 1cA dµ . E n n E R Or comme µ(A) = 0, on a E (1A lim inf n fn ) dµ = 0 et E fn 1A dµ = 0. En ajoutant ces deux dernières quantités (nulles !) à l’inégalité précédente, on obtient l’inégalité voulue. @ R CHAPITRE 8. INTÉGRALE DES FONCTIONS DE SIGNE QUELCONQUE 53 Si g 6≡ 0, on applique bien sûr ce que l’on vient de faire à gn := fn − g qui est positive µ-p.p. Comme dansR la démonstration duR théorème précédent, on voit que fn R R admet une intégrale et que g dµ = f dµ − g dµ, ainsi que (lim inf n gn ) dµ = E n E n E E R R (lim inf n fn ) dµ − E g dµ, ce qui donne le résultat. E On aurait également pu appliquer à notre deuxième version du théorème de convergence monotone, la méthode utilisée pour déduire la première version lemme de Fatou de la première version du théorème de convergence monotone... 2 @ Nous pouvons maintenant énoncer un autre des résultats majeurs de ce cours. Théorème 8.10 (Théorème de Lebesgue, ou de convergence dominée) Si (fn ) est une suite d’éléments de L 1 (µ) convergeant 3 µ-p.p. vers une fonction f et qu’il existe g ∈ L 1 (µ) Ztelle que pour tout n ∈ N, | fn | ≤ g µ-p.p., alors f ∈ L 1 (µ) et | f − fn | dµ = 0 a) lim n→∞ E et Z Z fn dµ = f dµ. b) lim n→∞ E E Soit A := {x ∈ E : limn fn (x) = f (x)} ∩ ∩n {| fn | ≤ g}. Alors A est de complémentaire négligeable et pour tout x ∈ A, |Rfn (x) | ≤ g(x), donc | f R(x) | ≤ g(x). Par R conséquent, ayant | f | ≤ g µ-p.p., nous avons | f | dµ ≤ g dµ, donc | f | dµ < ∞. Comme fn ≥ −g µ-p.p. et que −g ∈ L 1 (µ), d’après le lemme de Fatou, Z Z Z fn dµ. f dµ = (lim inf fn ) dµ ≤ lim inf Dém. E E n n E De même, comme fn ≤ g µ-p.p. et que g ∈ L 1 (µ), d’après le lemme de Fatou, Z Z Z f dµ = (lim sup fn ) dµ ≥ lim sup fn dµ. E E On a donc n Z E E Z Z fn dµ ≤ lim sup n n f dµ ≤ lim inf n E fn dµ, E R R ce qui implique E f dµ = limn E fn dµ, autrement dit b). Pour obtenir a), on applique le lemme de Fatou à | f − fn | ≤ | f | + | fn | ≤ 2g ∈ L 1 (µ). Donc Z Z lim sup | f − fn | dµ ≥ lim sup | f − fn | dµ, n E ce qui implique lim supn 3. simplement R E n E | f − fn | dµ = 0, autrement dit a). 2 CHAPITRE 8. INTÉGRALE DES FONCTIONS DE SIGNE QUELCONQUE 8.3 54 Intégrale des fonctions à valeurs complexes Définition 8.11 Une fonction f : (E, A ) → (C, Bor(C)) est dite µ-intégrable si f est mesurable et | f | est intégrable. Ceci entraîne que <(f ) et =(f ) sont intégrables et l’intégrale de f par rapport à µ est définie comme le nombre complexe Z Z Z f dµ = <(f ) dµ + i =(f ) dµ. E E E Théorème 8.12 L’ensemble LC1 (E, A , µ)R des fonctions complexes µ-intégrables est un espace vectoriel sur C. L’application f 7→ E f dµ est une C-forme linéaire et pour tout f ∈ LC1 (µ), Z Z f dµ ≤ | f | dµ. E E Il suffit de montrer la dernière inégalité, car le reste découle facilement de la linéarité de l’intégrale réelle et de la définition. R Il existe z ∈ C tel que z f dµ est réel et | z | = 1, donc Z Z Z f dµ = | z | f dµ = z f dµ . Or par linéarité de l’intégrale complexe, Z Z Z Z =(zf ) dµ. <(zf ) dµ + i z f dµ = (zf ) dµ = E E R R Or on a choisi z pour que z f dµ soit réel donc E =(zf ) dµ = 0. De plus, | <(zf ) | ≤ | zf | = | f |, donc comme Z Z Z <(zf ) dµ ≤ | <(zf ) | dµ ≤ | f |dµ, E on a E E Z Z Z Z f dµ = z f dµ = <(zf ) dµ ≤ | f |dµ, E E E E 2 ce qui constitue l’inégalité souhaitée. Proposition 8.13 Soit (ϕn ) Rune suite de fonctions mesurables à valeurs dans P R̄ ou C. Si la série de terme général E | ϕn | dµ est convergente, alors la fonction n | ϕn | est P intégrable ainsi que la fonction définie µ-p.p. n ϕn et ! Z X X Z ϕn dµ = ϕn dµ . E n n E CHAPITRE 8. INTÉGRALE DES FONCTIONS DE SIGNE QUELCONQUE 55 R P Soit g := n | ϕn | < ∞ µ-p.p. car E g dµ < ∞ par le corollaire du théorème de convergence monotone sur les séries. Donc il existe une partie mesurable A de E, de complémentaire µ-négligeable, telle que g(x) < ∞ pour tout x ∈ A. Autrement dit, pour tout x ∈ A, la P série de terme général ϕn (x) est absolument convergente, donc convergente. SiPfn := k≤n ϕk , on a donc la convergence sur A de la suite (fn ) vers une fonction f := n ϕn , assortie de la domination des | fn | par g, donc par le théorème de convergence dominée, Z Z n Z X XZ f dµ = lim fn dµ = lim ϕk dµ = ϕn dµ, Dém. E n→∞ E ce qui achève la démonstration. n→∞ k=0 E n E 2 Chapitre 9 Applications 9.1 Intégrale de Lebesgue et intégrale de Riemann Définition 9.1 Une fonction f : [a, b] → R est dite Riemann-intégrable si pour tout ε > 0 il existe une fonction φε en escalier sur [a, b] et une fonction ψε positive et en escalier sur [a, b] telles que Z b ψε ≤ ε, (9.1) |f − φε | ≤ ψε et a Rb où l’ intégrale de Riemann d’une fonction en escalier ϕ, notée ϕ, est définie 1 comme a P i αi (ai − ai−1 ) si ϕ vaut αi sur ]ai−1 , ai [. Rb De plus, pour tous φε , ψε vérifiant (9.1), la limite lorsque ε → 0 de a φε est toujours Rb la même, et est égale, par définition, au nombre réel noté 2 a f et appelé 3 intégrale de Riemann de f . Remarque 9.2 Toute fonction Riemann-intégrable est bornée (car φε et ψε le sont). Remarque 9.3 Toute fonction réglée est Riemann-intégrable, car limite uniforme de fonctions en escalier : il suffit de prendre ψε = ε/(b − a). Théorème 9.4 Pour tout f Riemann-intégrable sur [a, b], il existe g ∈ L 1 ([a, b], Bor([a, b]), λ) tel que a) f = g µ-p.p. Z b Z b) f= g dλ . a [a,b] Remarque 9.5 D’un point de vue pratique, si f est borélienne, alors on peut prendre g = f. 1. cette définition ne dépend bien sûr pas de la subdivision choisie a < a1 < · · · < b pour représenter ϕ 2. aussi... 3. encore... 56 CHAPITRE 9. APPLICATIONS 57 Pour tout n il existe φn , ψn en escalier telles que |f − φn | ≤ ψn et Rappelons déjà que par définition, Z b Z b f = lim φn . Dém. n→∞ a Rb a ψn ≤ 1/n. a Soit alors αn := φn − ψn βn := φn + ψn . et Comme |f − φn | ≤ ψn , on a φn − f ≤ ψn et f − φn ≤ ψn , c’est-à-dire αn ≤ f ≤ βn . D’autre part, comme βn − αn = 2ψn , on a Z b lim (βn − αn ) = 0, n et donc a b Z Z f = lim n a b Z b αn = lim n a βn . a Soient à présent α̃n := max(α1 , . . . , αn ) β̃n := min(β1 , . . . , βn ). et On obtient alors l’encadrement αn ≤ α̃n ≤ f ≤ β̃n ≤ βn . On définit encore α̃ := lim ↑ αn β̃ := lim ↓ βn , et n n ce qui donne α̃ ≤ f ≤ β̃. De plus, comme une fonction en escalier est étagée, pour tout n, φn et ψn sont étagées donc boréliennes, ainsi que αn , βn , puis α̃n , β̃n par stabilité de la mesurabilité par passage à la borne supérieure ou inférieure, et enfin α̃, β̃ sont boréliennes par stabilité de la mesurabilité par passage à la limite. Il est clair par la définition donnée plus haut que pour les fonctions en escalier (donc étagées), intégrales de Riemann et de Lebesgue (i.e., par rapport à la mesure de Lebesgue) coïncident, donc pour tout n Z b Z Z b Z αn = αn dλ et βn = βn dλ, a d’où Z b Z αn = a [a,b] [a,b] Z αn dλ ≤ a Z α̃n dλ ≤ [a,b] Z α̃ dλ ≤ [a,b] [a,b] Z β̃ dλ ≤ [a,b] Z β̃n dλ ≤ [a,b] Z βn dλ = [a,b] b βn . a CHAPITRE 9. APPLICATIONS En passant à la limite, comme déduit que Z 58 Rb a αn et Rb a βn convergent toutes deux vers Z α̃ dλ = [a,b] a f , on en b Z β̃ dλ = [a,b] Rb f. a Remarquons que α1 ≤ α̃ ≤ β̃ ≤ β1 , si bien que α̃ et β̃ sont bornées. Ainsi ces deux fonctions sont λ-intégrables sur [a, b], la fonction γ := β̃ − α̃ est bien définie, et Z Z Z γ dλ = α̃ dλ − β̃ dλ = 0. [a,b] [a,b] [a,b] Comme γ ≥ 0, ceci implique que γ = 0 λ-p.p. Mais α̃ ≤ f ≤ β̃, donc α̃ = f sur {γ = 0} et si g := f 1{γ=0} , alors g = α̃1{γ=0} et Z Z g dλ = [a,b] α̃1{γ=0} dλ = [a,b] Z Z α̃ dλ = [a,b] b f, a ce qui donne bien l’égalité entre l’intégrale de Riemann de f et l’intégrale de Lebesgue d’une certaine fonction g égale à f λ-p.p. 2 9.2 Dérivées et primitives Proposition 9.6 Soit a ∈ R et f : [a, +∞[→ R borélienne. Si f est λ-localement R intégrable, au sens où pour tout b > a, f 1[a,b] ∈ L 1 (λ) alors la fonction F : x 7→ [a,x] f dλ est continue. Soit x ≥ a et une suite (xn ) convergeant vers x en croissant, et telle que xn 6= x pour tout n. Alors les fonctions f 1[a,xn ] convergent vers f 1[a,x[ tout en étant dominées par | f |1[a,x] qui est λ-intégrable par hypothèse. Donc par convergence dominée, Z Z Z lim F (xn ) = lim f 1[a,xn ] dλ = f 1[a,x[ dλ = f 1[a,x] dλ = F (x). Dém. n n Ceci prouve que F est continue à gauche. La démonstration est identique lorsque (xn ) est décroissante, ce qui prouve que F est aussi continue à droite. 2 @ Théorème 9.7 Soit [a, b] un intervalle compact de R et f : [a, b] → R une fonction dérivable de dérivée f 0 bornée. Alors f 0 est mesurable et l’intégrale de f 0 par rapport à λ est égale à sa primitive f au sens où Z f 0 dλ = f (b) − f (a). [a,b] CHAPITRE 9. APPLICATIONS Dém. 59 Soit gn (x) := n f x+ 1 n − f (x) si si 0 x ∈ [a, b − 1/n] x ∈ ]b − 1/n, b]. Alors pour tout x ∈ [a, b[, limn gn (x) = f 0 (x), ce qui montre que f 0 1[a,b[ est mesurable comme limite de fonctions mesurables, et donc f 0 1[a,b] est mesurable. Par l’inégalité des accroissements finis, pour tous n ∈ N et x ∈ [a, b], | gn (x) | ≤ M := sup[a,b] | f 0 | qui est fini par hypothèse. Or M 1[a,b] ∈ L 1 (λ) donc par convergence dominée, Z Z Z 0 lim gn dλ = f dλ = f 0 dλ. n→∞ [a,b] [a,b[ [a,b] Montrons à présent que l’on a également Z lim gn dλ = f (b) − f (a). n→∞ [a,b] Dans les égalités suivantes, nous utilisons la linéarité des intégrales de Lebesgue et de Riemann, ainsi que l’égalité entre ces intégrales due à la continuité de f : Z Z 1 gn (x) dλ(x) = n f x+ − f (x) dλ(x) n [a,b] [a,b−1/n] Z b−1/n ! Z b−1/n 1 − f = n f ·+ n a a Z b Z b−1/n ! = n f− f a+1/n Z a b Z f− = n b−1/n ! a+1/n f a Z Z f dλ − n = n [b−1/n,b] f dλ. [a,a+1/n] Ces passages entre intégrale de Riemann et de Lebesgue servent uniquement à justifier le changement de variable (translation, troisième égalité) que nous ne connaissons pas (encore) dans le cas de l’intégrale de Lebesgue. Il ne reste plus qu’à montrer que le second terme de la dernière différence tend vers f (a) quand n → ∞, et la même méthode s’appliquera pour montrer que le premier terme tend vers f (b). Soit αn := inf [a,a+1/n] f et βn := sup[a,a+1/n] f . Alors Z Z Z αn = n αn dλ ≤ n f dλ ≤ n βn dλ = βn , [a,a+1/n] [a,a+1/n] [a,a+1/n] mais comme f est continue, limn αn = limn βn = f (a), ce qui achève la démonstration.2 CHAPITRE 9. APPLICATIONS 60 Remarque 9.8 Le théorème précédent serait faux si l’on ne faisait pas l’hypothèse que f 0 est bornée, comme on peut le voir sur le contre-exemple suivant : n Z 3 fn (x) := 1An dλ x ≥ 0, 2 [0,x] où An est le n-ième élément de la suite qui converge vers l’ensemble triadique de Cantor. En effet, la limite f de la suite (fn ), appelée fonction de Lebesgue, ou « escalier du diableR», est continue, dérivable λ-p.p. avec pour dérivée f 0 = 0 λ-p.p. (mais non bornée), donc [0,1] f 0 dλ = 0. Pourtant f (1) − f (0) = 1 − 0 = 1. 9.3 Intégrales dépendant d’un paramètre Théorème 9.9 Soit f : I × E → R, où I est un intervalle de R tel que pour tout t ∈ I, f (t, ·) : (E, A ) → (R, B(R) est mesurable. Alors a) S’il existe t0 ∈ I tel que pour µ-presque tout x, t 7→ f (t, x) est continue en t0 , et s’il existe g : (E, A ) → (R, B(R) intégrable telle que pour µ-presque tout x, pour tout t ∈ I, | f (t, x) | ≤ g(x), R alors la fonction h : t 7→ E f (t, x) dµ(x) est bien définie et elle est continue en t0 . b) Si pour tout t ∈ I, f (t, ·) est intégrable 4 , si pour µ-presque tout x, t 7→ f (t, x) est dérivable sur tout l’intervalle I, et s’il existe g1 : (E, A ) → (R, B(R) intégrable telle que ∂f (t, x) ≤ g1 (x), pour µ-presque tout x, pour tout t ∈ I, ∂t alors la fonction h est bien définie et est dérivable sur tout I, de dérivée Z ∂f 0 h (t) = (t, x) dµ(x) t ∈ I. E ∂t Remarque 9.10 Les hypothèses commençant par « pour µ-presque tout x » peuvent toutes (sauf une, voir plus bas) être affaiblies en échangeant les quantificateurs. Pour voir la différence, à titre d’exemple, l’assertion pour µ-presque tout x, pour tout t ∈ I, | f (t, x) | ≤ g(x), signifie qu’il existe un élément A de la tribu A de complémentaire négligeable, tel que pour tout x ∈ A, pour tout t ∈ I, | f (t, x) | ≤ g(x). D’autre part, l’assertion pour tout t ∈ I, pour µ-presque tout x, 4. pour que h soit bien définie | f (t, x) | ≤ g(x), CHAPITRE 9. APPLICATIONS 61 signifie que pour tout t ∈ I il existe un élément At de la tribu A , dépendant de t, de complémentaire négligeable, tel que pour tout x ∈ At , | f (t, x) | ≤ g(x). Si I était dénombrable les deux assertions seraient équivalentes, quitte à définir A, dans la première assertion, comme l’intersection de tous les ensembles At de la seconde assertion. Ici I est un intervalle, donc la seconde assertion peut inclure strictement la première. Lorsque nous n’utilisons dans la démonstration que des suites à valeurs dans I, cette distinction est sans conséquence. En revanche, la domination des dérivées partielles doit être énoncée telle quelle, pour avoir une inégalité des accroissements finis vraie p.p. a) Pour tout t ∈ I, la domination p.p. de f (t, ·) par la fonction intégrable g garantit que f (t, ·) est intégrable et donc que h est bien définie. Soit une suite (sn ) de I de limite t0 . Montrons que limn h(sn ) = h(t0 ). Soit fn (x) := f (sn , x). De la continuité pour p.t. x de la fonction f (·, x) en t0 , on déduit la convergence p.p. de fn vers f (t0 , ·). Comme la suite (fn ) est dominée p.p. par la fonction intégrable g, le théorème de convergence dominée assure que Z Z lim h(sn ) = lim fn dµ = f (t0 , x) dµ(x) = h(t0 ), Dém. n n E E ce qui est la limite souhaitée. b) Soit t ∈ I et (sn ) une suite de I convergeant vers t telle que sn 6= t pour tout n. Soit fn : (E, A ) → (R, B(R)) la fonction intégrable suivante fn (x) := f (sn , x) − f (t, x) sn − t x ∈ E. Alors pour p.t. x, la suite (fn ) converge vers ∂f /∂t(t, x), ce qui fait de cette dérivée partielle une fonction mesurable de x. L’hypothèse de R domination p.p. de cette fonction mesurable par la fonction intégrable g1 garantit que E ∂f /∂t(t, x) dµ(x) est bien définie pour tout t ∈ I. De plus, par l’intégrabilité de fn Z Z Z h(sn ) − h(t) 1 fn dµ = f (sn , ·) dµ − f (t, ·) dµ = . sn − t sn − t E E E Or par l’inégalité des accroissements finis, pour µ-presque tout x, ∂f | fn (x) | ≤ sup (s, x) ≤ g1 (x), ∂t s∈I et comme g1 est intégrable, on obtient h(sn ) − h(t) = lim lim n n sn − t Z par le théorème de convergence dominée. Z fn dµ = E E ∂f (t, x) dµ(x) ∂t 2 CHAPITRE 9. APPLICATIONS 9.4 9.4.1 62 Applications Dérivation sous la somme Soit (un ) une suite de Pfonctions dérivables sur un intervalle I de R telle que (i) pour tout t ∈ I, n | un (t) | converge ; P 0 (ii) pour tout P t ∈ I, | un (t) | ≤ wn pour une suite (wn ) telle que n wn < ∞. 0 Alors n un (t) est bien définie et est dérivable en tout t ∈ I, avec S (t) = P 0 S(t) := u (t). n n 9.4.2 Convolution Soit f ∈ L 1 (R, B(R), λ) et ϕ dérivable de dérivée bornée. Alors la fonction f ? ϕ définie par Z ϕ(t − x) f (x) dλ(x) t ∈ R, f ? ϕ(t) := R est bien définie et dérivable sur R de dérivée Z 0 (f ? ϕ) (t) = ϕ(t − x) f (x) dλ(x) = f ? ϕ0 (t). R 9.4.3 Transformée de Fourier R Soit f : R → R λ-intégrable et F (t) := R eitx f (x) dλ(x). Si x 7→ xf (x) est intégrable, alors F est dérivable sur R et Z 0 F (t) = i eitx xf (x) dλ(x). R Chapitre 10 Inégalités et espaces L p 10.1 Inégalité de Jensen Proposition 10.1 Si µ est une probabilité sur (E, A ) et f ∈ L 1 (E, A , µ) est R à valeurs dans un intervalle I de R, alors pour toute fonction convexe ϕ : I → R, on a E f dµ ∈ I, R ϕ(f ) dµ existe dans ] − ∞, +∞] et E Z Z f dµ . ϕ(f ) dµ ≥ ϕ E E Soient a := inf(I) et b := sup(I). Ayant −∞ ≤ a ≤ f ≤ b ≤ +∞, comme µ est une probabilité, Z Z Z a= a dµ ≤ f dµ ≤ b dµ = b, Dém. E E E R donc m := E f dµ ∈ I. Comme ϕ est convexe, il existe au moins une droite située en-dessous du graphe de ϕ et passant par (m, ϕ(m)), d’équation y = α(x − m) + ϕ(m). Ceci se traduit par ϕ(u) ≥ α(u − m) + ϕ(m) u ∈ I, et donc pour tout x ∈ E, ϕ ◦ f (x) ≥ α(f (x) − m) + ϕ(m). La fonction ϕ ◦ f étant minorée par une fonction intégrable, elle admet une intégrale (qui ne peut être égale à −∞) et Z Z Z ϕ ◦ f dµ ≥ α (f − m) dµ + ϕ(m) dµ = 0 + ϕ(m), E E E par linéarité, et parce que µ est une probabilité. 63 2 CHAPITRE 10. INÉGALITÉS ET ESPACES L P 10.2 10.2.1 64 Inégalités de Hölder et de Minkowski Semi-normes L p , p ∈ [1, +∞] Définition 10.2 ( p ∈ [1, +∞[ ) On note L p (E, A , µ), ou L p (µ), l’ensemble de toutes les fonctions mesurables à valeurs dans R̄ telles que | f |p est µ-intégrable. Pour tout f ∈ L p (µ), on pose Z p1 p k f kp := | f | dµ , E qu’on appelle norme L de f . 1 p Définition 10.3 ( p = ∞ ) On note L ∞ (E, A , µ), ou L ∞ (µ), l’ensemble de toutes les fonctions mesurables f à valeurs dans R̄ qui sont µ-essentiellement bornées, c’est-à-dire telles qu’il existe a > 0 pour lequel µ({| f | ≥ a}) = 0. Si f ∈ L ∞ (µ), on pose k f k∞ := inf{a > 0 : µ({| f | ≥ a}) = 0} ∈ [0, +∞[, qu’on appelle 2 supremum essentiel de f . 10.2.2 Inégalité de Hölder 1 1 + =1 p q –on dit que ces nombres sont conjugués 3 – alors si f ∈ L p et g ∈ L q , f g ∈ L 1 et Proposition 10.4 (Inégalité de Hölder) Pour tous p, q ∈ [1, +∞] tels que k f g k1 ≤ k f kp k g kq . Premier cas : p ou q vaut +∞. Supposons q = +∞, et donc p = 1. Alors par définition du supremum essentiel, g ≤ k g k∞ µ-p.p., donc | f g | ≤ | f | k g k∞ µ-p.p. Par conséquent Z Z Dém. k f g k1 = | f g | dµ ≤ k g k∞ E | f | dµ = k g k∞ k f k1 . E Deuxième cas : p et q sont finis. L’inégalité de Hölder est évidente si k f kp = 0 ou k g kq = 0. En effet si par exemple k f kp = 0 alors | f | = 0 µ-p.p. donc | f g | = 0 µp.p. et par conséquent k f g k1 = 0. Nous supposons donc maintenant que k f kp 6= 0 et k g kq 6= 0. Rappelons la concavité du logarithme : ∀α ∈ [0, 1], ∀x, y > 0, ln (αx + (1 − α)y) ≥ α ln(x) + (1 − α) ln(y). En posant α = 1/p, et donc 1 − α = 1/q, ainsi que x = | a |p et y = | b |q , on obtient | a |p | b |q 1 1 ln + ≥ ln (| a |p ) + ln (| b |q ) = ln (| ab |) , p q p q 1. mais dont nous verrons qu’il ne s’agit en fait que d’une semi-norme 2. mais on devrait dire µ-supremum essentiel 3. typiquement p = q = 2 ou p = 1 et q = +∞ CHAPITRE 10. INÉGALITÉS ET ESPACES L P 65 et donc par croissance de l’exponentielle, | a |p | b |q + ≥ | ab |. p q Ainsi avec a := on obtient | f (x) | k f kp et b := | g(x) | , k g kq | f g(x) | 1 | f (x) |p 1 | g(x) |q ≤ + . k f kp k g kq p k f kpp q k g kqq En intégrant chaque membre, la croissance de l’intégrale implique 1 1 k f g k1 ≤ + = 1, k f kp k g kq p q 2 ce qui est l’inégalité attendue. 10.2.3 Inégalité de Minkowski Proposition 10.5 Pour tout p ∈ [1, +∞], si f, g ∈ L p , alors f + g ∈ L p et k f + g kp ≤ k f kp + k g kp . Dém. Premier cas : p = 1. Par l’inégalité triangulaire | f + g | ≤ | f | + | g |, donc f + g ∈ L 1 et par croissance de l’intégrale, Z Z k f + g k1 ≤ | f | dµ + | g | dµ = k f k1 + k g k1 . E E Deuxième cas : p = +∞. Par définition du supremum essentiel, | f | ≤ k f k∞ et | g | ≤ k g k∞ µ-p.p. donc par l’inégalité triangulaire, | f + g | ≤ k f k∞ + k g k∞ µp.p. Mais par définition du supremum essentiel à nouveau, pour tout A ≥ 0 tel que µ ({| f + g | > A}) = 0, on a k f + g k∞ ≤ A, donc ici k f + g k∞ ≤ k f k∞ + k g k∞ . Troisième cas : p ∈]1, +∞[. Notons h := | f +g |. Alors h ∈ L p car pour tous x, y ≥ 0, p (x + y)p ≤ 2p max(x, y) = 2p max xp , y p ≤ 2p xp + y p , R R R ce qui implique que hp dµ ≤ 2p | f |p dµ + | g |p dµ < ∞. Soit q le nombre conjugué de p. Comme h ∈ L p , hp−1 ∈ L q puisque q(p − 1) = p. Donc grâce à l’inégalité de Hölder appliquée à hp−1 ∈ L q et f ∈ L p , Z | f | hp−1 dµ = k f hp−1 k1 ≤ k f kp k hp−1 kq . E De même, Z E | g | hp−1 dµ ≤ k g kp k hp−1 kq . CHAPITRE 10. INÉGALITÉS ET ESPACES L P 66 Or hp = | f + g |hp−1 ≤ | f |hp−1 + | g |hp−1 , donc Z p p−1 h dµ ≤ k f kp k h p−1 kq + k g kp k h Z kq = (k f kp + k g kp ) E q(p−1) h 1q dµ , E autrement dit p k h kpp ≤ (k f kp + k g kp ) k h kpq . On peut supposer que k h kp 6= 0, faute de quoi l’inégalité de Minkowski devient triviale, p/q donc en divisant chaque membre par k h kp , on obtient k h kp ≤ k f kp + k g kp , qui est l’inégalité souhaitée. 10.3 2 Espace L p et espace Lp On rappelle la notion de norme sur un espace vectoriel F . Définition 10.6 Une fonction N : F → R+ est appelée norme si (i) pour tout v ∈ F , N (v) = 0 ssi v = 0 (ii) [homogénéité] pour tous a ∈ R et v ∈ F , N (av) = | a | N (v) (iii) [inégalité triangulaire] pour tous u, v ∈ F , N (u + v) ≤ N (u) + N (v). Si (i) est remplacé par la propriété plus faible (i’) : N (0) = 0, alors N est appelée une semi-norme. Remarque 10.7 On rappelle qu’une norme N sur un e.v. F induit une topologie sur F , la topologie relative à la distance d(u, v) := N (u − v). Proposition 10.8 Pour tout p ∈ [1, +∞], (L p , k · kp ) est un espace vectoriel seminormé. Soient f, g ∈ L p et a ∈ R? . (i’) Si f = 0, alors | f |p = 0, dont l’intégrale est nulle, donc k f kp = 0. (ii) évident par linéarité de l’intégrale si p < ∞. Si p = +∞, Dém. k af k∞ = inf{m > 0 : µ({| af | ≥ m}) = 0} = | a | inf{m0 > 0 : µ({| af | ≥ | a |m0 }) = 0} = | a | inf{m0 > 0 : µ({| f | ≥ m0 }) = 0} = | a | k f k∞ . (iii) Inégalité de Minkowski. 2 Si N est une semi-norme sur un e.v. F , il existe un procédé classique consistant à modifier F pour que N devienne une norme, et qui consiste à identifier u et v ∈ F dès @ CHAPITRE 10. INÉGALITÉS ET ESPACES L P 67 que N (u − v) = 0. Rigoureusement, il s’agit de définir l’espace quotient de F par la relation d’équivalence u ∼ v ⇐⇒ N (u − v) = 0, c’est-à-dire l’ensemble constitué des classes d’équivalence de ∼. Ici, quel que soit p ∈ [1, +∞], pour tous f, g ∈ L p , k f − g kp = 0 ⇔ µ({f 6= g}) = 0 ⇔ f = g µ-p.p. La relation d’équivalence associée à chaque semi-norme k · kp ne dépend donc pas de p et est la même pour tous les espaces L p : f ∼ g ⇐⇒ f = g µ-p.p. Définition 10.9 Pour p ∈ [1, +∞], on note Lp (E, A , µ), ou Lp (µ), l’ensemble des classes d’équivalence des éléments de L p (µ) par la relation d’équivalence définie par l’égalité µ-p.p. Soit f := {g : g = f µ-p.p.} la classe d’équivalence de f . Les opérations classiques s’étendent aux classes d’équivalence, avec af = af et f + g = f + g. On peut également définir k · kp sur Lp (µ) par k f kp = k f kp , qui ne dépend pas du représentant choisi, car f = g µ-p.p. implique k f kp = k g kp . Remarque 10.10 On fera systématiquement l’abus de notation qui consiste à ne pas différencier fonctions et classes d’équivalences, c’est-à-dire à utiliser le même symbole pour une fonction f et pour sa classe d’équivalence f . On a alors immédiatement ce que l’on cherchait. Théorème 10.11 L’ensemble (Lp (µ), k · kp ) est un espace vectoriel normé. Exemple 10.12 On note `p l’espace L p (N, P(N), m), où m est la mesure de comptage. Soit u ∈ `p . Si p < ∞, alors ! p1 k u kp = X | un |p , n tandis que si p = +∞, k u k∞ = sup | un |. n Il n’est pas besoin ici de quotienter L p car k u kp = 0 implique u = 0. Proposition 10.13 a) pour tous p ≤ q, on a l’inclusion `p ⊆ `q . b) Si µ est finie, alors pour tous p ≤ q, on a l’inclusion Lp (µ) ⊇ Lq (µ). CHAPITRE 10. INÉGALITÉS ET ESPACES L P Dém. 68 2 @ En exercice. Remarque 10.14 Si µ n’est pas finie, il n’y a pas d’inclusion générale, comme en atteste le contre-exemple suivant avec (E, A , µ) = (R, B(R), λ) : avec 1 f (x) = √ 1]0,1] (x) x et 1 , g(x) = √ 2 x +1 on voit facilement que f est dans L 1 mais pas dans L 2 , et que g est dans L 2 mais pas dans L 1 . Deuxième partie LM365 – Intégration 2 69 Chapitre 11 Construction d’une mesure : existence et unicité 11.1 11.1.1 Quelques rappels et nouvelles définitions Rappels Définition 11.1 Une classe A de parties d’un ensemble E est appelée tribu ou σalgèbre si (i) elle contient E : E ∈ A ; (ii) elle est stable par passage au complémentaire : pour tout A ⊆ E, A ∈ A ⇔ cA ∈ A; (iii) elle est stable par réunion dénombrable : si (An ) est une famille dénombrable d’éléments de A , alors ∪n An ∈ A . Définition 11.2 Une mesure sur l’espace mesurable (E, A ) est une application µ : A → [0, +∞] qui : (i) associe la valeur 0 à l’ensemble vide : µ(∅) = 0 ; (ii) est σ-additive : pour toute suite (An ) d’éléments de A deux à deux disjoints, X µ(∪n An ) = µ(An ). n 11.1.2 Définitions utiles dans le cadre de l’unicité des mesures Définition 11.3 Une classe Λ de parties d’un ensemble E est appelée λ-système si (i) elle contient ∅ : ∅ ∈ Λ ; (ii) elle est stable par différence propre : pour tous A, B ∈ Λ, A ⊆ B ⇒ B \ A ∈ Λ ; (iii) elle est stable par réunion dénombrable croissante : si (An ) est une suite croissante d’éléments de Λ, alors ∪n An ∈ Λ. Remarque 11.4 Dans la définition précédente de λ-système, la propriété (i) est seulement là pour rappeler que Λ est non vide car c’est une conséquence de (ii). 70 CHAPITRE 11. CONSTRUCTION D’UNE MESURE 71 Remarque 11.5 Une tribu est un λ-système, et donc en particulier P(E) en est un. Définition 11.6 Un λ-système qui contient E est appelé classe monotone. Une définition de classe monotone peut donc être obtenue par la modification suivante de la définition de λ-système : en changeant (i) pour (i’) : E ∈ Λ. Proposition 11.7 a) L’intersection d’une collection quelconque non vide de λ-systèmes est un λ-système. b) Pour toute classe C de parties de E, l’intersection 1 de tous les λ-systèmes contenant tous les éléments de C est donc un λ-système, noté Λ(C ), et appelé λ-système engendré par C ou plus petit λ-système contenant C . Remarque 11.8 On rappelle que l’on définit de la même manière la tribu σ(C ) engendrée par C . La démonstration de la proposition précédente est laissée en exercice. @ Proposition 11.9 Si Λ est une classe monotone stable par intersections finies, alors Λ est une tribu. Vérifions une par une les trois propriétés caractéristiques des tribus. (i) E ∈ Λ puisque Λ est une classe monotone. (ii) Comme E ∈ Λ, pour tout A ∈ Λ, le complémentaire de A est la différence propre E \ A, donc cA ∈ Λ. (iii) Soir (An ) une suite d’éléments de Λ. Pour tout entier n, soit Bn := ∪nk=0 Ak . Comme ∪n An = ∪n Bn et que (Bn ) est une suite croissante, la propriété (iii) des classes monotones implique qu’il suffit de montrer que Bn ∈ Λ pour tout n. Autrement dit, il suffit de montrer que Λ est stable par réunions finies. Or on se souvient que Λ est stable par passage au complémentaire et, par hypothèse, stable par intersections finies, donc pour tous A, B ∈ Λ, A ∪ B = c(cA ∩ cB) ∈ Λ, ce qui achève la démonstration. 2 Dém. Définition 11.10 Une classe C de parties de E est appelée π-système si (i) elle contient E : E ∈ C ; (ii) elle est stable par intersections finies : pour tous A, B ∈ C , A ∩ B ∈ C . Remarque 11.11 Avec cette définition, la proposition qui précède peut s’énoncer ainsi : si A est à la fois un λ-système et un π-système, alors A est une tribu. Remarque 11.12 Dans Rd , l’ensemble des pavés (produits cartésiens d’intervalles), l’ensemble des pavés ouverts (produits cartésiens d’intervalles ouverts) forment chacun un π-système. @ 1. non vide puisque P(E) est un λ-système CHAPITRE 11. CONSTRUCTION D’UNE MESURE 11.1.3 72 Définitions utiles dans le cadre de l’existence des mesures Définition 11.13 Une classe B de parties d’un ensemble E est appelée algèbre ou algèbre de Boole si (i) elle contient E : E ∈ B ; (ii) elle est stable par passage au complémentaire : pour tout A ⊆ E, A ∈ B ⇔ cA ∈ B; (iii) elle est stable par réunions finies : pour tous A, B ∈ B, A ∪ B ∈ B. Remarque 11.14 Une tribu est donc une algèbre de Boole stable par réunion dénombrable, d’où le nom de σ-algèbre. Remarque 11.15 Dans Rd , l’ensemble des réunions finies de pavés forment une algèbre, ainsi que l’ensemble des réunions finies de pavés disjoints. @ 11.2 11.2.1 Unicité d’une mesure Théorème de la classe monotone et corollaires Théorème 11.16 (Théorème de la classe monotone) Pour tout π-système C , Λ(C ) = σ(C ). En particulier, le plus petit λ-système Λ(C ) contenant C est donc une tribu. Supposons que Λ(C ) est une tribu et montrons qu’alors Λ(C ) = σ(C ). De manière générale, comme σ(C ) est une tribu contenant C , c’est un λ-système contenant C , donc on a toujours Λ(C ) ⊆ σ(C ) (puisque Λ(C ) est le plus petit λ-système contenant C ). De plus, d’après l’assertion qui précède, Λ(C ) est une tribu contenant C , donc σ(C ) ⊆ Λ(C ) (puisque σ(C ) est la plus petite tribu contenant C ). Montrons à présent que Λ(C ) est une tribu. D’après la proposition qui précède, il suffit de montrer que Λ(C ) contient E et est stable par intersections finies. Il est évident que E ∈ Λ(C ) car E ∈ C (C est un π-système) et C ⊆ Λ(C ). En particulier Λ(C ) est une classe monotone. Montrons donc que Λ(C ) est stable par intersections finies, en utilisant le fait que C l’est. Pour tout C ⊆ E fixé, on définit Dém. ΛC := {A ∈ Λ(C ) : A ∩ C ∈ Λ(C )}. Nous allons montrer que ΛC est toujours un λ-système. (i) comme A := ∅ ∈ Λ(C ) (qui est une classe monotone) et que A ∩ C = ∅ ∈ Λ(C ) (toujours...), on a bien que ∅ ∈ ΛC . (ii) Pour tous A, B ∈ ΛC tels que A ⊆ B, on a A, B ∈ Λ(C ) avec A ∩ C et B ∩ C éléments de Λ(C ). Par stabilité par différence propre de Λ(C ), comme A ∩ C ⊆ B ∩ C, on a (B ∩ C) \ (A ∩ C) ∈ Λ(C ), mais (B ∩ C) \ (A ∩ C) = (B \ A) ∩ C, donc B \ A ∈ ΛC . (iii) Soit (An ) une suite croissante d’éléments de ΛC , de sorte que pour tout entier n, An ∈ Λ(C ) et An ∩C ∈ Λ(C ). Or (An ∩C) est croissante, donc comme Λ(C ) est stable par réunion dénombrable croissante, on a ∪n (An ∩C) ∈ Λ(C ). Mais ∪n (An ∩C) = (∪n An )∩C, donc ∪n An ∈ ΛC . CHAPITRE 11. CONSTRUCTION D’UNE MESURE 73 En conclusion, ΛC est bien un λ-système. Supposons maintenant que C ∈ C . Alors ΛC contient tous les éléments de C , en effet pour tout A ∈ C , comme C ∈ C et que C est stable par intersections finies, A ∩ C ∈ C , donc A ∩ C ∈ Λ(C ), de sorte que A ∈ ΛC . Par conséquent, ΛC est un λ-système contenant C , et comme par définition ΛC ⊆ Λ(C ), qui est le plus petit λ-système contenant C , ΛC = Λ(C ). Comme C est arbitraire, on peut donc écrire ∀C ∈ C , ∀A ∈ Λ(C ), A ∩ C ∈ Λ(C ). On voudrait maintenant remplacer la première occurrence de C par Λ(C ) de manière à obtenir la stabilité par intersections finies de Λ(C ). Soit A ∈ Λ(C ). D’après ce qui précède, pour tout C ∈ C , A ∩ C ∈ Λ(C ), autrement dit C ⊆ ΛA ⊆ Λ(C ). Comme ΛA est un λ-système, ΛA = Λ(C ). Ceci s’écrit ∀A ∈ Λ(C ), ∀B ∈ Λ(C ), B ∩ A ∈ Λ(C ), ce qui n’est autre que la stabilité de Λ(C ) par intersections finies. 2 On en déduit les deux résultats d’unicité suivants : Corollaire 11.17 Soient µ et ν deux mesures finies sur un espace mesurable (E, A ) qui coïncident 2 sur un π-système C ⊆ A qui engendre 3 A , alors µ et ν coïncident sur A . Corollaire 11.18 Soient µ et ν deux mesures σ-finies sur un espace mesurable (E, A ) telles que : a) il existe une suite mesurable croissante (En ) telle que ∪n En = E ; b) pour tout entier n, µ(En ) = ν(En ) < ∞ ; c) µ et ν coïncident sur un π-système C engendrant A et contenant chaque En . Alors µ et ν coïncident sur A . Remarque 11.19 Le fait que µ et ν sont σ-finies pourrait ne pas être mentionné dans l’énoncé qui précède, car c’est en fait une conséquence des conditions (a) et (b). Démonstration du Corollaire 11.17. Soit Λ := {A ∈ A : µ(A) = ν(A)}. Alors Λ est un λ-système car : (i) Λ contient l’ensemble vide, puisque µ(∅) = 0 = ν(∅) ; (ii) pour tous éléments A, B de Λ, si A ⊆ B, alors comme µ et ν sont finies, µ(B \ A) = µ(B) − µ(A) = ν(B) − ν(A) = ν(B \ A). (iii) pour toute suite croissante (An ) d’éléments de Λ, par continuité à gauche de la mesure, µ(∪n An ) = lim ↑ µ(An ) = lim ↑ ν(An ) = ν(∪n An ). n n Comme Λ contient C , Λ(C ) ⊆ Λ ⊆ A . Mais d’après le théorème de la classe monotone, comme C est un π-système, σ(C ) = Λ(C ). Enfin par hypothèse, A = σ(C ), donc A = σ(C ) = Λ(C ) ⊆ Λ ⊆ A , ce qui montre bien que A = Λ. 2 2. c’est-à-dire que pour tout A ∈ C , µ(A) = ν(A) 3. c’est-à-dire que A = σ(C ) CHAPITRE 11. CONSTRUCTION D’UNE MESURE 74 On applique le corollaire 11.17 aux mesures traces µn := µ(· ∩ En ) et νn := ν(· ∩ En ) qui sont finies grâce à l’hypothèse (b). Elles coïncident bien sur C par l’hypothèse (c), car pour tout C ∈ C , comme C ∩ En ∈ C (car En ∈ C et C est stable par intersection), Démonstration du Corollaire 11.18. µn (C) = µ(C ∩ En ) = ν(C ∩ En ) = νn (C). Donc µn et νn coïncident sur A . Maintenant l’hypothèse (a) permet de conclure en utilisant la continuité à gauche de la mesure, car pour tout A ∈ A , µ(A) = µ(∪n En ∩ A) = µ(lim ↑ (En ∩ A)) = lim ↑ µ(En ∩ A) = lim ↑ µn (A), n n n et de même pour ν. Or µn (A) = νn (A), donc µ(A) = lim ↑ µn (A) = lim ↑ νn (A) = ν(A), n n ce qui montre que µ et ν coïncident sur A . 11.2.2 2 Applications Unicité de la mesure de Lebesgue Supposons qu’il existe deux mesures µ et ν sur B(Rd ) telles que pour tout pavé Q ouvert R = dk=1 Ik , où chaque Ik =]ak , bk [ est un intervalle (ouvert, mais cela est sans importance ici) éventuellement infini de R, µ(R) = d Y (bk − ak ) = ν(R), k=1 avec la convention habituelle 0 × ∞ = 0. Montrons qu’alors µ et ν coïncident sur B(Rd ). Ceci prouvera l’unicité de la mesure de Lebesgue (dont nous montrerons l’existence à la section suivante). Soit C l’ensemble des pavés ouverts de Rd (produits d’intervalles ouverts pouvant être infinis, donc en particulier pouvant être égaux à R tout entier, ce qui garantit que Rd ∈ C ). En particulier C est un π-système et l’on sait que la tribu engendrée par C est @ Q B(Rd ). Soit En le produit des intervalles ] − n, n[, c’est-à-dire En := dk=1 ] − n, n[. Alors les propriétés du corollaire 11.18 sont bien vérifiées : a) ∪n En = Rd ; b) pour tout entier n, µ(En ) = ν(En ) = (2n)d < ∞ ; c) En ∈ C , et σ(C ) = B(Rd ), où C est un π-système. On peut donc conclure que µ et ν coïncident sur B(Rd ). Caractérisation d’une mesure par sa fonction de répartition Définition 11.20 Si µ est une mesure finie sur (R, B(R)), on appelle fonction de répartition de µ la fonction F : R → R+ définie par F (x) := µ(] − ∞, x]). CHAPITRE 11. CONSTRUCTION D’UNE MESURE 75 Proposition 11.21 La fonction de répartition F d’une mesure finie est continue à droite, croissante, et vérifie lim F (x) = 0 x→−∞ lim F (x) = µ(R). et x→+∞ De plus, pour tous réels a < b i) µ(]a, b]) = F (b) − F (a) iii) µ(]a, b[) = F (b−) − F (a) Dém. ii) µ([a, b]) = F (b) − F (a−) iv) µ([a, b[) = F (b−) − F (a−). 2 @ À faire en exercice. P Exemple 11.22 Si µ = δa , alors F (x) = 1[a,+∞[ . Si µ = n αn δxn , alors F est discontinue en tout point xn tel que αn > 0 et continue partout ailleurs X F (x) = αn 1[xn ,+∞[ . n Définition 11.23 Si µ est une mesure de Borel 4 sur (R, B(R)), on appelle fonction de répartition généralisée de µ la fonction G : R → R définie par −µ(]x, 0]) si x < 0 µ(]0, x]) si x > 0 G(x) = 0 si x = 0. Proposition 11.24 La fonction de répartition G d’une mesure de Borel est continue à droite, croissante, et vérifie lim G(x) = −µ(R− ) x→−∞ et lim F (x) = µ(R?+ ). x→+∞ De plus, pour tous réels a < b, G vérifie les quatre propriétés énoncées à la proposition précédente pour les mesures finies. Dém. À faire en exercice. 2 @ Exemple 11.25 Si µ est la mesure de Lebesgue sur R, alors G(x) = x. Théorème 11.26 Si µ et ν sont deux mesures finies (resp. de Borel) sur (R, B(R)), et qu’elles ont la même fonction de répartition F (resp. la même fonction de répartition généralisée G), alors elles sont égales. 4. c’est-à-dire une mesure finie sur les compacts CHAPITRE 11. CONSTRUCTION D’UNE MESURE Dém. 76 Traitons d’abord le cas où µ et ν sont finies. Soit alors C := {] − ∞, x] : x ∈ R} ∪ {R}. On voit facilement que C est un π-système engendrant B(R) sur lequel µ et ν coïncident, car µ(] − ∞, x]) = F (x) = ν(] − ∞, x]) (l’égalité µ(R) = ν(R) s’obtient par passage à la limite). Le corollaire 11.17 permet de conclure que µ et ν coïncident sur B(R). Dans le cas où µ et ν sont seulement finies sur les compacts, on définit C := {]x, y] : −∞ < x ≤ y < +∞} ∪ {R}, et En :=] − n, n]. Alors En ∈ C , ∪n En = R et C est un π-système engendrant B(R) sur lequel µ et ν coïncident, car µ(]x, y]) = G(y) − G(x) = ν(]x, y]) (les égalités µ(R− ) = ν(R− ) et µ(R?+ ) = µ(R?+ ) s’obtiennent pas passages à la limite, et impliquent µ(R) = ν(R)). Comme on a µ(En ) = ν(En ) < ∞, le corollaire 11.18 permet de conclure que µ et ν coïncident sur B(R). 2 11.3 11.3.1 Existence d’une mesure Théorème de Caratheodory Définition 11.27 Soit B une algèbre de Boole sur un ensemble E. Une mesure d’algèbre sur (E, B) est une application m : B → [0, +∞] qui : (i) associe la valeur 0 à l’ensemble vide : m(∅) = 0 ; (ii) est finiment additive : pour tous A, B ∈ B tels que A ∩ B = ∅, m(A ∪ B) = m(A) + m(B) ; (iii) satisfait la popriété suivante : il existe une suite croissante (En ) d’éléments de B convergeant vers E telle que m(En ) < ∞ pour chaque entier n et telle que pour tout A ∈ B, limn ↑ m(A ∩ En ) = m(A) ; (iv) satisfait la propriété de Caratheodory : pour toute suite décroissante (An ) d’éléments de B convergeant vers ∅ et telle que m(A0 ) < ∞, limn ↓ m(An ) = 0. Proposition 11.28 Une mesure d’algèbre m sur (E, B) vérifie pour tous A, B ∈ B : (i) Additivité finie : m(A) = m(A \ B) + m(A ∩ B) ; (ii) Additivité forte : m(A ∪ B) + m(A ∩ B) = m(A) + m(B) ; (iii) Sous-additivité : m(A ∪ B) ≤ m(A) + m(B) ; (iv) Croissance : si A ⊆ B, m(A) ≤ m(B). Théorème 11.29 (de prolongement de Caratheodory) Soit B une algèbre de Boole sur un ensemble E. Si m est une mesure d’algèbre sur (E, B), alors il existe une mesure µ sur la tribu σ(B) qui coïncide 5 avec m sur B. Remarque 11.30 On dit alors que µ est un prolongement de la mesure (d’algèbre) m, qui elle est seulement définie sur l’algèbre B, à la tribu σ(B). Ce théorème de prolongement est admis. 5. c’est-à-dire que pour tout B ∈ B, µ(B) = m(B) CHAPITRE 11. CONSTRUCTION D’UNE MESURE 77 Remarque 11.31 En fait on aurait directement pu dire dans le théorème qu’il existe un unique tel prolongement. En effet, si µ et ν sont deux prolongements d’une même mesure d’algèbre B, alors µ et ν coïncident sur B, qui est aussi un π-système, et comme il existe une suite mesurable (En ) convergeant vers E telle que µ(En ) = ν(En ) < ∞, alors µ et ν coïncident sur σ(B) d’après le corollaire 11.18. 11.3.2 Applications Existence de la mesure de Lebesgue Montrons l’existence d’une mesure sur Bor(Rd ) telle que la mesure d’un pavé R = et d’extrémité k=1 Ik , où chaque Ik est un intervalle de R d’extrémité gauche ak ≥ −∞Q droite bk ≤ +∞ (les extrémités pouvant être fermées ou ouvertes), vaut dk=1 (bk − ak ). On définit B l’ensemble des réunions finies de pavés deux à deux disjoints. Alors pour tout A ∈ B, A s’écrit de manière unique sous la forme A = ∪ji=1 Ri , où les (Ri ) sont des pavés deux à deux P disjoints, et l’on peut définir sans ambiguïté la mesure d’algèbre m sur B par m(A) = ji=1 m(Ri ), où la mesure d’un pavé a été définie précédemment. On peut alors vérifier que B est une algèbre et que m est une mesure d’algèbre sur (E, B) @ avec En définie comme le produit des intervalles ] − n, n[ (pour montrer la propriété de Caratheodory, on s’inspirera de l’application suivante). Comme σ(B) = Bor(Rd ), le théorème de Caratheodory permet bien de déduire l’existence d’une mesure, appelée mesure de Lebesgue, prolongeant la mesure m à tous les boréliens de Rd . Qd Définition d’une mesure par sa fonction de répartition Théorème 11.32 Si F : R → R+ est une fonction croissante, bornée, continue à droite et telle que limx→−∞ F (x) = 0 alors il existe une (unique) mesure µ sur Bor(R) qui admet F pour fonction de répartition. Théorème 11.33 Si G : R → R est une fonction croissante, continue à droite et telle que G(0) = 0, alors il existe une (unique) mesure µ de Borel sur Bor(R) qui admet G pour fonction de répartition généralisée. Remarque 11.34 L’existence de la mesure de Lebesgue sur R peut également se déduire du théorème précédent en prenant G(x) = x. Soit B l’ensemble de toutes les réunions finies d’intervalles disjoints, qui est une algèbre. Pour tous −∞ ≤ x ≤ y ≤ ∞, on définit alors (avec @ G(−∞) = limx→−∞ G(x) et G(∞−) = limx→∞ G(x)) Dém. du théorème 11.33. m(]x, y[) := G(y−) − G(x) et m({x}) = G(x) − G(x−), ce qui définit m sur tout intervalle de R, et pour tout A = ∪ij=1 Ij ∈ B, où les (Ij ) sont P des intervalles disjoints, m(A) := ij=1 m(Ij ). Montrons que les quatre propriétés du théorème de prolongement de Caratheodory sont satisfaites. Le résultat découlera alors de ce théorème car σ(B) = Bor(R). CHAPITRE 11. CONSTRUCTION D’UNE MESURE 78 Il est immédiat de vérifier que c’est bien le cas des propriétés (i) et (ii). Pour (iii), définissons En :=] − n, n] et fixons A ∈ B. En distinguant suivant que A contient un intervalle infini ou non, on montre alors que limn ↑ m(A ∩ En ) = m(A). D’après la définition de la mesure d’algèbre m, on peut toujours se ramener au cas où A est un seul intervalle. Si par exemple A =]x, +∞[, où x est fini, alors à partir d’un certain rang, A ∩ En =]x, n] et limn m(A ∩ En ) = limn G(n) − G(x) = G(∞−) − G(x) = m(A). Les autres cas se démontrent de la même manière. Le plus difficile reste à faire, à savoir montrer que la propriété (iv), dite de Caratheodory, est satisfaite. Soit donc une suite décroissante (An ) d’éléments de B telle que m(A0 ) < ∞. On peut donc écrire An de manière unique sous la forme An = Kn [ Ik,n , k=1 où les Kn intervalles (Ik,n )k sont disjoints. On fixe alors ε et l’on cherche à définir une suite de compacts (A0n ) telle que A0n ⊆ An et m(An \ A0n ) ≤ ε2−n . Il suffit pour cela 0 d’exhiber des intervalles compacts Ik,n ⊆ Ik,n suffisamment grands pour que 0 m Ik,n \ Ik,n ≤ ε Kn 2n n ≥ 0, 1 ≤ k ≤ Kn . En effet, en définissant A0n := Kn [ 0 Ik,n , k=1 0 n on aura alors An ⊆ A0n et An \ A0n = ∪K k=1 Ik,n \ Ik,n , si bien que m (An \ A0n ) = Kn X k=1 m Ik,n \ 0 Ik,n ≤ Kn X k=1 ε ε = n. n Kn 2 2 Remarquons d’abord que pour tous −∞ ≤ x ≤ y ≤ +∞ tels que m(]x, y[) < ∞, pour toute suite décroissante (xn ) convergeant vers x et pour toute suite croissante (yn ) convergeant vers y, m(]x, y[\[xn , yn ]) = m(]x, xn [) + m(]yn , y[) = G(xn −) − G(x) + G(y−) − G(yn ) −→ 0, lorsque n → ∞, car G est continue à droite (avec des limites à gauche, car croissante) et l’on a supposé que G(y−) et G(x) sont finis. En conclusion, pour tout α > 0 et tout intervalle I =]x, y[ de R (resp. I = [x, y[, resp. I =]x, y]) tel que m(I) < ∞, il existe un intervalle compact I 0 = [x0 , y 0 ] (resp. I 0 = [x, y 0 ], resp. I 0 = [x0 , y]) inclus dans I tel que m(I 0 \ I) < α. Puisque m(A0 ) < ∞, on peut donc bien trouver des intervalles compacts 0 Ik,n vérifiant la propriété demandée. Supposons qu’il existe x ∈ ∩n A0n . Alors pour tout entier n, x ∈ A0n , donc x ∈ An puisque A0n ⊆ An . Par conséquent, x ∈ ∩n An , ce qui contredit ∩n An = ∅, ce qui prouve que ∩n A0n = ∅. Or chaque A0n est compact (comme 0 réunion finie de compacts) donc il existe un entier N tel que ∩N @ n=0 An = ∅. Or CHAPITRE 11. CONSTRUCTION D’UNE MESURE N \ n=0 ! An ∩c N [ ! An \ A0n N \ = ! An n=0 N \ n=0 = N \ ∩ 79 ! (cAn ∪ A0n ) n=0 c An ∩ ( An ∪ A0n ) = N \ An ∩ A0n A0n = ∅. n=0 n=0 n=0 = N \ De cette intersection vide, on déduit que AN = N \ n=0 An ⊆ N [ (An \ A0n ) . n=0 Mais comme une mesure d’algèbre est croissante et sous-additive, pour tout entier k ≥ N , @ ! N N N [ X X m(Ak ) ≤ m(AN ) ≤ m (An \ A0n ) ≤ m (An \ A0n ) ≤ ε2−n ≤ 2ε. n=0 n=0 n=0 En conclusion, pour tout ε > 0, il existe un entier N tel que pour tout k ≥ N , m(Ak ) ≤ 2ε, ce qui n’est autre que la propriété de Caratheodory. 2 Chapitre 12 Tribu produit, mesure produit et « intégrales multiples » 12.1 12.1.1 Tribu produit Cas général Soient (E1 , A1 ) et (E2 , A2 ) deux espaces mesurables. Définition 12.1 On appelle tribu produit sur E1 × E2 , et l’on note A1 ⊗ A2 , la plus petite tribu contenant les rectangles à côtés mesurables : A1 ⊗ A2 := σ (A1 × A2 ) , où l’on a noté A1 × A2 := {A1 × A2 : A1 ∈ A1 , A2 ∈ A2 }. Le couple (E1 × E2 , A1 ⊗ A2 ) est appelé espace mesurable produit. Remarque 12.2 Bien entendu, la famille A1 × A2 des rectangles à côtés mesurables n’est en général pas une tribu. Proposition 12.3 La tribu A1 ⊗ A2 est aussi la tribu engendrée par les projections canoniques π1 et π2 , c’est-à-dire la plus petite tribu sur E1 × E2 qui rende π1 et π2 mesurables 1 . Soit B la tribu engendrée par π1 et π2 . Par définition, B est la plus petite tribu contenant les parties de E1 × E2 de la forme π1−1 (A1 ) et π2−1 (A2 ) où Ai ∈ Ai , i = 1, 2. Or π1−1 (A1 ) = A1 × E2 et π2−1 (A2 ) = E1 × A2 , donc B est aussi la plus petite tribu qui contient les parties de E1 × E2 de la forme (A1 × E2 ) ∩ (E1 × A2 ) = A1 × A2 , c’est-à-dire σ(A1 × A2 ). 2 Dém. 1. On rappelle que π1 et π2 sont définies par : π1 (x, y) = x et que π2 (x, y) = y 80 CHAPITRE 12. TRIBU PRODUIT ET MESURE PRODUIT 81 Proposition 12.4 Soit f : (X, T ) −→ (E1 × E2 , A1 ⊗ A2 ) x 7−→ f (x) = (f1 (x), f2 (x)) Alors la fonction f est mesurable ssi f1 et f2 sont mesurables 2 . Sens direct de l’équivalence : si f est mesurable alors pour tout i = 1, 2, fi = πi ◦f est mesurable comme composée de fonctions mesurables. Autre sens : supposons que f1 et f2 sont mesurables. Alors pour tous A1 ∈ A1 et A2 ∈ A2 , Dém. f −1 (A1 ×A2 ) = {x ∈ X : f (x) ∈ A1 ×A2 } = {x ∈ X : f1 (x) ∈ A1 , f2 (x) ∈ A2 } = f1−1 (A1 )∩f2−1 (A2 ). Par hypothèse f1−1 (A1 ) ∈ T et f2−1 (A2 ) ∈ T , donc f −1 (A1 × A2 ) ∈ T par stabilité des tribus par intersection. En conclusion, f −1 (A1 × A2 ) ⊆ T , donc f −1 (A1 ⊗ A2 ) = σ f −1 (A1 × A2 ) ⊆ T , où la première égalité est une application du lemme de transport, et l’inclusion n’est autre que la mesurabilité de f . 2 Remarque 12.5 Ce qui précède peut bien sûr s’énoncer de manière similaire pour tout produit cartésien fini d’ensembles. Si ((Ei , Ai ))1≤i≤d sont d espaces mesurables, alors on définit A1 ⊗ · · · ⊗ Ad comme la plus petite tribu sur E1 × · · · × Ed contenant tous les rectangles de la forme A1 × · · · × Ad , où Ai ∈ Ai pour tous i = 1, . . . , d ; c’est aussi la tribu engendrée par les projections canoniques πi : d Y Ej −→ Ei j=1 (x1 , . . . , xd ) 7−→ xi pour i parcourant {1, . . . , d}. Proposition 12.6 (associativité de ⊗) On a l’égalité suivante entre tribus (A1 ⊗ · · · ⊗ Aj ) ⊗ (Aj+1 ⊗ · · · ⊗ Ad ) = A1 ⊗ · · · ⊗ Ad , où l’on a bien sûr identifié (E1 × · · · × Ej ) × (Ej+1 × · · · × Ed ) et E1 × · · · × Ed . 2. comme fonctions de (X, T ) vers (E1 , A1 ) et (E2 , A2 ) respectivement CHAPITRE 12. TRIBU PRODUIT ET MESURE PRODUIT 82 Montrons la proposition dans le cas où j = 2 et d = 3. Première démonstration possible. La tribu (A1 ⊗ A2 ) ⊗ A3 est la plus petite tribu qui rende mesurables les applications Dém. f1,2 : E1 × E2 × E3 −→ (E1 × E2 , A1 ⊗ A2 ) ((x1 , x2 ), x3 ) 7−→ (x1 , x2 ) et f3 : E1 × E2 × E3 −→ (E3 , A3 ) ((x1 , x2 ), x3 ) 7−→ x3 Or f1,2 est mesurable ssi ses applications coordonnées le sont. Par conséquent, ces deux applications sont mesurables ssi les trois applications (x1 , x2 , x3 ) 7→ xi , pour i = 1, 2, 3, sont mesurables. Donc (A1 ⊗ A2 ) ⊗ A3 est la tribu engendrée par ces trois applications, c’est donc A1 ⊗ A2 ⊗ A3 . Deuxième démonstration possible, par double inclusion. Cette démonstration est plus compliquée, mais constitue un bon exercice. Démontrons d’abord l’inclusion A1 ⊗ A2 ⊗ A3 ⊆ (A1 ⊗ A2 ) ⊗ A3 . Pour tous Ai ∈ Ai , (i = 1, 2, 3), A1 × A2 ∈ A1 ⊗ A2 , donc A1 × A2 × A3 ∈ (A1 ⊗ A2 ) × A3 ⊆ (A1 ⊗ A2 ) ⊗ A3 , donc (A1 ⊗ A2 ) ⊗ A3 contient les rectangles à côtés mesurables de E1 × E2 × E3 , donc contient tous les éléments de la tribu qu’ils engendrent, ce qui est l’inclusion annoncée. Montrons l’inclusion inverse. Fixons A3 ∈ A3 et définissons T := {B ∈ A1 ⊗ A2 : B × A3 ∈ A1 ⊗ A2 ⊗ A3 }. On veut montrer que T est une tribu : si T est une tribu, alors comme T contient les rectangles de E1 × E2 à côtés mesurables, T contient tous les éléments de la tribu B := A1 ⊗ A2 qu’ils engendrent. Ceci implique que pour tout B ∈ B, B × A3 ∈ A1 ⊗ A2 ⊗ A3 , où A3 est un élément arbitraire de A3 . Autrement dit, B × A3 ⊆ A1 ⊗ A2 ⊗ A3 et donc B ⊗ A3 = σ(B × A3 ) ⊆ A1 ⊗ A2 ⊗ A3 , qui est l’inclusion annoncée. Vérifions donc que T est une tribu : i) ∅ ∈ T car ∅ × A3 = ∅ ∈ A1 ⊗ A2 ⊗ A3 . ii) pour tout B ∈ T , cB ∈ T car c B × A3 = (E1 × E2 × A3 ) ∩ c(B × A3 ) qui est bien élément de T car E1 × E2 × A3 ∈ A1 ⊗ A2 ⊗ A3 et B × A3 ∈ A1 ⊗ A2 ⊗ A3 , qui est une tribu, donc stable par passage au complémentaire et intersection. iii) pour toute suite (Bn ) d’éléments de T , (∪n Bn ) × A3 = ∪n (Bn × A3 ), qui est bien élément de T car pour tout n, Bn × A3 ∈ A1 ⊗ A2 ⊗ A3 , qui est une tribu, donc stable par réunion dénombrable. 2 CHAPITRE 12. TRIBU PRODUIT ET MESURE PRODUIT 12.1.2 83 Le cas borélien Lorsque E1 et E2 sont des espaces topologiques, nous disposons déjà d’une tribu sur E1 × E2 qui est la tribu borélienne Bor(E1 × E2 ), ou tribu engendrée par la topologie produit, dont on rappelle que les éléments sont les réunions (quelconques) de produits d’ouverts (dits aussi rectangles à côtés ouverts). Proposition 12.7 a) On a toujours l’inclusion Bor(E1 ) ⊗ Bor(E2 ) ⊆ Bor(E1 × E2 ). b) Si E1 et E2 sont tous deux à bases dénombrable d’ouverts (en particulier si E1 et E2 sont des espaces métriques séparables), alors l’inclusion précédente devient une égalité. a) Par définition de la topologie produit, πi : E1 × E2 → Ei est continue pour i = 1, 2 (i = 1 : si O1 est un ouvert de E1 , π1−1 (O1 ) = O1 × E2 est un ouvert de E1 × E2 ), et par conséquent πi est borélienne 3 . Or la plus petite tribu qui rende mesurable π1 et π2 est Bor(E1 ) ⊗ Bor(E2 ), d’où le résultat. (i) b) Pour tout i = 1, 2, soit Ui = (Un )n∈N une base dénombrable d’ouverts de Ei , c’est-à-dire que tout ouvert de Ei peut s’écrire comme réunion (forcément dénombrable, donc) d’éléments de Ui . Par définition de la topologie produit, tout ouvert Ω de E1 × E2 est une réunion (quelconque, cette fois) de produits d’ouverts [ (1) (2) Ω= Oj × Oj , Dém. j∈J (i) où J est un ensemble d’indices quelconque et pour tous i, j, Oj est un ouvert de Ei . (i) (i) Comme Oj est un ouvert de Ei , Oj s’écrit comme réunion d’éléments de Ui , c’est-à-dire (i) qu’il existe une partie Kj de N telle que [ (i) (i) Oj = Uh , (i) h∈Kj et ainsi [ [ (1) (2) (1) (2) Oj × Oj = Uh × Uk = (1) h∈Kj (2) [ (1) (1) (2) Uh × Uk . (2) (h,k)∈Kj ×Kj k∈Kj En conclusion, Ω= [ (1) (2) Uh × Uk , (1) (2) (h,k)∈∪j∈J Kj ×Kj 3. sans ambiguïté : l’espace d’arrivée Ei est muni de sa tribu borélienne Bor(Ei ) et l’espace de départ E1 ×E2 est muni de sa tribu borélienne Bor(E1 × E2 ) CHAPITRE 12. TRIBU PRODUIT ET MESURE PRODUIT 84 (1) (2) qui est une réunion dénombrable de produits d’ouverts car ∪j∈J Kj ×Kj ⊆ N2 . Comme un produit d’ouverts est élément de Bor(E1 ) ⊗ Bor(E2 ), c’est le cas également de Ω, par stabilité des tribus par réunion dénombrable. Ainsi les ouverts de E1 × E2 sont des éléments de la tribu Bor(E1 )⊗Bor(E2 ), et par conséquent la plus petite tribu contenant les ouverts de E1 × E2 , à savoir Bor(E1 × E2 ), est incluse dans Bor(E1 ) ⊗ Bor(E2 ). 2 Corollaire 12.8 Comme R est un espace métrique séparable, Bor(R) ⊗ Bor(R) = Bor(R2 ) et plus généralement, pour tout entier d ≥ 2, Bor(R)⊗d = Bor(Rd ). Ce corollaire permet, par exemple, de voir rapidement pourquoi, si f, g : R → R sont deux fonctions boréliennes, alors f + g et f g sont aussi boréliennes. En effet, on sait que l’application somme S S : (R2 , Bor(R2 )) −→ (R, Bor(R)) (x, y) 7−→ x + y et l’application produit P P : (R2 , Bor(R2 )) −→ (R, Bor(R)) (x, y) 7−→ xy sont boréliennes car continues. De plus, on sait que l’application C : (R, Bor(R)) −→ (R2 , Bor(R) ⊗ Bor(R)) x 7−→ (f (x), g(x)) est mesurable, car les deux applications coordonnées f et g sont mesurables. Ayant l’égalité entre Bor(R2 ) et Bor(R) ⊗ Bor(R), on a donc la mesurabilité de f + g = S ◦ C et de f g = P ◦ C. 12.1.3 Sections Définition 12.9 Si C ∈ A1 ⊗ A2 , pour tous x1 ∈ E1 et x2 ∈ E2 , on note Cx1 := {y2 ∈ E2 : (x1 , y2 ) ∈ C} et C x2 := {y1 ∈ E1 : (y1 , x2 ) ∈ C}, que l’on appelle sections de C. Proposition 12.10 Soit f ∈ F (A1 ⊗ A2 , Bor(R)). Alors pour tout x1 ∈ E1 , l’application partielle fx1 : (E2 , A2 ) −→ (R, Bor(R)) x2 7−→ f (x1 , x2 ) est mesurable. Remarque 12.11 Attention, la réciproque est fausse : le fait que toutes les applications partielles soient mesurables n’implique pas forcément que f soit mesurable. CHAPITRE 12. TRIBU PRODUIT ET MESURE PRODUIT Dém. 85 L’application gx1 : (E2 , A2 ) −→ (E1 × E2 , A1 ⊗ A2 ) x2 7−→ (x1 , x2 ) est mesurable car chacune des applications coordonnées l’est de façon évidente. Donc fx1 = f ◦ gx1 est mesurable. 2 Proposition 12.12 Les sections d’éléments de la tribu produit sont mesurables. Autrement dit, pour tout C ∈ A1 ⊗ A2 et pour tous x1 ∈ E1 et x2 ∈ E2 : Cx1 ∈ A2 et C x2 ∈ A1 . Il suffit d’appliquer la proposition précédente à la fonction f = 1C , qui est mesurable par hypothèse. On obtient donc que fx1 est mesurable, mais fx1 = 1Cx1 , donc Cx1 ∈ A2 . 2 Dém. 12.2 Mesure produit Soient µ1 et µ2 deux mesures σ-finies, sur (E1 , A1 ) et (E2 , A2 ) respectivement. Lemme 12.13 Pour tout C ∈ A1 ⊗ A2 , l’application hC : (E1 , A1 ) −→ (R̄+ , Bor(R̄+ )) x1 7−→ µ2 (Cx1 ) est mesurable. Dém. Supposons d’abord que µ2 est finie. Soit Λ := {C ∈ A1 ⊗ A2 : hC est mesurable}. Montrons que Λ est une classe monotone. i) C = E1 × E2 ∈ Λ car Cx1 = E2 pour tout x1 ∈ E1 , et hC est donc la fonction constante à µ2 (E2 ), qui est toujours mesurable. ii) Soient C ⊆ D tous deux éléments de Λ. Alors hC et hD sont mesurables, et hD\C = hD − hC , car (D \ C)x1 = Dx1 \ Cx1 , avec Cx1 ⊆ Dx1 . Donc hD\C est mesurable, et D \ C ∈ Λ. iii) Soit (C (n) )n une suite croissante d’éléments de Λ et C sa limite. Alors la suite (n) (Cx1 ) est croissante, donc par continuité à gauche de la mesure µ2 , hC (x1 ) = µ2 ((∪n C (n) )x1 ) = µ2 (∪n Cx(n) ) = µ2 (lim ↑ Cx(n) ) = lim ↑ µ2 (Cx(n) ) = lim hCn , 1 1 1 n n qui est bien mesurable, comme limite de fonctions mesurables. n CHAPITRE 12. TRIBU PRODUIT ET MESURE PRODUIT 86 En conclusion, Λ est bien une classe monotone. Montrons que Λ contient le π-système A1 × A2 . En effet, pour tout C = A1 × A2 ∈ A1 × A2 , A2 si x1 ∈ A1 C x1 = ∅ sinon, donc hC = µ2 (A2 )1A1 , qui est mesurable car étagée. Le théorème de la classe monotone assure alors que Λ contient σ(A1 × A2 ) = A1 ⊗ A2 . La proposition est donc démontrée dans le cas où µ2 est finie. (n) Si µ2 est seulement σ-finie, alors par définition, il existe une suite croissante (E2 )n (n) d’éléments de A2 convergeant vers E2 telle que µ2 (E2 ) < ∞ pour tout entier n. En (n) particulier, pour tout A2 ∈ A2 , µ2 (A2 ) = limn ↑ µ2 (A2 ∩ E2 ). En appliquant ce qui (n) précède à la mesure trace de µ2 sur E2 , on obtient que l’application hn : x1 7→ µ2 (Cx1 ∩ (n) E2 ) est mesurable, et par conséquent l’application hC est également mesurable, comme limite (croissante) de la suite de fonctions (hn ). 2 Théorème 12.14 Il existe une unique mesure m sur l’espace produit (E1 × E2 , A1 ⊗ A2 ) vérifiant m(A1 × A2 ) = µ1 (A1 )µ2 (A2 ) pour tous A1 ∈ A1 et A2 ∈ A2 . Cette mesure est σ-finie et est appelée mesure produit. On la note m = µ1 ⊗ µ2 . De plus, pour tout C ∈ A1 ⊗ A2 , Z Z µ2 (Cx1 ) dµ1 (x1 ) = µ1 ⊗ µ2 (C) = µ1 (C x2 ) dµ2 (x2 ). E1 E2 Remarque 12.15 On pourrait énoncer un résultat qui assure que le produit de mesures ⊗ est associatif, et le démontrer en utilisant la coïncidence des différents produits de mesures possibles sur les rectangles à côtés mesurables. Une conséquence de cette remarque @ est la proposition suivante. Proposition 12.16 La mesure de Lebesgue λd sur (Rd , Bor(Rd )) est aussi la mesure produit λ1⊗d . Remarque 12.17 Le théorème 12.14 est faux lorsque µ1 ou µ2 n’est pas σ-finie comme on le voit en prenant par exemple la mesure de Lebesgue sur R pour µ1 (qui est bien σ-finie) mais la mesure de comptage sur R pour µ2 (qui n’est pas σ-finie). En prenant par exemple (E1 , A1 ) = (R, Bor(R)), (E2 , A2 ) = (R, P(R)), et C = {(x, x) : x ∈ R} la première bissectrice de R2 , alors Cx1 = {x1 } et C x2 = {x2 }, donc µ1 (C x2 ) = 0, tandis que µ2 (Cx1 ) = 1. Par conséquent, Z Z µ2 (Cx1 ) dµ1 (x1 ) = µ1 (E1 ) = +∞ = 6 0= µ1 (Cx2 ) dµ2 (x2 ). E1 E2 CHAPITRE 12. TRIBU PRODUIT ET MESURE PRODUIT 87 a) Unicité. Si m et m0 vérifient la propriété du théorème, c’est qu’elles coïncident sur le π-système A1 × A2 qui engendre A1 ⊗ A2 . De plus, comme (n) µ1 et µ2 sont toutes deux σ-finies, alors pour i = 1, 2, il existe une suite croissante (Ei ) (n) d’éléments de Ai convergeant vers Ei et tels que µi (Ei ) < ∞. Alors si l’on définit (n) (n) (n) (n) Cn = E1 × E2 , m(Cn ) = m0 (Cn ) = µ1 (E1 ) µ2 (E2 ) < ∞ et ∪n Cn = E1 × E2 , ce qui permet de conclure que m = m0 par le corollaire 11.18. b) Existence. On définit m1 : A1 ⊗ A2 → R̄+ par Z m1 (C) := µ2 (Cx1 ) dµ1 (x1 ). Dém. du théorème 12.14. E1 Montrons que m1 est une mesure. i) m1 (∅) = 0 car toutes les sections de l’ensemble vide sont vides. ii) Soit (C (n) ) une suite d’éléments de A1 ⊗ A2 deux à deux disjoints. Alors pour tout (n) (n) x1 ∈ E1 , les sections (Cx1 ) sont deux à deux disjointes et ∪n C (n) x1 = ∪n Cx1 , si bien que, par le théorème de Beppo Levi, ! Z X XZ X (n) (n) m1 ∪n C = µ2 Cx1 dµ1 (x1 ) = µ2 Cx(n) m1 C (n) , dµ1 (x1 ) = 1 E1 n n E1 n ce qui prouve la σ-additivité de m1 . De plus, pour tous A1 ∈ A1 et A2 ∈ A2 , et pour tout x1 ∈ E1 , la section (A1 × A2 )x1 vaut A2 si x1 ∈ A1 et est vide sinon. Ainsi, Z m1 (A1 × A2 ) = µ2 (A2 ) dµ1 (x1 ) = µ1 (A1 )µ2 (A2 ). A1 Il existe donc bien une mesure m = m1 satisfaisant m(A1 × A2 ) = µ1 (A1 )µ2 (A2 ) et cette mesure vérifie Z m(C) := µ2 (Cx1 ) dµ1 (x1 ). E1 De même, on définit la mesure m2 par Z m2 (C) := µ1 (C x2 ) dµ2 (x2 ), E2 et l’on montre que m2 est une mesure qui coïncide avec m sur A1 × A2 , donc est égale à m (cf. a)). On se reportera aussi à a) pour voir que m est σ-finie. 2 12.3 12.3.1 Théorèmes de Fubini Théorème de Fubini–Tonelli Théorème 12.18 (de Fubini–Tonelli) Si f : (E1 × E2 , A1 ⊗ A2 ) → (R̄+ , Bor(R̄+ )) est mesurable, alors les fonctions φ et ψ définies resp. sur E1 et E2 par Z Z φ(x1 ) := f (x1 , x2 ) dµ2 (x2 ) et ψ(x2 ) := f (x1 , x2 ) dµ1 (x1 ) E2 E1 CHAPITRE 12. TRIBU PRODUIT ET MESURE PRODUIT sont toutes deux mesurables et l’on a la double égalité dans R̄+ Z Z Z φ dµ1 = f d(µ1 ⊗ µ2 ) = ψ dµ2 . E1 ×E2 E1 88 (12.1) E2 Si f = 1C pour C ∈ A1 ⊗ A2 , alors φ(x1 ) = µ2 (Cx1 ) et ψ(x2 ) = µ1 (Cx2 ), et donc d’après le lemme 12.13 assure que φ et ψ sont mesurables et les trois termes de l’équation (12.1) sont égaux à µ1 ⊗ µ2 (C) par le théorème 12.14. Cette assertion s’étend aux fonctions étagées positives pas linéarité de l’intégrale, puis aux fonctions mesurables positives par le lemme fondamental d’approximation et le théorème de Beppo Levi. 2 Dém. 12.3.2 Théorème de Fubini–Lebesgue Théorème 12.19 (de Fubini–Lebesgue) Soit f comme dans le théorème de Fubini– Tonelli mais de signe quelconque. Alors si f est µ1 ⊗ µ2 -intégrable 4 , alors les fonctions φ et ψ du théorème sont resp. définies µ1 -p.p. et µ2 -p.p., sont resp. µ1 -intégrables et µ2 -intégrables, et vérifient la double égalité (12.1). Dém. On définit Z φ+ (x1 ) = f + (x1 , x2 ) dµ2 (x2 ), E2 ainsi que de manière évidente, φ− , ψ+ et ψ− . D’après le théorème de Fubini–Tonelli, Z Z Z + φ+ dµ1 = f d(µ1 ⊗ µ2 ) = ψ+ dµ2 , E1 ×E2 E1 E2 qui est un nombre réel fini par hypothèse (se référer au terme du milieu). Par conséquent, φ+ est finie µ1 -p.p. et ψ+ est finie µ2 -p.p., ainsi que φ− et ψ− respectivement. Donc la fonction φ est définie µ1 -p.p. (comme différence de deux fonctions finies p.p.) et l’intégrale de | φ | est finie car égale à la somme des intégrales de φ+ et de φ− , qui sont toutes deux finies. Le résultat analogue se démontre de la même manière pour ψ, et ainsi l’égalité (12.1) s’obtient en faisant la différence de deux quantités finies. 2 Remarque 12.20 Si f est positive, le théorème de Fubini–Tonelli assure que l’intégrale de f par rapport à µ1 ⊗ µ2 peut toujours se calculer en faisant deux intégrales « simples » successives dans l’ordre que l’on souhaite. Si f est de signe quelconque, il faut, pour appliquer le théorème de Fubini-Lebesgue, d’abord vérifier l’intégrabilité de | f | par rapport à µ1 ⊗ µ2 en utilisant le théorème de Fubini–Tonelli (il suffit de vérifier que l’une des intégrales« doubles » est finie). Remarque 12.21 Par convention d’écriture, on écrira invariablement : Z Z Z f d(µ1 ⊗ µ2 ) = dµ1 (x1 ) dµ2 (x2 ) f (x1 , x2 ) E1 ×E2 E1 E2 Z Z Z Z = dµ2 (x2 ) dµ1 (x1 ) f (x1 , x2 ) = dµ1 (x1 )dµ2 (dx2 ) f (x1 , x2 ), E2 E1 4. ce qui se vérifie grâce au théorème de Fubini–Tonelli... E1 E2 CHAPITRE 12. TRIBU PRODUIT ET MESURE PRODUIT 89 mais on évitera en général d’écrire des intégrales « multiples » comme Z Z · · · f (x1 , . . . , xn ) dµ(x1 ) · · · dµ(xn ), E E auquel on préférera Z f dµ⊗n . En Remarque 12.22 Si (an,m ) est une suite doublement indicée de nombres réels positifs et si µ est la mesure de comptage sur (N, P(N)), alors l’interversion suivante XX XX an,m = an,m n m m n R P peut être vue comme une application du théorème de Beppo Levi, car m an,m = N an,m dµ(m), comme du théorème de Fubini–Tonelli, car les termes de l’équation sont tous deux égaux R à N×N an,m dµ⊗2 (n, m). Chapitre 13 Mesure image et changement de variable 13.1 Mesure image Soient (E1 , A1 ) et (E2 , A2 ) deux espaces mesurables, µ une mesure sur (E1 , A1 ) et h ∈ F (A1 , A2 ). Définition 13.1 (et proposition) L’égalité ν(A2 ) := µ h−1 (A2 ) A2 ∈ A2 définit une mesure ν sur (E2 , A2 ) appelée mesure image et notée µ ◦ h−1 , ou h(µ), ou encore µh . i) ν(∅) = µ(h−1 (∅)) = µ(∅) = 0. ii) Soit (Bn ) une suite d’éléments de A2 deux à deux disjoints, alors d’après les formules de Hausdorff, pour tous i 6= j, Dém. h−1 (Bi ) ∩ h−1 (Bj ) = h−1 (Bi ∩ Bj ) = h−1 (∅) = ∅, et ainsi X X ν (∪n Bn ) = µ h−1 (Bn ) = µ ∪n h−1 (Bn ) = µ h−1 (Bn ) = ν(Bn ), n n 2 par σ-additivité de µ. Théorème 13.2 Soit f ∈ F (A2 , Bor(R)). Si f est positive µh -p.p. alors on a l’égalité suivante dans R̄+ Z Z f ◦ h dµ. f dµh = E2 (13.1) E1 De même, f est µh -intégrable ssi f ◦ h est µ-intégrable, et si c’est le cas, on a l’égalité (13.1) dans R. 90 CHAPITRE 13. MESURE IMAGE ET CHANGEMENT DE VARIABLE Dém. Z 91 Si f = 1B , où B ∈ A2 , alors Z Z Z −1 f ◦ h dµ = 1B ◦ h dµ = 1h−1 (B) dµ = µ h (B) = µh (B) = E1 E1 E1 f dµh . E2 La linéarité de l’intégrale, le lemme fondamental d’approximation et le théorème de Beppo Levi impliquent (13.1) dès que f est positive µh -p.p. L’extension aux fonctions mesurables de signe quelconque et l’équivalence des intégrabilités se déduisent classiquement @ de la décomposition f = f + − f − . 2 Application. Soit h ∈ F (A , A ) telle que µh = µ. Alors Z Z f dµ = f ◦ h dµ E E pour toute fonction positive µ-p.p. ou µ-intégrable. En particulier, si µ est la mesure de Lebesgue sur Rd et h = τa est la translation de vecteur a ∈ Rd , alors µh = µ et donc Z Z f dλ. f (x + a) dλ(x) = Rd Rd À partir de maintenant on supposera que µ = λd , que l’on notera λ s’il n’y a pas d’ambiguïté. Proposition 13.3 Soit A ∈ GLd (R) et b ∈ Rd . Soit h l’application affine définie par h(x) = Ax + b. Alors h(λ) = | det A |−1 λ. En particulier, pour tout f positive ou λ-intégrable, on a Z Z 1 f ◦ h dλ = f dλ. | det A | Rd Rd Soit Bn (r) la boule (centrée sur l’origine) de rayon r dans R muni de la norme euclidienne. Alors par la proposition précédente, si h est l’homothétie de paramètre r−1 , Application (vue en détail en TD) : calcul du volume de la boule unité. n Vol(Bn (r)) = λ(h−1 (Bn (1))) = | det(h) |−1 λ(Bn (1)) = rn λ(Bn (1)). D’autre part si cn := Vol(Bn (1)), alors Z 1 Z Z cn = dx1 dx2 · · · dxn = −1 x22 +···+x2n ≤1−x21 1 q 2 1 − x1 dx1 Vol Bn−1 = cn−1 In−1 , −1 où l’on a défini Z 1 In := −1 1 − x2 n/2 dx. CHAPITRE 13. MESURE IMAGE ET CHANGEMENT DE VARIABLE 92 Une intégration par parties permet de voir que In = nIn−2 /(n + 1), ce qui indique pourquoi le résultat dépend de la parité de n. En effet, après calculs, on obtient pour tout entier k πk c2k = , k! tandis que 2k+1 π k c2k+1 = . 1 · 3 · 5 · · · (2k + 1) On retrouve ainsi que c1 = 2, c2 = π et c3 = 4π/3. Montrons qu’on peut supposer que b = 0. Admettons la proposition dans le cas où b = 0, c’est-à-dire que λ ◦ A−1 = | det A |−1 λ. Maintenant si h(x) = Ax + b, c’est-à-dire h = τb ◦ A, on a Dém. de la proposition. λ ◦ h−1 = λ ◦ (τb ◦ A)−1 = λ ◦ A−1 ◦ τb−1 = | det A |−1 λ ◦ τb−1 = | det A |−1 λ. On peut donc supposer dorénavant que b = 0. Soit ν := A(λ). Il faut montrer que ν = | det A |−1 λ. Montrons d’abord que ν est invariante par translation. En effet, comme pour tout c ∈ Rd , A−1 ◦ τc−1 (x) = A−1 (x − c) = A−1 (x) − A−1 (c) = τ−A−1 (c) ◦ A−1 (x), ν ◦ τc−1 = λ ◦ A−1 ◦ τc−1 = λ ◦ τ−A−1 (c) ◦ A−1 = λ ◦ A−1 = ν. Soit Cd le pavé unité [0, 1]d . Montrons que ν(Cd ) > 0. Comme Rd ⊆ ∪x∈Zd (x + Cd ), par invariance par translation de ν, X X ν Rd ≤ ν(x + Cd ) = ν(Cd ), x∈Zd x∈Zd donc si ν(Cd ) = 0, ν Rd = 0, ce qui n’est pas possible car ν Rd = λ ◦ A−1 Rd = λ Rd = +∞. Montrons que ν(Cd ) < ∞. L’application A−1 est linéaire, donc continue, donc l’image Cd0 du compact Cd par A−1 est également compacte. Comme λ est finie sur les compacts, ν(Cd ) = λ(Cd0 ) < ∞. Soit c = c(A) = λ ◦ A−1 [0, 1]d . D’après ce qui précède, c ∈]0, ∞[ et ν 0 = c−1 ν est une mesure invariante par translation telle que ν 0 [0, 1]d = 1, donc ν 0 est la mesure de Lebesgue sur Rd . Il suffit donc de montrer que c(A) = | det A |−1 . Montrons que c est un morphisme. Si ϕ1 et ϕ2 sont deux endomorphismes inversibles de Rd , alors d’après ce qui précède, λ ◦ (ϕ1 ◦ ϕ2 )−1 = c(ϕ1 ◦ ϕ2 ) λ, mais également −1 −1 λ ◦ (ϕ1 ◦ ϕ2 )−1 = λ ◦ ϕ−1 2 ◦ ϕ1 = c(ϕ2 ) λ ◦ ϕ1 = c(ϕ2 ) c(ϕ1 ) λ, ce qui implique effectivement que c(ϕ1 ◦ ϕ2 ) = c(ϕ1 ) c(ϕ2 ). Comme tout endomorphisme inversible Φ de Rd s’écrit comme produit fini d’endomorphismes du type ϕ1 , ϕ2 , ϕ3 , où (en écrivant ei le i-ème vecteur de la base canonique) ϕ1 (ei ) = eσ(i) pour σ une permutation de {1, . . . , d}, CHAPITRE 13. MESURE IMAGE ET CHANGEMENT DE VARIABLE ϕ2 (e1 ) = αe1 et ϕ2 (ej ) = ej ∀j 6= 1 ϕ3 (e1 ) = e1 + e2 , 93 (avec α 6= 0), ϕ3 (ej ) = ej ∀j 6= 1, et il suffit de montrer que c(ϕ) = | det ϕ |−1 pour chacune de ces trois (sortes d’)applications. En effet, ceci étant démontré, nous aurons pour Φ = Πni=1 φi , où les φi sont du type ciavant (et où le produit est un produit matriciel, c’est à-dire une composition), c(Φ) = c (Πni=1 φi ) = Πni=1 c(φi ) = Πni=1 | det φi |−1 = | Πni=1 det φi |−1 = | det Φ |−1 . Le pavé unité Cd est invariant par ϕ1 donc c(ϕ1 ) = λ(Cd ) = 1 = | det ϕ1 |−1 . Dans le cas de ϕ2 , ϕ−1 2 (Cd ) = Iα × Cd−1 , où Iα = [0, 1/α] si α > 0 et Iα = [1/α, 0] si α < 0. Par conséquent c(ϕ2 ) = λ1 (Iα )λd−1 (Cd−1 ) = | α |−1 = | det ϕ2 |−1 . Enfin, ϕ−1 3 (Cd ) = P2 × Cd−2 , où P2 est un losange du plan d’aire 1, donc c(ϕ3 ) = λ2 (P2 )λd−2 (Cd−2 ) = 1 = | det ϕ3 |−1 , ce qui achève la démonstration. 2 13.2 Formule du changement de variable Soient U et V deux ouverts de Rd et φ un C 1 -difféomorphisme entre U et V , c’est-àdire une bijection φ : U → V telle que φ est de classe C 1 sur U et φ−1 est de classe C 1 sur V . Pour tout u ∈ U , on note φ0 (u) la matrice carrée d × d des dérivées partielles de φ évaluées en u, autrement dit la matrice représentative de l’application linéaire tangente à φ en u, appelée matrice jacobienne de φ en u. On note Jφ (u) le déterminant de φ0 (u), appelé jacobien de φ en u. Nous allons montrer que l’image par φ de la mesure de densité | Jφ | par rapport à λ (sur U ) est λ (sur V ), et que l’image par φ de λ (sur U ) est la mesure de densité | Jφ−1 | par rapport à λ (sur V ). Théorème 13.4 (formule de changement de variable) Soit f une fonction borélienne sur V . Si f est positive ou λ-intégrable, alors Z Z f dλ = f ◦ φ | Jφ | dλ. V U De manière équivalente, si f est positive ou que f ◦ φ est λ-intégrable, alors Z Z f ◦ φ dλ = f | Jφ−1 | dλ. U V Remarque 13.5 En dimension 1, si φ :]α, β[−→]a, b[ est un C 1 -difféomorphisme, alors φ0 ne peut pas s’annuler et en particulier, φ est de signe constant. Avec les notations de l’intégrale de Riemann, si l’on applique la formule de changement de variable apprise au lycée, on retombe bien entendu sur la formule du théorème précédent. Si φ0 > 0, alors Z b Z φ−1 (b) Z β 0 f (x) dx = f ◦ φ(u) φ (u) du = f ◦ φ(u) | φ0 (u) | du. a φ−1 (a) α CHAPITRE 13. MESURE IMAGE ET CHANGEMENT DE VARIABLE Si φ0 < 0, alors Z Z b f (x) dx = φ−1 (b) Z 0 Z 0 β f ◦ φ(u) φ (u) du = f ◦ φ(u) φ (u) du = − φ−1 (a) a β 94 f ◦ φ(u) | φ0 (u) | du. α α Corollaire 13.6 Si µ est la mesure de densité f par rapport à λ et si φ : Rd → Rd est un C 1 -difféomorphisme, alors la mesure image de µ par φ admet une densité g par rapport à λ, et g est donnée par g(x) = f ◦ φ−1 (x) | Jφ−1 (x) | Dém. x ∈ Rd . Pour toute fonction borélienne positive h, en se servant du théorème précédent, Z Z Z Z −1 h dµφ = h ◦ φ f dλ = h ◦ φ f ◦ φ ◦ φ dλ = h f ◦ φ−1 | Jφ−1 | dλ, ce qui prouve le corollaire (prendre tout simplement une indicatrice pour h). 2 Remarque 13.7 Pour vérifier que φ est un C 1 -difféomorphisme, on applique ordinairement le théorème d’inversion locale : soit U un ouvert de Rd et φ : U → Rd . Soit V := φ(U ). Alors φ est un C 1 -difféomorphisme ssi i) φ est injective ; ii) φ est de classe C 1 ; iii) pour tout u ∈ U , Jφ (u) 6= 0. 0 −1 Sous ces conditions, V est un ouvert et pour tout x ∈ V , (φ−1 ) (x) = (φ0 ◦ φ−1 (x)) . Exemple 13.8 (coordonnées polaires) Par le théorème d’inversion locale, la fonction φ : ]0, ∞[×]0, 2π[ −→ R2 \ ([0, ∞[×{0}) (ρ, θ) 7−→ (ρ cos θ, ρ sin θ) est un C 1 -difféomorphisme, avec 0 φ (ρ, θ) = cos θ −ρ sin θ sin θ ρ cos θ et Jφ (ρ, θ) = ρ. Ainsi pour toute fonction borélienne f λ2 -intégrable, Z Z f (x, y) dx dy = f (x, y) dx dy R2 R2 \([0,∞[×{0}) Z Z = f ◦ φ(ρ, θ) Jφ (ρ, θ) dρ dθ = f ◦ φ(ρ, θ) ρ dρ dθ. ]0,∞[×]0,2π[ [0,∞[×[0,2π] −x2 R En particulier, l’intégrale I = R e dx peut se calculer comme suit, grâce à deux applications du théorème de Fubini–Tonelli : Z Z Z 2 2 −(x2 +y 2 ) −ρ2 I = e dx dy = e ρ dρ dθ = 2π e−ρ ρ dρ dθ = π, R2 d’où l’égalité bien connue I = √ [0,∞[×[0,2π] π. [0,∞[ CHAPITRE 13. MESURE IMAGE ET CHANGEMENT DE VARIABLE 95 La démonstration de la formule du changement de variable est plutôt technique. Nous renvoyons le lecteur à la démonstration par récurrence p.64 du cours de Jean Jacod, ou à la démonstration p.242 du livre de Marc Briane et Gilles Pagès. Nous donnons ci-après l’idée de cette dernière. On recouvre l’ouvert U par une réunion dénombrable d’hypercubes semi-ouverts (Ci ) deux à deux disjoints et de mesure de Lebesgue arbitrairement petite fixée. On note ui le centre de Ci . Comme φ est bijective, V = φ(U ) s’écrit à son tour comme réunion disjointe des φ(Ci ), donc pour toute fonction borélienne f positive, Z XZ X f dλ = f dλ ≈ f (φ(ui ))λ(φ(Ci )). V φ(Ci ) i i Mais localement, φ peut être approchée par son application linéaire tangente φ0 (ui ), aussi comme λ(φ(Ci )) est la mesure de Ci par la mesure image de λ par φ−1 , ayant φ−1 (x) ≈ Ax + b, avec A = (φ−1 )0 (et b = φ−1 (ui ) − Aui ), on a λ(φ(Ci )) ≈ | det A |−1 λ(Ci ) = | det φ0 (ui ) |λ(Ci ). Ainsi, Z f dλ ≈ X V f (φ(ui )) | Jφ (ui ) | λ(Ci ) i ≈ XZ i f ◦ φ(u) | Jφ (u) | dλ(u) Ci Z f ◦ φ | Jφ | dλ, = U ce qui achève cette esquisse de démonstration. Chapitre 14 Les espaces Lp Dans tout ce chapitre, on se place sur un espace mesuré (E, A , µ) et pour tout p ∈ R̄+ , on abrégera Lp (E, A , µ) en Lp (µ), voire en Lp . On désignera par (fn ) une suite de fonctions mesurables à valeurs dans R̄ muni de sa tribu borélienne. 14.1 14.1.1 Les espaces de Banach Lp Convergence dans Lp et convergence simple Rappelons que la topologie usuelle d’un espace vectoriel normé est la topologie relative à la distance d(f, g) = k f − g k. Ainsi on dira que la suite (fn ) converge dans Lp si a) pour tout n ∈ N, fn ∈ Lp et f ∈ Lp ; b) limn k f − fn kp = 0. On rappelle que la suite (fn ) converge simplement vers f si limn fn (x) = f (x) pour µ-presque tout x. Proposition 14.1 Soit p ∈ [1, +∞[. a) [convergence Lp -dominée] Si fn → f µ-p.p. et qu’il existe g ∈ Lp tel que | fn | ≤ g Lp pour tout entier n, alors fn → f . Lp b) i) Si fn → f , alors il existe une suite extraite de (fn ) qui converge vers f µ-p.p. L∞ b) ii) Si fn → f , alors fn → f uniformément en dehors d’un ensemble négligeable, donc fn → f µ-p.p. Remarque 14.2 Dans le cas de l’espace `p (pour p < ∞), une suite (de fonctions, P (n) aussi suites ici...) (u(n) ) converge vers la fonction u ∈ `p si k | uk |p < ∞, si P appelées p k | uk | < ∞ et si X (n) lim | uk − uk |p = 0. n k (n) Ceci implique en particulier que uk −→ uk lorsque n → ∞. En conclusion, dans l’espace `p (vrai aussi si p = +∞ par b)ii)), `p fn → f =⇒ fn → f 96 simplement (partout). CHAPITRE 14. LES ESPACES LP 97 Évidemment, on n’a pas la réciproque, comme on peut le voir sur le contre-exemple (n) u(n) = 1{n} . Alors la suite (u(n) ) converge simplement vers la fonction nulle car uk = 0 pour tout k > n. Néanmoins pour tout n, la fonction u(n) est à distance 1 de la fonction P (n) nulle : k u(n) −0 kp = ( k | uk |p )1/p = 1 pour tout p (même p = ∞), et donc ne converge pas vers la suite nulle dans `p . En effet, ici la plus petite fonction dominant la suite (u(n) ) est la fonction v constante à 1. Pour p < ∞, cette fonction n’est pas dans `p , donc on ne peut pas appliquer a). De plus, v ∈ `∞ , ce qui montre aussi que a) n’est pas vrai en général pour p = ∞. a) On applique le théorème de convergence dominée. En effet, | fn −f |p ≤ (| fn |+ p p | f |) ≤ 2p | g |p µ-p.p., et par hypothèse R | g | estpintégrable, donc comme | fn − f | → 0, µ-p.p., on a la convergence vers 0 de | fn − f | dµ. Dém. p b)i) On applique le lemme de Borel–Cantelli. Construisons une suite extraite (fϕ(n) ) par récurrence. Soit ϕ(0) = 0 et ϕ(n + 1) := min{k > ϕ(n) : k f − fk kp ≤ 2−(n+1) }, qui est toujours un nombre fini puisque k f − fn kp → 0. On a donc k f − fϕ(n) kp ≤ 2−n et pour tout ε > 0, µ(| f − fn | ≥ ε) = µ(| f − fn |p ≥ εp ) ≤ ε−p k f − fn kpp , par l’inégalité de Markov. Par conséquent, avec An (ε) := {| f − fϕ(n) | ≥ ε}, X X X ε−p 2−np < ∞, ε−p k f − fϕ(n) kpp ≤ µ(An (ε)) ≤ n n n et le lemme de Borel–Cantelli assure donc que µ(lim supn An (ε)) = 0. Définissons alors Bε := lim sup An (ε) et B := ∪ε>0 Bε . n Remarquons que B est bien mesurable puisque B = limk∈N? ↑ B1/k et que µ(B) ≤ P c k µ(B1/k ) = 0. Concluons en remarquant que pour tout x ∈ B, fϕ(n) (x) → f (x). En c c effet, pour tout ε, x ∈ Bε = lim inf n An (ε), donc il existe n0 tel que pour tout n ≥ n0 , x ∈ cAn (ε), c’est-à-dire | f − fϕ(n) |(x) < ε. b)ii) Dire que fn → f dans L∞ , c’est dire qu’il existe une partie mesurable Ω de complémentaire négligeable telle que supx∈Ω | fn − f |(x) → 0. En effet, par définition du supremum essentiel, pour tout entier n il existe une partie mesurable Ωn de complémentaire négligeable telle que | fn − f |(x) ≤ k fn − f k∞ . Si l’on définit Ω := ∩n Ωn , Ω est bien de complémentaire négligeable et sup | fn − f |(x) ≤ k fn − f k∞ → 0. x∈Ω La suite (fn ) converge donc uniformément vers f sur Ω, donc elle converge simplement sur Ω. 2 Corollaire 14.3 Soit p ∈ [1, +∞]. Si l’on a la convergence de la suite (fn ) vers f dans Lp et vers g µ-p.p. alors f et g sont égales µ-p.p. CHAPITRE 14. LES ESPACES LP 98 On sait qu’il existe une suite extraite (fϕ(n) ) qui converge µ-p.p. vers f . Or la suite (fn ) converge µ-p.p. vers g, donc la sous-suite (fϕ(n) ) également. Ainsi f = g µ-p.p. 2 Dém. 14.1.2 Complétude des espaces Lp Lemme normé. Si toute série de terme général (un ) telle P 14.4 Soit (H, k · k) un e.v. 1 que n k un k < ∞ est convergente , alors (H, k · k) est complet. Soit (xn ) une suite de Cauchy à valeurs dans (H, k · k). On définit alors par récurrence une injection croissante ϕ de N, par ϕ(0) = 0, et Dém. ϕ(n + 1) := min{k > ϕ(n) : ∀j, ` ≥ k, k xj − x` k ≤ 2−(n+1) }, qui est un nombre fini puisque (xn ) est de Cauchy. Soit alors un := xϕ(n+1) − xϕ(n) . Alors P xϕ(n) = x0 + n−1 k=0 uk et k un k = k xϕ(n+1) − xϕ(n) k ≤ 2−n , P P donc n k un k < ∞. Par hypothèse, la suite des sommes partielles ( nk=0 uk ) converge donc dans H, et par conséquent, la suite (xϕ(n) ) également. En conclusion, (xn ) est une suite de Cauchy dont une suite extraite converge, c’est donc une suite convergente. 2 Théorème 14.5 (de Riesz–Fisher) Pour tout p ∈ [1, +∞], Lp (µ) est un espace de Banach 2 . Nous allons montrer quePLp (µ) vérifie les hypothèses du lemme Pn précédent. Soit p (un ) une suite de L telle que n k un kp =: a < ∞ et soit fn := k=0 uk la n-ième somme partielle. Il nous suffit donc de montrer que la suite (fn ) converge dans Lp . Soit alors n X hn := | uk |. Dém. k=0 La suite (hn ) est une suite croissante, qui converge donc simplement vers la fonction positive h := limn ↑ hn . Montrons d’abord que h ∈ Lp avec k h kp ≤ a en différenciant suivant que p est fini ou infini. Si p = ∞, il existe une partie négligeable N de E telle que pour tout x ∈ cN , | un (x) | ≤ k un k∞ , et donc hn (x) ≤ n X k=0 | uk (x) | ≤ n X k uk k∞ ≤ a. k=0 Par conséquent pour tout x ∈ cN , h(x) = limn hn (x) ≤ a,Pet h ∈ L∞ avec k h k∞ ≤ a. Si p < ∞, l’inégalité triangulaire implique que k hn kp ≤ nk=0 k un kp ≤ a, donc par le 1. au sens où la suite des sommes partielles converge dans H muni de sa norme k · k 2. c’est-à-dire un espace vectoriel normé complet CHAPITRE 14. LES ESPACES LP 99 théorème de convergence monotone, Z Z p h dµ = lim hpn dµ = lim k hn kpp ≤ ap . E n n E Par conséquent, k h kp ≤ a ici encore. que pour tout x ∈ cN , h(x) = P Il existe donc une partie négligeable N de E telle c n | un (x) | < ∞. Autrement dit, pour tout x ∈ N , la série de terme général un (x) est absolument convergente (dans R) et est donc convergente. Autrement dit la suite (fn ) converge µ-p.p., vers une certaine fonction f . D’après l’inégalité triangulaire de R, | fn (x) | ≤ hn (x) ≤ h(x), donc | f | ≤ h µ-p.p., et par conséquent, k f kp ≤ k h kp ≤ a, ce qui s’écrit X X k uk kp ≤ k uk kp . k≥0 k≥0 0 Si l’on applique cette inégalité à la suite u = (un+k+1 )k , ayant f − fn = obtient X k f − fn kp ≤ k uk kp , P k u0k , on k≥n+1 qui tend vers 0 lorsque n → ∞, ce qui revient à dire que la suite (fn ) converge vers f dans Lp . 2 14.2 14.2.1 L’espace L2 et les espaces de Hilbert L’espace de Hilbert L2 (µ) Définition 14.6 (et proposition) Soit H un e.v. réel et h·, ·i : H × H −→ R (u, v) 7−→ hu, vi une forme bilinéaire symétrique positive, c’est-à-dire telle que i) positivité : hu, ui ≥ 0 pour tout u ∈ H ; ii) symétrie : hu, vi = hv, ui pour tous u, v ∈ H ; iii) bilinéarité : pour tout v ∈ H, l’application u 7→ hu, vi est linéaire. Si de plus on a l’implication [hu, ui = 0 ⇒ u = 0], alors on parle de forme bilinéaire symétrique strictement positive, ou définie positive, ou plus simplement de produit scap laire. Lorsque c’est le cas, on vérifie facilement que k u k := hu, ui définit une norme @ sur H, que l’on appelle alors espace préhilbertien. Si de plus H est complet, on dit que H est un espace de Hilbert. Théorème 14.7 L’application h·, ·i : L2 (µ) × L2 (µ) −→ R Z (f, g) 7−→ hf, gi := f g dµ E CHAPITRE 14. LES ESPACES LP 100 est un produit scalaire. D’après le théorème de Riesz–Fisher, l’espace L2 muni de ce produit scalaire est donc un espace de Hilbert. Remarque 14.8 L’inégalité de Cauchy-Schwarz des espaces préhilbertiens est ici l’inégalité de Hölder (avec p = q = 1/2), qui assure d’ailleurs que cette application est bien définie sur L2 : |hf, gi| ≤ k f k2 k g k2 . La démonstration du théorème est laissée au lecteur. @ Remarque 14.9 Dans le cas complexe, on parle de forme sesquilinéaire, et la propriété ii) doit être remplacée par ii’) hu, vi = hv, ui, ce qui oblige à définir hf, gi dans L2C (µ) par Z hf, gi = f g dµ. E 14.2.2 Théorème de projection Soit C une partie fermée et convexe 3 d’un espace de Hilbert (H, h, ·, i). Théorème 14.10 Pour tout x ∈ H, il existe un unique élément z de C, appelé projection orthogonale de x sur C, tel que k x − z k = inf k x − y k. y∈C Dém. Le théorème repose sur l’identité du parallélogramme : pour tous u, v ∈ H, k u + v k2 + k u − v k2 = 2k u k2 + 2k v k2 , qui est une conséquence immédiate de la bilinéarité du produit scalaire. @ Soit d := inf y∈C k x − y k la distance de x à C. Par définition de la borne inférieure, il existe une suite (yn ) de C telle que limn k x − yn k = d. Nous allons nous servir de l’identité du parallélogramme pour montrer qu’une telle suite est de Cauchy, en posant u = 21 (yn − x) et v = 12 (ym − x) pour m, n deux entiers quelconques. On obtient alors 1 1 1 1 k (yn + ym ) − x k2 + k yn − ym k2 = k yn − x k2 + k ym − x k2 . 2 4 2 2 Or C est convexe, donc 21 (yn + ym ) ∈ C et par conséquent k 12 (yn + ym ) − x k ≥ d. Ceci donne k yn − ym k2 ≤ 2k yn − x k2 + 2k ym − x k2 − 4d2 . Soit ε > 0. Comme limn k x − yn k2 = d2 , il existe un entier N tel que pour tout n ≥ N , 2 k x − yn k2 < d2 + ε4 . Grâce à l’inégalité obtenue précédemment, pour tous n, m ≥ N , k yn − ym k < ε, autrement dit la suite (yn ) est de Cauchy. Comme H est complet, cette 3. c’est-à-dire que pour tous x, y ∈ C et pour tout λ ∈ [0, 1], la ‘combinaison convexe’ λx + (1 − λ)y est toujours dans C, autrement dit C contient tous les segments joignant deux de ses éléments CHAPITRE 14. LES ESPACES LP 101 suite converge vers un certain z qui doit appartenir à C, puisque C est fermé. Ayant limn k x − yn k = d, par continuité de la norme, k x − z k = d. Il ne reste plus à montrer que z est unique. Soit z 0 ∈ C tel que k x − z 0 k = d. On définit une nouvelle suite (yn ) à valeurs dans C par yn = z si n est pair et yn = z 0 si n est impair. Alors k x − yn k = d, donc par le même raisonnement que précédemment (yn ) converge, ce qui implique que k z 0 − z k = 0, c’est-à-dire z 0 = z. 2 Proposition 14.11 Soit F est un sous-espace vectoriel fermé 4 de H. Alors pour tout x ∈ H, la projection orthogonale pF (x) de x sur F vérifie hx − pF (x), yi = 0 pour tout y ∈ F. Soient y ∈ F et t ∈ R. On note z = pF (x) comme dans le théorème de projection et u = x − z. Comme z + ty ∈ F et que z minimise la distance de x à F , Dém. k u k2 = k x − z k2 ≤ k x − (z + ty) k2 = k u − ty k2 = k u k2 − 2thu, yi + t2 k y k2 . Donc −2thu, yi + t2 k y k2 ≥ 0 pour tout réel t, ce qui implique que hu, yi = 0. 2 Corollaire 14.12 Si F est un sous-espace vectoriel fermé de H, alors H se décompose en somme directe suivant F ⊕ F ⊥ , où F ⊥ := {u ∈ H : ∀y ∈ F, hu, yi = 0}. Soit x ∈ H. En notant comme précédemment u = x − pF (x), on peut écrire x sous la forme d’une somme u + pF (x), où pF (x) ∈ F , et d’après la proposition précédente u ∈ F ⊥ . D’autre part F ∩ F ⊥ est bien réduit au singleton {0} car pour tout x ∈ F ∩ F ⊥ , hx, xi = 0, donc x = 0. 2 Dém. Remarque 14.13 Un développement très intéressant de cette section d’algèbre bilinéaire, que nous avons pourtant choisi de ne pas suivre, concerne les parties totales et les bases orthonormales de H. On dit qu’une partie K de H est totale si le sous-espace vectoriel fermé engendré par K, c’est-à-dire l’adhérence du sous-espace vectoriel engendré par K 5 est H tout entier. On appelle système orthonormal une partie de H dont tous les éléments sont de norme 1 et orthogonaux deux à deux ; on appelle base orthonormale un système orthonormal total. On peut démontrer que K est totale ssi K ⊥ = {0}. De plus, si Hu est l’espace vectoriel fermé engendré par un système P orthonormal dénombrable (un ), alors l’application qui à une suite (an ) de `2 associe n an un ∈ Hu est un isomorphisme d’espaces de Hilbert (préserve le produit scalaire). Enfin, si µ est une mesure σ-finie, alors l’espace de Hilbert L2 (µ) admet une base orthonormale dénombrable. 4. un sous-espace vectoriel est toujours convexe car une combinaison convexe est un cas particulier de combinaison linéaire ; un sous-espace vectoriel n’est forcément fermé que si H est de dimension finie 5. qui n’est lui-même que l’ensemble des combinaisons linéaires finies d’éléments de K CHAPITRE 14. LES ESPACES LP 14.2.3 102 Lemme de Riesz–Fisher Nous allons appliquer les résultats de la section précédente à l’espace de Hilbert H = L2 (E, A , µ). Définition 14.14 Soit H un K-espace vectoriel (K = R ou C). On rappelle qu’une forme linéaire sur H est une application linéaire Φ : H −→ K et que le dual topologique H 0 de H est l’espace vectoriel des formes linéaires continues sur H, muni de la norme usuelle des espaces vectoriels d’applications linéaires. Exemple 14.15 (très important) Soit g ∈ L2 (µ) et Φg l’application définie par Φg : L2 (µ) −→ R Z f 7−→ f g dµ. E Grâce à l’inégalité de Hölder, | Φg (f ) | ≤ k g k2 k f k2 , si bien que non seulement Φg est bien définie sur L2 (µ), mais également Φg est k g k2 -lipschitzienne, donc continue. La linéarité de l’intégrale assure aussi que Φg est linéaire, et ainsi Φg est un élément du dual topologique de L2 (µ). Le lemme de Riesz–Fisher établit la réciproque de cet exemple. On remarquera également que si Φg n’est pas nulle, c’est-à-dire si g n’est pas nulle, alors si l’on choisit f = g/k g k2 , on a Φg (f ) = k g k2 , et donc k Φg k = k g k2 . Théorème 14.16 (Lemme de Riesz–Fisher) Soit Φ : L2 (µ) −→ R une forme linéaire continue. Alors ∃!ϕ ∈ L2 (µ) tel que Z 2 pour tout f ∈ L (µ), Φ(f ) = f ϕ dµ. E Remarque 14.17 Le même énoncé est vrai dans C. Remarque 14.18 D’après le lemme de Riesz–Fisher, si l’on note H = L2 (µ), l’application I : H −→ H 0 g 7−→ Φg est un isomorphisme (et même une isométrie d’après l’exemple qui précède l’énoncé du lemme). Ainsi L2 (µ) est isomorphe (isométriquement) à son dual topologique. On parle de dualité L2 –L2 . Montrons d’abord l’unicité. Si ϕ1 et ϕ2 sont deux éléments de L2 (µ) tels que Φ(f ) = hf, ϕ1 i = hf, ϕ2 i, alors hf, ϕ1 − ϕ2 i = 0. Si l’on choisit f = ϕ1 − ϕ2 ∈ L2 (µ), on obtient k ϕ1 − ϕ2 k2 = 0, autrement dit ϕ1 = ϕ2 . Montrons à présent l’existence. Soit F := ker Φ. Comme Φ est continue, F = Φ−1 ({0}) est un fermé, c’est donc un sous-espace vectoriel fermé de L2 (µ). On sait donc d’après le dernier corollaire que L2 (µ) = F ⊕ F ⊥ . Dém. CHAPITRE 14. LES ESPACES LP 103 Premier cas : F ⊥ = {0}. Alors F = L2 (µ), ce qui signifie que Φ est la forme linéaire nulle et le choix de la fonction nulle pour ϕ convient. Deuxième cas : F ⊥ 6= {0}. Nous allons voir que F ⊥ est une droite vectorielle et que ϕ est un élément de cette droite. Soit g un élément non nul de F ⊥ et ϕ = cg, où Φ(g) c := ∈ R. k g k22 Comme g est non nul et que g ∈ F ⊥ , g 6∈ F et par conséquent Φ(g) 6= 0. Alors pour tout f ∈ L2 (µ), avec λ = Φ(f )/Φ(g) ∈ R, f − λg ∈ F , car Φ(f − λg) = Φ(f ) − λΦ(g) = 0. Par conséquent, puisque g ∈ F ⊥ , hf − λg, gi = 0, ce qui s’écrit λ= donc Φ(f ) = λΦ(g) = hf, gi , k g k22 hf, gi Φ(g) = chf, gi = hf, ϕi, k g k22 2 ce qui achève la démonstration. 14.3 Théorème de Radon–Nikodym Définition 14.19 Soient µ et ν deux mesures sur un espace mesurable (E, A ). On dit que ν est absolument continue par rapport à µ, et on note ν µ, si pour tout A ∈ A , µ(A) = 0 =⇒ ν(A) = 0. Exemple 14.20 (très important) Si f : (E, A ) → (R̄+ , B(R̄+ )) est mesurable, alors la mesure ν de densité f par rapport à µ, définie par Z ν(A) = 1A f dµ A∈A, E dν est absolument continue par rapport à µ. On note souvent f = dµ et on l’appelle dérivée de Radon–Nikodym, en référence au théorème qui établit la réciproque de cet exemple sous la condition que µ et ν sont toutes deux σ-finies. Voici en effet un contre-exemple avec la mesure de Lebesgue λ sur [0, 1] et m la mesure de comptage. On voit que λ m dλ car si m(A) = 0 alors A = ∅ et par conséquent λ(A) = 0. Pourtant dm n’existe pas, dλ comme nous allons le R montrer par l’absurde. Supposons que f = dm existe et notons D = {f 6= 0}. Alors [0,1] f dm = λ([0, 1]) = 1, et pour tout ε > 0, Z 1≥ f 1f ≥ε dm ≥ εm({f ≥ ε}), [0,1] ce qui implique que {f ≥ ε} est fini. En particulier D = ∪n≥1 {f ≥ 1/n} est dénombrable et donc λ(D) = 0. On a donc Z 1 = λ({f = 0}) = 1{f =0} f dm = 0, [0,1] ce qui est la contradiction annoncée. CHAPITRE 14. LES ESPACES LP 104 Théorème 14.21 (de Radon–Nikodym) Soient µ et ν deux mesures σ-finies sur (E, A ) telle que ν µ. Alors il existe une fonction mesurable f : (E, A ) → (R̄+ , B(R̄+ )), unique à un ensemble µ-négligeable près, telle que pour tout A ∈ A , Z ν(A) = 1A f dµ. E La démonstration se fait en 4 étapes : 1) µ et ν finies, ν ≤ µ ; 2) µ et ν finies ; 3) µ et ν σ-finies ; 4) unicité. Étape 1. On suppose ici que µ et ν sont finies et que ν ≤ µ, autrement dit pour tout A ∈ A , ν(A) ≤ µ(A). Il est équivalent de supposer (par le lemme fondamental d’approximation et Rle théorème R de convergence monotone) que pour toute fonction mesurable positive g, g dν ≤ g dµ. Remarquer que ceci implique l’absolue continuité ν µ. Soit alors la fonction Φ définie par Dém. Φ : L2 (µ) −→ R Z g dν g 7−→ E qui est bien définie car L2 (µ) ⊆ L1 (ν). En effet, comme ν ≤ µ, on a L2 (µ) ⊆ L2 (ν), et L2 (ν) ⊆ L1 (ν) puisque ν est finie. La fonction Φ est donc une forme linéaire sur L2 (µ). De plus, grâce à l’inégalité de Hölder, Z Z | Φ(g) | ≤ | g | dν = | g |.1 dν ≤ k g k2 k 1 k2 , E E p autrement dit Φ est ν(E)-lipschitzienne, et est donc continue. Nous pouvons donc appliquer le lemme de Riesz-Fisher à la forme linéaire continue Φ sur L2 (µ), et exhiber R un élément ϕ de L2 (µ) tel que pour tout g ∈ L2 (µ), Φ(g) = E gϕ dµ. Notons aussi que ϕ ∈ L1 (µ), car L2 (µ) ⊆ L1 (µ). De plus, puisque µ est finie, toute fonction indicatrice g = 1A est dans L2 (µ) et ainsi Z Z ν(A) = 1A dν = 1A ϕ dµ. E E Montrons que ϕ ∈ [0, 1] µ-p.p. Soit ε > 0. Z 0 ≤ ν({ϕ ≤ −ε}) = ϕ dµ ≤ −εµ({ϕ ≤ −ε}) ≤ 0, {ϕ≤ε} ce qui implique que µ({ϕ ≤ −ε}) = ν({ϕ ≤ −ε}) = 0. De même, comme ν ≤ µ, Z ν({ϕ ≥ 1 + ε}) = ϕ dµ ≥ (1 + ε)µ({ϕ ≥ 1 + ε}) ≥ (1 + ε)ν({ϕ ≥ 1 + ε}), {ϕ≥1+ε} ce qui implique que ν({ϕ ≥ 1 + ε}) = µ({ϕ ≥ 1 + ε}) = 0. Ainsi pour tout ε > 0, µ({ϕ 6∈ [−ε, 1 + ε]}) = 0. Comme {ϕ 6∈ [0, 1]} = ∪n≥1 {ϕ 6∈ [−1/n, 1 + 1/n]}, µ({ϕ 6∈ [0, 1]}) = 0. CHAPITRE 14. LES ESPACES LP 105 Conclusion : il existe ϕ ∈ L1 (µ) prenant ses valeurs dans [0, 1] µ-p.p. tel que pour tout R A ∈ A , ν(A) = A ϕ dµ. Étape 2. On traite ici le cas de deux mesures µ et ν finies telles que ν µ. On applique alors l’étape 1 au couple (ν, ν + µ), puisque µ + ν est une mesure finie qui vérifie ν ≤ µ + ν. Il existe donc ϕ ∈ L1 (µ + ν) prenant ses Rvaleurs dans R [0, 1] (µ + ν)-p.p., donc µ-p.p. et ν-p.p., telR que pour tout A ∈ A , ν(A) = ϕ dµ + ϕ dν. Ceci implique A A R que pour tout A ∈ A , A (1 − ϕ) dν = A ϕ dµ, puis par approximation et convergence monotone, que pour toute fonction g mesurable positive, Z Z (1 − ϕ)g dν = ϕg dµ. (14.1) E E Si N := {ϕ = 1}, alors avec g = 1N , Z Z (1 − ϕ)1N dν = 0 = ϕ1N dµ = µ(N ). E E Comme de plus ν µ, on a ν(N ) = 0. Donc pour tout A ∈ A , comme 1 − ϕ 6= 0 sur c N , on peut définir g = 1cA∩N /(1 − ϕ), et avec ce choix de g, on obtient alors Z Z Z 1A∩cN 1cN 1A∩cN c dν = ν(A ∩ N ) = ν(A) = ϕ dµ = ϕ dµ. (1 − ϕ) 1−ϕ 1−ϕ 1−ϕ E A E On définit alors la fonction µ-p.p. positive f par ϕ 1cN , 1−ϕ R ce qui assure que pour tout A ∈ A , ν(A) = A f dµ, où il suffit de prendre A = E pour voir que f ∈ L1 (µ). f := Étape 3. Extension au cas σ-fini. Il existe donc deux partitions de E dénombrables et A -mesurables (Fn ) et (Gn ) telles que µ(Fn ) < ∞ et ν(Gn ) < ∞. De ces deux partitions on peut tirer une partition de E dénombrable et A -mesurable (En ) telle que µ(En ) < ∞ et ν(En ) < ∞, par exemple en considérant toutes les intersections Fj ∩ Gk et en utilisant une bijection allant de N2 dans N. Pour n fixé, soient µn et νn les mesures traces de µ et ν respectivement, sur En . Alors µn et νn sont des mesures finies et puisque ν µ, νn µn , donc il existe une fonction positive fn ∈ L1 (µn ) telle que pour tout A ∈ A , Z Z νn (A) = fn dµn = fn 1En dµ. A A Soit maintenant f := n fn 1En . Alors pour tout A ∈ A , Z Z X XZ X X f dµ = fn 1En dµ = fn 1En dµ = νn (A) = ν(A ∩ En ) = ν(A). P A A n n A n n CHAPITRE 14. LES ESPACES LP 106 Étape 4. Montrons l’unicité de la dérivée de Radon–Nikodym. Supposons qu’il existe deux fonctions mesurables positives f et g telles que pour tout A ∈ A , Z Z ν(A) = f dµ = g dµ. A A Ainsi avec A = {f ≥ g + ε} ∩ En , où ε un nombre réel positif quelconque, Z Z ν(A) = f dµ = g dµ. A A R Comme ν(A ∩ En ) < ∞, A g dµ < ∞, et l’on peut donc retrancher ce terme à la dernière égalité, de manière à obtenir Z 0= (f − g) dµ ≥ εµ({f ≥ g + ε} ∩ En ). {f ≥g+ε}∩En Par conséquent, µ({f ≥ g + ε} ∩ En ) = 0, et en passant à la limite n → ∞, on obtient µ({f ≥ g + ε}) = 0, puis en passant à la limite ε → 0 (le long d’une suite dénombrable), on obtient µ({f > g}) = 0. Par symétrie, on obtient µ({f < g}) = 0, et en conclusion µ({f 6= g}) = 0. 2 14.4 Dualité Lp –Lq Le lemme de Riesz–Fisher montre que le dual topologique de L2 (µ) est isomorphe à L2 (µ), ce que l’on a appelé la dualité L2 –L2 . Nous allons énoncer ici une extension de cette propriété, qui est la dualité Lp –Lq , où p et q sont deux éléments conjugués de [1, +∞], c’est-à-dire tels que p1 + 1q = 1. Comme dans l’exemple 14.15, nous pouvons démontrer que pour tout g ∈ Lq (µ), l’application Φg : Lp (µ) −→ R Z f 7−→ f g dµ E est une forme linéaire continue, et que si g ≥ 0 µ-p.p., alors Φg est positive, au sens où si f ≥ 0 µ-p.p., alors Φg (f ) ≥ 0. Théorème 14.22 (dualité Lp –Lq ) Soit µ une mesure σ-finie sur un espace mesurable (E, A ) et p ∈ [1, +∞[. Soit Φ une forme linéaire continue sur Lp (µ). Alors ∃!ϕ ∈ Lq (µ) tel que Z pour tout f ∈ Lp (µ), Φ(f ) = f ϕ dµ. E Remarque 14.23 Le précédent théorème reste vrai lorsque µ n’est pas σ-finie pourvu que 1 < p < ∞. CHAPITRE 14. LES ESPACES LP 107 Nous allons seulement donner une esquisse de la démonstration, et uniquement dans le cas où l’on suppose que Φ est aussi positive (et alors ϕ ≥ 0 µ-p.p.). 1) Soit une partition dénombrable A -mesurable (En ) de E telle que µ(En ) < ∞ pour tout n. On définit alors l’application νn : A → R+ par Dém. νn (A) := Φ (1A∩En ) A∈A. Alors νn est une mesure (finie). D’abord, νn (∅) = Φ(0) = 0. Ensuite pour toute suite P (Ak ) d’éléments de A deux à deux disjoints, si l’on note fk := 1∪kj=0 Aj ∩En = kj=0 1Aj ∩En , alors (fk ) converge simplement vers f := 1A∩En , où A = ∪k Ak . De plus fk ≤ 1En ∈ Lp car k 1En kp = µ(En )1/p < ∞, donc par convergence Lp -dominée, la suite (fk ) tend vers f dans Lp . Par conséquent, comme Φ est continue, νn (∪k Ak ) = Φ lim fk = lim Φ(fk ) = lim k→∞ k→∞ k→∞ k X Φ(1Ak ∩En ) = j=0 X νn (Ak ). k 2) Appliquer le théorème de Radon–Nikodym à νn et µ. Comme Φ est linéaire et continue, elle est k Φ k-lipschitzienne, et donc pour tout A ∈ A tel que µ(A) = 0, νn (A) = Φ(1A∩En ) ≤ k Φ k . k 1A∩En kp = k Φ k µ(A ∩ En )1/p = 0. 1 Ainsi νn µ et il existe donc une application R mesurable positive ϕn ∈ L (µ) (car νn est finie) telle que pour tout A ∈ A , νn (A) = A ϕn dµ. De plus, quitte à remplacer ϕn par ϕn 1En , on peut P supposer que ϕn est nulle sur cEn . 3) Soit ϕ := n ϕn . Il s’agit ici de montrer que pour tout f ∈ Lp (µ), Z Φ(f ) = f ϕ dµ. E P Pour f ≥ 0 élément de Lp (µ), la suite ( nj=0 f 1Ej ) converge simplement vers f et est dominée par f ∈ Lp , donc par convergence Lp -dominée, converge vers f dans Lp , ainsi par continuité de Φ, ! ! n n Z n n X X X X Φ(f ) = Φ lim f 1Ej = lim Φ f 1Ej = lim Φ f 1Ej = lim f dνj . n j=0 n j=0 n j=0 n j=0 E Mais par le lemme fondamental Rd’approximation et le théorème de convergence moR notone, il est facile de voir que f dν = f ϕ j j dµ, de sorte que par convergence ER P RE monotone à nouveau, Φ(f ) = n E f ϕn dµ = E f ϕ dµ. L’extension aux fonctions de signe quelconque est classique. 4) Montrer que ϕ ∈ Lq (µ), en distinguant suivant que p > 1 ou p = 1. Dans la suite on suppose que ϕ ≥ 0 partout, quitte à remplacer ϕ par ϕ1ϕ>0 (car ϕ ≥ 0 µ-p.p.). Supposons d’abord que p > 1 (et ainsi q < ∞). Soit fm,n := ϕq−1 1Fn ∩{ϕ≤m} , CHAPITRE 14. LES ESPACES LP 108 où Fn = ∪nk=0 Ek est une suite croissante d’éléments de A convergeant vers E. Montrons que fm,n ∈ Lp (µ). En effet, Z Z p p(q−1) k fm,n kp = ϕ 1{ϕ≤m} dµ = ϕq 1{ϕ≤m} dµ, Fn Fn car p(q − 1) = q et donc k fm,n kpp ≤ mq µ(Fn ) < ∞. De plus, Z Φ(fm,n ) = ϕ 1{ϕ≤m} dµ ≤ k Φ k . k fm,n kp = k Φ k q Z Fn ϕ 1{ϕ≤m} dµ q 1/p . Fn Ceci implique que Z ϕ 1{ϕ≤m} dµ q 1/q ≤ k Φ k, Fn et ainsi par une double application du théorème de convergence monotone, que k ϕ kq ≤ k Φ k < ∞, ce qui assure que ϕ ∈ Lq (µ). Supposons maintenant que p = 1 (et donc q = ∞). Alors pour tout A ∈ A tel que µ(A) < ∞, Z ϕ dµ = Φ(1A ) ≤ k Φ k µ(A), A R donc A (ϕ − k Φ k) dµ ≤ 0 et ce pour A quelconque de mesure finie, donc ϕ ≤ k Φ k @ µ-p.p., ce qui assure que ϕ ∈ L∞ (µ). 5) Unicité de ϕ (à un ensemble négligeable près). Soient ϕ1 et ϕ2 telles que pour tout A∈A, Z Z ϕ2 1En dµ. ϕ1 1En dµ = Φ(1A∩En ) = A A Comme ces trois termes sont finis, avec A = {ϕ1 > ϕ2 } Z (ϕ1 − ϕ2 )1En dµ = 0, A ce qui implique que (ϕ1 − ϕ2 )1A∩En = 0 µ-p.p. et ainsi µ(A) = 0. On conclut par un argument de symétrie. 2 Chapitre 15 Régularité d’une mesure et théorèmes de densité 15.1 Régularité d’une mesure sur un espace métrique Soit µ une mesure sur un espace métrique E muni de sa tribu borélienne B(E). Définition 15.1 On dit que µ est a) extérieurement régulière si pour tout A ∈ B(E), µ(A) = inf{µ(O), O ouvert, O ⊇ A}; b) intérieurement régulière si pour tout A ∈ B(E), µ(A) = sup{µ(K), K compact, K ⊆ A}; c) régulière, si elle est à la fois extérieurement et intérieurement régulière. Proposition 15.2 Si µ est finie, alors elle est extérieurement régulière et pour tout A ∈ B(E), µ(A) = sup{µ(F ), F fermé, F ⊆ A}. Dém. Il suffit de montrer que pour tout A ∈ B(E), ∀ε > 0, il existe un ouvert O ⊇ A et un fermé F ⊆ A tels que µ(O \ F ) < ε. (15.1) Soit T := {A ∈ B(E) vérifiant (15.1)}. Montrons que T est une tribu contenant O(E), et par conséquent égale à B(E). Montrons que T contient bien les ouverts. Si A est ouvert, il suffit de prendre O = A. Pour F , définissons 1 Fn := {x ∈ A : d(x, cA) ≥ }. n c Comme la fonction x 7→ d(x, A) est continue, Fn est fermé. De plus cA est fermé donc pour tout x ∈ A, d(x, cA) 6= 0. En effet, d(x, cA) = 0 ssi x est dans l’adhérence de cA, qui 109 CHAPITRE 15. RÉGULARITÉ ET THÉORÈMES DE DENSITÉ 110 n’est autre que le complémentaire de l’intérieur de A, c’est-à-dire le complémentaire de A. Ainsi, A = limn ↑ Fn et donc µ(A \ Fn ) ↓ µ(∅) = 0 car µ est finie donc continue à droite. Montrons que T est une tribu. i) E ∈ T , car il suffit alors de prendre O = F = E. ii) Passage au complémentaire. Soit A ∈ T et ε > 0. Alors il existe F ⊆ A ⊆ O tels que µ(O \ F ) < ε, où O est ouvert et F fermé. Avec O0 = cF et F 0 = cO, O0 est ouvert, F 0 est fermé, et F 0 ⊆ A ⊆ O0 . De plus, O0 \ F 0 = O0 ∩ cF 0 = cF ∩ O = O \ F , donc µ(O \ F ) < ε. iii) Réunion dénombrable. Soit (An ) une suite d’éléments de T et ε > 0. Alors pour chaque entier n, il existe un ouvert On et un fermé Fn tels que Fn ⊆ An ⊆ On et µ(On \ Fn ) ≤ ε 2n+1 . Comme (∪k≤n Fk )n est une suite croissante de limite ∪n Fn , µ(∪k≤n Fk ) converge vers µ(∪n Fn ). Comme µ(∪n Fn ) < ∞, il existe un entier nε tel que ε µ(∪k≤nε Fk ) ≥ µ(∪n Fn ) − . 2 Soient maintenant l’ouvert O0 = ∪n On (réunion d’ouverts) et le fermé F 0 = ∪k≤nε Fk (réunion finie de fermés). On a alors F 0 = ∪k≤nε Fk ⊆ ∪n Fn ⊆ ∪n An ⊆ ∪n On = O0 , et de plus µ(O0 \ F 0 ) = µ (∪n On ) − µ (∪k≤nε Fk ) = µ (∪n On ) − µ (∪n Fn ) + µ (∪n Fn ) − µ (∪k≤nε Fk ) = µ (∪n On \ ∪k Fk ) + µ (∪n Fn ) − µ (∪k≤nε Fk ) ε ≤ µ ((∪n On ) ∩ (∩k cFk )) + 2 ε c = µ (∪n ∩k (On ∩ Fk )) + 2 ε c ≤ µ (∪n (On ∩ Fn ) + 2 X ε ε X ε + ≤ ε, ≤ µ (On \ Fn ) + ≤ n+1 2 2 2 n n ce qui achève la démonstration. 2 Théorème 15.3 Toute mesure de Borel sur un espace localement compact séparable est régulière. CHAPITRE 15. RÉGULARITÉ ET THÉORÈMES DE DENSITÉ 111 On utilise le fait qu’un tel espace est σ-compact, c’est-à-dire qu’il existe une suite croissante (En ) de compacts dont la limite ∪n En est égale à E. En fait, nous allons utiliser le résultat plus fort que E = ∪n E˚n , où l’on rappelle que E˚n désigne l’intérieur de En . Régularité intérieure. Soit ε > 0 et A ∈ B(E). Soit µn la mesure trace de µ sur En . Comme µn est finie, d’après la proposition précédente, il existe un fermé Fn ⊆ A tel que Dém. ε µ(A ∩ En ) ≤ µ(Fn ∩ En ) + . 2 Soit le compact Kn = Fn ∩En (intersection d’un fermé et d’un compact). Comme Fn ⊆ A, on a Kn ⊆ A et l’on réécrit l’équation précédente ε µ(A ∩ En ) ≤ µ(Kn ) + . 2 (15.2) Observons que limn µ(A ∩ En ) = µ(A). Si µ(A) = ∞, alors d’après (15.2) limn µ(Kn ) = +∞, autrement dit limn µ(Kn ) = µ(A). Si µ(A) < ∞, alors il existe un entier n tel que µ(A) ≤ µ(A ∩ En ) + ε ≤ µ(Kn ) + ε, 2 ce qui nous permet de conclure que µ est régulière intérieurement. Régularité extérieure. Soit ε > 0 et A ∈ B(E). Soit µn la mesure trace de µ sur E˚n . Comme µn est finie, d’après la proposition précédente, elle est régulière extérieurement. Ainsi il existe un ouvert On tel que On ⊇ A et ε µ(A ∩ E˚n ) ≥ µ(On ∩ E˚n ) − n . 2 (15.3) Montrons que O := ∪n (On ∩ E˚n ) vérifie µ(A) ≥ µ(O) − ε. Comme A ∩ E˚n ⊆ On ∩ E˚n , on a A = ∪n (A ∩ E˚n ) ⊆ O, ce qui donnera le résultat car O est ouvert (c’est une réunion d’ouverts). Soit Un := ∪k≤n (Ok ∩ E̊k ). Nous allons montrer par récurrence sur n ≥ 1 que X ε µ(Un ) ≤ µ(A ∩ E˚n ) + . 2k 1≤k≤n L’égalité est vraie pour n = 1 car elle se réduit à (15.3). En se servant de (15.3), µ (Un+1 ) = µ(Un ) + µ(On+1 ∩ E̊n+1 ) − µ(Un ∩ On+1 ∩ E̊n+1 ) X ε ε ≤ µ(A ∩ E˚n ) + + µ(A ∩ E̊n+1 ) + n+1 − µ(Un ∩ On+1 ∩ E̊n+1 ) k 2 2 k≤n X ε = µ(A ∩ E̊n+1 ) + + an , k 2 k≤n+1 où an := µ(A ∩ E˚n ) − µ(Un ∩ On+1 ∩ E̊n+1 ) ≤ 0, CHAPITRE 15. RÉGULARITÉ ET THÉORÈMES DE DENSITÉ 112 car A ∩ E˚n ⊆ Un ∩ On+1 ∩ E̊n+1 . En effet, d’une part A ⊆ On+1 et E˚n ⊆ E̊n+1 donc A ∩ E̊n ⊆ On+1 ∩ E̊n+1 ; d’autre part, A ⊆ On , donc A ∩ E˚n ⊆ On ∩ E˚n ⊆ Un . On a donc bien X ε µ (Un+1 ) ≤ µ(A ∩ E̊n+1 ) + . 2k k≤n+1 Ainsi, comme (Un ) est une suite croissante de limite O, on obtient l’inégalité souhaitée en passant à la limite en n. 2 15.2 Théorèmes de densité Proposition 15.4 Pour tout p ∈ [1, +∞[, l’ensemble des (représentants des) fonctions étagées intégrables est dense dans Lp (µ). Soit f ∈ Lp . Quitte à raisonner sur f + et f − , nous pouvons supposer que f est positive. Par le lemme fondamental d’approximation, il existe une suite croissante (ϕn ) de fonctions étagées positives convergeant simplement vers f . Il nous suffit alors de montrer que ϕn ∈ L1 (µ)∩Lp (µ) pour tout n et que la convergence a aussi lieu dans Lp (µ). Comme f ∈ Lp (µ) et que 0 ≤ ϕn ≤ f , on a bien ϕn ∈ Lp (µ). Mais une fonction étagée 1 positive ϕ de Lp (µ) est aussi R p élément P de L (µ), pen effet, pour tout y ∈ ϕ(E), si y 6= 0 alors µ(ϕ = y) < ∞ car ϕ dµ = y∈ϕ(E),y6=0 y µ(ϕ = y) < ∞. Mais comme ϕ(E) est R P fini, ϕ dµ = y∈ϕ(E) yµ(ϕ = y) < ∞. Enfin, f − ϕn est dominée par f ∈ Lp (µ), donc par convergence Lp -dominée, la suite (ϕn ) converge vers f dans Lp (µ). 2 Dém. Théorème 15.5 Soit µ une mesure de Borel sur Rd . Alors pour tout p ∈ [1, +∞[, ∞ l’espace vectoriel CK (Rd , R) des fonctions réelles à support compact indéfiniment différentiables est dense dans Lp (µ). ∞ est dense D’après la proposition précédente, il suffit de montrer que l’espace CK 1 dans Pn l’espace des fonctions étagées intégrables , c’est-à-dire les fonctions de la forme i=1 αi 1Ai où pour tout i, αi µ(Ai ) < ∞. Par linéarité, il suffit de montrer que pour tout A ∈ B(Rd ) de mesure finie, la fonction indicatrice de A est limite dans Lp (µ) d’une ∞ . suite d’éléments de CK Soit ε > 0. Comme µ est une mesure de Borel, elle est extérieurement régulière, donc A étant de mesure finie, il existe un ouvert O ⊇ A tel que µ(O\A) < (ε/3)p , autrement dit k 1O − 1A kp < ε/3. Comme O est la réunion (dénombrable) des pavés ouverts et bornés à extrémités rationnelles qu’il contient, et que µ(O) < ∞, par continuité à gauche de la mesure, il existe une famille finie (et disjointe) de pavés bornés et ouverts contenus dans O dont la réunion Ω est telle que µ(O \ Ω) < (ε/3)p , autrement dit k 1O − 1Ω kp < ε/3. Observons ici que pour tout intervalle ouvert ]a, b[, il est aisé de construire une @ (a,b) suite croissante (ψn ) de fonctions indéfiniment différentiables dominées par 1]a,b[ et Q convergeant simplement vers 1]a,b[ . Ainsi pour tout pavé ouvert R = di=1 ]ai , bi [, les Dém. 1. en effet, un résultat classique de topologie assure que si A est dense dans B et B est dense dans C, alors A est dense dans C CHAPITRE 15. RÉGULARITÉ ET THÉORÈMES DE DENSITÉ 113 Qd (ai ,bi ) fonctions ϕR sont dominées par 1R et convergent simplement vers 1R . À n := i=1 ψn présent, rappelons-nous que Ω est réunion finie et disjointe de pavés ouverts bornés, soit P R Ω = ∪j Rj . En définissant φn = j ϕn j , on obtient une suite de fonctions indéfiniment différentiables dominées par 1Ω et convergeant simplement vers 1Ω . Comme Ω est borné, ces fonctions sont à support compact, et comme µ(Ω) < ∞, par convergence Lp -dominée, la convergence a également lieu dans Lp . On peut donc trouver une fonction indéfiniment différentiable à support compact φ telle que k 1Ω − φ kp < ε/3. L’inégalité triangulaire nous permet de conclure que k 1A − φ kp < ε. 2 Chapitre 16 Produit de convolution 16.1 Convolution de mesures et de fonctions positives Nous allons définir une nouvelle opération sur les mesures, qui seront toujours supposées ici définies sur B(Rd ) et σ-finies. Définition 16.1 Soient µ et ν deux mesures σ-finies sur B(Rd ). On appelle produit de convolution, et l’on note µ ? ν, l’image de µ ⊗ ν par l’application (x, y) 7→ x + y. Remarque 16.2 Par le théorème de Fubini–Tonelli, pour tout borélien A, Z µ ? ν(A) = 1A (x + y) d(µ ⊗ ν)(x, y) Z Z Z Z = dµ(x) dν(y) 1A (x + y) = dν(y) dµ(x) 1A (x + y) Z Z = dµ(x) ν(A − x) = dν(y) µ(A − y). En particulier, µ ? ν(Rd ) = µ(Rd )ν(Rd ), et donc si µ et ν sont des probabilités alors µ ? ν en est également une. Proposition 16.3 le produit de convolution est commutatif, associatif et possède un élément neutre qui est δ0 . Remarque 16.4 Avant de convoler µ ? ν avec une troisième mesure, il faut tout d’abord vérifier que µ ? ν est elle-même σ-finie, car ce n’est pas on peut le R toujours le cas, comme R voir avec le contre-exemple λ ? λ. En effet λ ? λ(A) = dλ(x) λ(A − x) = dλ(x) λ(A) = λ(Rd )λ(A), qui vaut +∞ dès que A est de mesure de Lebesgue non nulle. La démonstration est immédiate grâce à la commutativité et à l’associativité de @ l’addition sur Rd et du produit ⊗ de mesures. 2 Dém. 114 CHAPITRE 16. PRODUIT DE CONVOLUTION 115 Proposition 16.5 Si ν admet une densité g par rapport à la mesure de Lebesgue, alors µ ? ν admet également une densité, (encore) notée µ ? g, où Z µ ? g(x) := dµ(y) g(x − y) x ∈ Rd . Par le théorème de Fubini–Tonelli, µ ? g est borélienne car l’application (x, y) 7→ g(x − y) est borélienne (voir chapitre sur les tribus produits). De plus, par la formule du changement de variable puis par Fubini–Tonelli, Z Z µ ? ν(A) = dµ(y) dν(x)1A (x + y) Z Z = dµ(y) dλ(x) g(x) 1A (x + y) Z Z = dµ(y) dλ(u) g(u − y) 1A (u) Z Z dλ(u)1A (u) dµ(y) g(u − y), = Dém. qui n’est autre que R dλ(u) 1A (u) µ ? g(u). 2 Corollaire 16.6 Si µ (resp. ν) admet une densité f (resp. g) par rapport à la mesure de Lebesgue, alors µ ? ν admet également une densité, (encore !) notée f ? g, où Z Z f ? g(x) := dλ(y) f (y) g(x − y) = dλ(y) g(y) f (x − y) x ∈ Rd . Proposition 16.7 Le produit de convolution f ? g défini pour tout couple (f, g) de fonctions boréliennes positives sur Rd est commutatif et associatif. De plus, f ?g est borélienne et positive, {f ? g 6= 0} ⊆ {f 6= 0} + {g 6= 0}, et Z Z Z f ? g dλ = f dλ . g dλ . Rd Exemple 16.8 La fonction f ? 1Rd est la fonction constante égale à R f dλ. La commutativité est déjà visible dans l’équation du dernier corollaire. En ce qui concerne l’associativité, si f , g et h sont trois fonctions boréliennes positives, alors Z (f ? g) ? h(x) = dz h(z) f ? g(x − z) Z Z = dz h(z) dy f (y) g(x − z − y) Z Z = dy f (y) dz h(z) g(x − z − y) Z = dy f (y) g ? h(x − y) Dém. CHAPITRE 16. PRODUIT DE CONVOLUTION 116 qui n’est autre que f ? (g ? h)(x). En désignant par µ la mesure de densité f par rapport à la mesure de Lebesgue, comme f ? g = µ ? g, la proposition précédente donne la mesurabilité de f ? g. Soit x ∈ Rd tel que x 6∈ {f 6= 0} + {g 6= 0}. Alors pour tout y ∈ Rd , g(y) = 0 ou f (x−y) = 0 (sans quoi y ∈ {g 6= 0} et x−y ∈ {f 6= 0}, et alors x = y +(x−y) appartient à la somme). Par conséquent g(y)f (x − y) = 0 pour tout y, si bien que f ? g(x) = 0. de densité g par à la mesure de Lebesgue, R En désignant pard ν la mesure R R rapport d d f ? g dλ = µ ? ν(R ) = µ(R )ν(R ) = f dλ . g dλ . 2 16.2 Convolution de fonctions boréliennes de signe quelconque Définition 16.9 Soient deux fonctions boréliennes f, g : Rd → R. Pour tout x ∈ Rd tel que | f | ? | g |(x) < ∞, on définit le nombre réel Z f ? g(x) := dλ(y) f (y) g(x − y), Rd que l’on appelle convolée, ou produit de convolution de f et g au point x. Proposition 16.10 Le produit de convolution des fonctions boréliennes jouit des propriétés suivantes : a) dès que l’un des deux nombres f ? g(x) ou g ? f (x) est bien défini, ils sont égaux, et | f ? g(x) | ≤ | f | ? | g |(x). b) Si pour tout x ∈ Rd , | f | ? | g |(x) < ∞, alors la fonction f ? g est borélienne. c) {f ? g 6= 0} ⊆ {f 6= 0} + {g 6= 0}. d) Si f1 = f2 λ-p.p. et g1 = g2 λ-p.p. alors pour tout x ∈ Rd , | f1 | ? | g1 |(x) = | f2 | ? | g2 |(x), et si ce nombre est fini, f1 ? g1 (x) = f2 ? g2 (x). Remarque 16.11 Le produit de convolution des fonctions boréliennes de signe quelconque n’est pas associatif en général. a) L’égalité s’obtient par un changement de variable affine et l’inégalité par croissance de l’intégrale. b) Par croissance de l’intégrale, toutes les fonctions f ± ? g ± sont bien définies et par linéarité f ? g = f + ? g+ − f + ? g− − f − ? g+ + f − ? g−, Dém. et tous les termes de cette somme sont des fonctions boréliennes (voir section précédente), d’où le résultat. c) Par l’inégalité | f ? g | ≤ | f | ? | g |, on a {| f ? g | = 6 0} ⊆ {| f | ? | g | = 6 0}, d’où {f ?g 6= 0} = {| f ?g | = 6 0} ⊆ {| f |?| g | = 6 0} ⊆ {| f | = 6 0}+{| g | = 6 0} ⊆ {f 6= 0}+{g 6= 0}. d) Pour tout x ∈ Rd , si l’on définit le borélien A(x) par @ CHAPITRE 16. PRODUIT DE CONVOLUTION 117 A(x) := {y ∈ Rd : f1 (x − y) g1 (y) 6= f2 (x − y) g2 (y)}, on a alors A(x) ⊆ {y ∈ Rd : f1 (x−y) 6= f2 (x−y)} ∪ {y ∈ Rd : g1 (y) 6= g2 (y)} = (x − {f1 6= f2 }) ∪ {g1 6= g2 }, si bien que λ(A(x)) ≤ λ ({f1 6= f2 }) + λ ({g1 6= g2 }) = 0. Par conséquent, Z | f1 | ? | g1 |(x) = | f1 (x − y) |.| g1 (y) | 1cA(x) (y) dy Z = | f2 (x − y) |.| g2 (y) | 1cA(x) (y) dy = | f2 | ? | g2 |(x). Si cette quantité est finie, on fait le même raisonnement avec f1 ? g1 et f2 ? g2 . 2 On souhaite à présent exhiber des conditions suffisantes d’existence partout ou λpresque partout de f ? g. Proposition 16.12 1) f ? g(x) existe pour tout x ∈ Rd si l’une des deux conditions suivantes est réalisée : a) f est localement intégrable 1 et g est essentiellement bornée et à support compact ; b) il existe p et q conjugués 2 tels que f ∈ L p (λ) et g ∈ L q (λ). 2) f ? g(x) existe pour λ-presque tout x ∈ Rd dès que f ∈ L 1 (λ) et g ∈ L p (λ) (pour p ∈ [1, +∞]). Dans ce cas, f ? g ∈ Lp (λ) et de plus k f ? g kp ≤ k f k1 k g kp . Dém. 1) Il nous faut montrer que dans les deux cas | f |?| g |(x) < ∞ pour tout x ∈ Rd . Cas a : Z | f (x − y) |.| g(y) | 1{| g |≤k g k∞ } 1{| g |6=0} dy Z ≤ k g k∞ | f (x − y) | 1{| g |6=0} dy Z = k g k∞ | f | dλ, | f | ? | g |(x) = x−{| g |6=0} qui est fini car x − {| g | = 6 0} est borné. Passons au cas b. Par l’inégalité de Hölder, Z 1/p Z 1/q p q | f | ? | g |(x) ≤ | f (x − y) | dy | g(y) | dy = k f kp k g kq . 2) Soit f ∈ L 1 (λ) et g ∈ L p (λ). Le cas où p = ∞ est un cas particulier de ce qui précède, aussi nous pouvons supposer que p < ∞. En notant µ la mesure de probabilité de R 1. autrement dit K | f | dλ < ∞ pour tout compact K de Rd 2. p, q ∈ [1, +∞] tels que p−1 + q −1 = 1 CHAPITRE 16. PRODUIT DE CONVOLUTION 118 densité | f |/k f k1 (le cas où k f k1 = 0 étant trivial) par rapport à la mesure de Lebesgue et en lui appliquant l’inégalité de Jensen avec l’application convexe R+ : x 7→ xp , Z p Z Z p (| f | ? | g |) (x) dx = dx | f (y) |.| g(x − y) | dy Z p p = k f k1 | g(x − y) | dµ(y) Z p ≤ k f k1 | g(x − y) |p dµ(y) Z Z p−1 = k f k1 dx dy | f (y) |.| g(x − y) |p Z Z p−1 = k f k1 dy | f (y) | dx | g(x − y) |p = k f kp1 k g kpp , ce qui donne l’inégalité k | f |?| g | kp ≤ k f k1 k g kp . Ainsi | f |?| g |(x) < ∞ pour λ-presque tout x, donc f ? g(x) est défini pour λ-presque tout x et k f ? g kp ≤ k | f | ? | g | kp ≤ k f k1 k g kp . 2 Chapitre 17 Transformée de Fourier 17.1 Définition et premières propriétés Définition 17.1 a) Soit µ une mesure finie sur Bor(Rd ). On définit la transformée de Fourier de µ, et l’on note µ̂, la fonction µ̂ : Rd → C définie par Z µ̂(u) = e−ihu,xi dµ(x) u ∈ Rd , Rd où l’on rappelle que h·, ·i désigne le produit scalaire canonique de Rd . b) Soit f : Rd → C un élément de L1C (λ). On définit également la transformée de Fourier de f , et l’on note (encore) fˆ, la fonction fˆ : Rd → C définie par Z fˆ(u) = e−ihu,xi f (x) dλ(x) u ∈ Rd . Rd Remarque 17.2 Si f est positive, alors en désignant par µ la mesure de densité f par rapport λ, on a par définition fˆ = µ̂. Proposition 17.3 a) La transformée de Fourier d’une mesure finie ou d’une fonction intégrable est toujours continue. b) Les applications µ 7→ µ̂ et f 7→ fˆ sont linéaires, et pour tout u ∈ Rd , Z d ˆ | µ̂(u) | ≤ µ(R ), | f (u) | ≤ | f | dλ. c) La transformée de Fourier est un morphisme de groupes pour le produit de convolution, au sens où µ[ ? ν = µ̂ν̂, µ[ ? f = µ̂fˆ, f[ ? g = fˆĝ. a) En notant g(u, x) = e−ihu,xi f (x), on voit que pour tout x l’application u 7→ g(u, x) est continue et dominée par | f (x) | qui par hypothèse est λ-intégrable en x, donc R ˆ l’application f : u 7→ g(u, x) dλ(x) est continue (et la démonstration est bien sûr la même pour µ̂). Dém. 119 CHAPITRE 17. TRANSFORMÉE DE FOURIER 120 b) évident. c) Calculons la transformée de Fourier de µ ? ν : Z Z Z −ihu,xi µ[ ?ν = e d(µ ? ν)(x) = e−ihu,x+yi dµ(x) dν(y) Z Z −ihu,xi = e dµ(x) e−ihu,yi dν(y) @ par le théorème de Fubini–Lebesgue, et cette dernière expression n’est autre que µ̂(u) ν̂(u) (la démonstration est bien sûr la même pour µ ? f et f ? g). 2 Remarque 17.4 Soit f ; Rd → C une fonction λ-intégrable. On pourra montrer en exercice les égalités suivantes. @ ˆ – Si g est définie par g(x) = f (−x) alors ĝ(u) = f (−u) ; – si g est définie par g(x) = f¯(x) (complexe conjugué), alors ĝ(u) = fˆ(−u) ; – si g est définie par g(x) = f (x/a) (où a est un réel non nul quelconque), alors ĝ(u) = ad fˆ(au). 17.2 Injectivité de la transformée de Fourier Nous allons à présent montrer que la transformée de Fourier d’une mesure finie la caractérise, en nous servant de la fonction g : Rd → R définie par k x k2 −d/2 g(x) := (2π) exp − , 2 où k · k désigne la norme euclidienne usuelle de Rd . Lemme 17.5 La fonction positive g est une densité 1 de probabilité sur Rd et k u k2 ĝ(u) = exp − . 2 √ R 2 On sait que R e−x /2 dx = 2π. Par Fubini–Tonelli, en notant xi la i-ème composante de x ∈ Rd , on a d Z Z Z P −d/2 − 21 di=1 x2i −1/2 −x2 /2 e dλ1 (x) = 1d = 1. g dλ = (2π) e dλd (x) = (2π) Dém. Rd 1. sous-entendu : par rapport à la mesure de Lebesgue R CHAPITRE 17. TRANSFORMÉE DE FOURIER 121 Calculons à présent la transformée de Fourier de g : Z 1 −d/2 ĝ(u) = (2π) dλd (x) e−ihu,xi e− 2 hx,xi d ZR 1 1 = (2π)−d/2 dλd (x) e− 2 hx+iu,x+iui e− 2 hu,ui Rd Z 1 Pd 2 −d/2 − 21 k u k2 = (2π) e dλd (x) e− 2 j=1 (x+iuj ) Rd − 12 k u k2 = e d Y −1/2 Z 1 2 dλ1 (x) e− 2 (xj +iuj ) , (2π) R j=1 par Fubini–Lebesgue. Il suffit donc de montrer que pour tout u ∈ R, Z 1 2 −1/2 dλ1 (x) e− 2 (x+iu) = 1. (2π) R Soit Z F (u) := 1 2 dλ1 (x) e− 2 (x+iu) u ∈ R. R 1 2 Soit R > 0. Comme l’application u 7→ e− 2 (x+iu) est dérivable sur [−R, R] et que sa 1 1 2 2 dérivée −i(x + iu) e− 2 (x+iu) est dominée sur [−R, R] par CR (| x | + R) e− 2 x (où CR est une constante qui dépend seulement de R), qui est intégrable en x sur R, F est dérivable sur [−R, R] et sa dérivée vaut Z 1 2 0 F (u) = −i dλ1 (x) (x + iu) e− 2 (x+iu) . R En décomposant l’intégrand suivant sa partie réelle et sa partie imaginaire, il n’est pas difficile de montrer que cette intégrale est nulle. Ainsi, comme R est arbitraire, F est√ déri- @ vable en tout point de R et de dérivée nulle, donc est constante sur R égale à F (0) = 2π, ce qui achève la démonstration. 2 Pour tout σ > 0, définissons à présent x √ −d k x k2 gσ (x) := σ −d g = σ 2π e− 2σ2 . σ On sait alors que σ 2 k u k2 ĝσ (u) = σ −d σ d ĝ(σu) = e− 2 . Lemme 17.6 Soit µ une mesure finie sur Bor(Rd ). a) On a l’égalité Z σ2 2 −d gσ ? µ(x) = (2π) dλ(u) µ̂(u) eihu,xi− 2 k u k . Rd d b) Pour toute fonction h : R → R continue bornée, Z Z h dµ = lim gσ ? µ(x) h(x) dλ(x). Rd σ↓0 Rd CHAPITRE 17. TRANSFORMÉE DE FOURIER Dém. 122 a) Calculons gσ ? µ(x) : Z gσ ? µ(x) = gσ (x − y) dµ(y) √ −d Z k x−y k2 = σ 2π e− 2 dµ(y) √ −d Z = σ 2π dµ(y)ĝ 1 (y − x) σ Z √ −d Z = σ 2π dµ(y) dλ(z) g 1 (z) e−ihy−x,zi . σ Par le théorème de Fubini-Lebesgue (µ est finie), Z √ −d Z gσ ? µ(x) = σ 2π dλ(u) g 1 (u) dµ(y) e−ihy−x,ui σ √ −d Z = σ 2π dλ(u) eihx,ui g 1 (u) µ̂(u) σ √ !−d Z √ −d σ 2 k u k2 2π = σ 2π e− 2 µ̂(u) dλ(u) eihx,ui σ Z 2 2 σ kuk = (2π)−d dλ(u) eihu,xi− 2 µ̂(u). b) Soit Z Iσ := d ZR = gσ ? µ(x) h(x) dλ(x) Z dλ(x) h(x) dµ(y) gσ (x − y), Rd Rd double intégrale à laquelle nous allons appliquer le théorème de Fubini–Lebesgue. En effet, comme h est bornée (par une certaine constante C) Z Z Z Z dλ(x) gσ (x−y) = C µ(Rd ) < ∞, dµ(y) dµ(y) dλ(x) | h(x) |.| gσ (x−y) | ≤ C Rd Rd Rd Rd en faisant le changement de variable u = (x − y)/σ, car on se souvient que g est une densité de probabilité. Nous en déduisons donc, grâce au même changement de variable, Z Z Iσ = dµ(y) dλ(x) h(x) gσ (x − y) d d ZR ZR = dµ(y) dλ(u) σ d h(y + σu) gσ (σu) d d ZR ZR = dµ(y) dλ(u) h(y + σu) g(u). Rd Rd CHAPITRE 17. TRANSFORMÉE DE FOURIER 123 R R Comme la fonction y 7→ Rd dλ(u) h(y + σu) g(u) est dominée par C g dλ = C, et que les fonctions constantes sont µ-intégrables, le théorème de convergence dominée nous permet de conclure Z Z lim Iσ = dµ(y) lim dλ(u) h(y + σu) g(u). σ↓0 Rd σ↓0 Rd Il suffit alors de voir que la limite dans l’intégrale est égale à h(y), par une autre application du théorème de convergence dominée. En effet, l’interversion de la limite et de l’intégrale est permise car l’intégrand est dominé par Cg qui est λ-intégrable. Enfin, par continuité de h, limσ↓0 h(y +σx) = h(y) et g est une densité de probabilité, ce qui permet de voir que Z lim dλ(u) h(y + σu) g(u) = h(y). σ↓0 Rd 2 Lemme 17.7 Soit (E, A , µ) un espace mesuré quelconque. Soient f, g : (E, A ) → (R, B(R)) deux fonctions mesurables. R R a) Si f et g sont µ-intégrables et que A f dµ = A g dµ pour tout A ∈ C , où C est un π-système engendrant 2 A , alors f = g µ-p.p. b) Si C est seulement stable par intersections finies, mais qu’ilR existe une suite croissante (En ) d’éléments de A et convergeant vers E, telle que En f dµ < ∞ et R R R g dµ < ∞ pour tout n, et que A∩En f dµ = A∩En g dµ pour tout A ∈ C , alors f = g En µ-p.p. a) On définit les mesures µ+ , µ− , ν + et ν − comme les mesures de densités respectives f + , f − , g + et g − par rapport à µ. Comme f et g sont µ-intégrables, ces quatre mesures sont finies et par hypothèse, pour tout A ∈ C , µ+ (A)−µ− (A) = ν + (A)−ν − (A), ce que nous pouvons également écrire Dém. µ+ (A) + ν − (A) = ν + (A) + µ− (A). En d’autres termes les mesures µ+ +ν − et ν + +µ− coïncident sur un π-système engendrant A , donc coïncident sur A . L’égalité précédente est donc toujours satisfaite pour A ∈ A et comme les quatres termes sont finis, on peut écrire µ+ (A) − µ− (A) = ν + (A) − ν − (A), autrement dit Z Z f dµ = g dµ A∈A. A A Il est ensuite classique de voir pourquoi ceci implique que f = g µ-p.p., en prenant A = {f > g} puis en raisonnant par symétrie sur f et g. b) Il suffit d’appliquer la méthode précédente aux mesures traces de µ et ν sur En et au π-système C ∪ {E}. On obtient alors que pour tout n f 1En = g 1En µ-p.p., ce qui implique l’égalité µ-p.p. entre f et g. 2 2. au sens où σ(C ) = A CHAPITRE 17. TRANSFORMÉE DE FOURIER 124 Théorème 17.8 (injectivité de la transformée de Fourier) a) Si µ et ν sont deux mesures finies sur B(Rd ) telles que µ̂ = ν̂, alors µ = ν. b) Si f et g sont deux fonctions complexes λ-intégrables sur Rd telles que fˆ = ĝ, alors f = g λ-p.p. a) D’après le Lemme 17.6 a), si µ̂ = ν̂, alors pour tout σ > 0, gσ ? µ = gσ ? ν, ce qui implique, d’après le Lemme 17.6 b), que pour toute fonction h continue bornée, R R h dµ = h dν. Ceci implique que µ = ν. En effet, si C est la classe des pavés de Q la forme A = dj=1 ] − ∞, aj [ (où aj peut éventuellement être égal à +∞), alors il est facile de construire une sute (hn ) de fonctions continues, toutes R bornées par 1Rd , telles que R limn→∞ R hn = 1A . Alors par convergence dominée, limn hn dµ = µ(A), et comme hn dµ = hn dν, on a l’égalité µ(A) = ν(A). Comme C est un π-système engendrant B(Rd ), µ et ν coïncident sur B(Rd ). b) On pourrait montrer une version du lemme 17.6 où l’on a remplacé µ par f.λ, où @ ˆ f ∈ LC1 (λ) (d’abord pour f ≥ 0, puis par R linéarité...). R Donc si f = ĝ, par les mêmes arguments que a), on peut montrer que A f dλ = A g dλ pour tout A ∈ C , ce qui prouve, grâce au lemme 17.7 a) appliqué aux parties réelles et imaginaires de f et g, que f = g λ-p.p. 2 Dém. Remarque 17.9 En fait, grâce au Lemme 17.6, on a montré que pour toute fonction h continue bornée, Z Z Z σ2 2 −d h dµ = lim(2π) dλ(x) h(x) dλ(u) µ̂(u) eihu,xi− 2 k u k , σ↓0 ce qui constitue une formule d’inversion pour les mesures finies, comme le précise le théorème qui suit. Théorème 17.10 a) Si µ est une mesure finie dont la transformée de Fourier µ̂ est λ-intégrable, alors elle admet une densité continue et bornée g par rapport à λ donnée par Z g(x) = (2π)−d eihu,xi µ̂(u) dλ(u) x ∈ Rd . Rd b) Si f ∈ LC1 (λ) est telle que fˆ ∈ LC1 (λ), alors pour λ-presque tout x, Z −d f (x) = (2π) eihu,xi µ̂(u) dλ(u). Rd Remarque 17.11 On ne peut bien sûr pas espérer s’affranchir de l’égalité presque partout dans b), puisque le membre de droite est une fonction continue et bornée, ce qui n’est pas forcément le cas de f . CHAPITRE 17. TRANSFORMÉE DE FOURIER 125 a) Soit g définie comme dans l’énoncé du théorème. Comme µ̂ est intégrable, g est bornée. De la remarque qui précède l’énoncé, pour toute fonction h continue bornée, Z Z Z σ2 2 −d h dµ = lim(2π) dλ(x) h(x) dλ(u) µ̂(u) eihu,xi− 2 k u k . Dém. σ↓0 Si h est à support compact, on deux fois le théorème de convergence R peut appliquer R dominée pour obtenir l’égalité h dµ = hg dλ. En effet, tout d’abord, la fonction x 7→ R σ2 2 h(x) dλ(u) µ̂(u) eihu,xi− 2 k u k est dominée en module par C | h |, qui est λ-intégrable (car µ̂ est supposée intégrable et h à support compact), donc Z Z Z σ2 2 −d h dµ = (2π) dλ(x) h(x) lim dλ(u) µ̂(u) eihu,xi− 2 k u k . σ↓0 2 ihu,xi− σ2 k u k2 est dominée en module par | µ̂ |, qui est Ensuite, la fonction u 7→ µ̂(u) e intégrable par hypothèse, donc Z σ2 2 lim µ̂(u) eihu,xi− 2 k u k = g(x). σ↓0 Par Qd la même méthode que précédemment, avec C la familleR des pavés de la forme j=1 ]aj , bj ], où les aj et bj sont finis, on obtient l’égalité µ(A) = A g dλ pour tout A ∈ C . Comme C est stable par intersections finies, et que la suite des pavés ]−n, n]d est une suite d’éléments de C qui converge vers Rd , on applique le lemme R 17.7 b) R à la fonctionR nulle et à la partie imaginaire de g, pour voir que l’égalité µ(A) = g dλ = <(g) dλ+i A =(g) dλ A R pour tout A ∈ C , implique que A =(g) dλ = 0 et donc que =(g) = 0 λ-p.p. (on vérifie que =(g) est localement intégrable car elle est bornée). Donc g est réelle λ-p.p., mais comme g est continue, g est réelle partout. Soient alors Z Z + + − ν (A) := g dλ , ν (A) := g − dλ. A A Comme g est bornée, ν et ν sont finies sur C , et pour tout A ∈ C , µ(A) = ν + (A) − ν − (A), ce qui implique que µ + ν − et ν + coïncident sur C , Ret donc sur B(Rd ). Or pour tout N ∈ B(Rd ) de λ-mesure nulle, ν + (N ) = N g + dλ = 0 et de la même manière ν − (N ) = 0. L’égalité µ + ν − = ν + implique alors que µ(N ) = 0, c’est-à-dire que µ est absolument continue par rapport à la mesure de Lebesgue. Comme µ et λ sont σ-finies, le théorème de Radon–Nikodym assure qu’il existe une fonction positive R d pour tout A ∈ B(R ), µ(A) = ϕ ∈ L 1R(λ) telle que ϕ dλ. Et si A ∈ C , ceci peut A R s’écrire A g dλ = A ϕ dλ, car g est bornée. Donc d’après le lemme 17.7 b), ϕ = g λ-p.p., et en particulier g est positive λ-p.p., mais comme g est continue, g est en fait positive partout. Enfin, l’égalité ϕ = g λ-p.p. implique que g ∈ L 1 (λ), puis que Z Z µ(A) = ϕ dλ = g dλ A ∈ B(Rd ). + − A A b) Si f ≥ 0, on applique a) à la mesure µ de densité f par rapport à λ (car alors µ̂ = fˆ). On peut alors conclure que µ admet une densité g par rapport à λ (où g est donnée par la formule d’inversion), ce qui implique que f = g λ-p.p. Le cas général se traite en décomposant f suivant f = <(f )+ − <(f )− + i=(f )+ − i=(f )− . 2 CHAPITRE 17. TRANSFORMÉE DE FOURIER 126 Remarque 17.12 On pourra lire avec avantage les trois dernières pages du polycopié de Jean Jacod concernant la transformée de Fourier dans L2 .