Autour du Théorème des Valeurs Intermédiaires - Jean
Transcription
Autour du Théorème des Valeurs Intermédiaires - Jean
Autour du Théorème des Valeurs Intermédiaires : théorème de Darboux, exemple de Lebesgue, méthodes de théorie des ensembles Jean-François Burnol, octobre 2008 Les fonctions continues possèdent la propriété des valeurs intermédiaires. Les fonctions qui sont des dérivées aussi, c’est le Théorème de Darboux. Preuve : on suppose f dérivable sur [a, b]. On veut montrer que f ′ prend sur ]a, b[ toutes les valeurs intermédiaires entre f ′ (a) et f ′ (b). Si f ′ (a) = f ′ (b) il n’y a rien à faire, quitte à remplacer f par −f supposons f ′ (a) > f ′ (b). Soit λ ∈ ]f ′ (b), f ′ (a)[. En remplaçant f par x 7→ f (x) − λx, on se ramène à f ′ (a) > 0 > f ′ (b) et il s’agit de montrer qu’il existe un c avec f ′ (c) = 0. Comme f ′ (a) > 0, f (a) est strictement inférieur aux f (x) pour x > a proche de a, donc a n’est pas un maximum local et encore moins global de f sur [a, b]. De même f (x) > f (b) pour x < b et proche de b donc b n’est pas non plus un point où f atteint un maximum local. Comme f est dérivable, elle est continue, et donc il existe un point c de [a, b] tel que f (c) est maximal. Par ce qui précède ce c est intérieur. Donc (argument du lemme de Rolle) f ′ (c) = 0. Ce qu’il fallait démontrer. Lebesgue a donné une construction d’une fonction f : [0, 1] → [0, 1] qui vérifie f ([a, b]) = [0, 1] pour tout 0 ≤ a < b ≤ 1. Cette fonction a donc la propriété des valeurs intermédiaires mais elle est extrêmement non continue, puisqu’en tout point, ses valeurs limites remplissent tout [0, 1]. Si l’on voulait on pourrait composer avec n’importe quelle surjection de [0, 1] sur R pour avoir f (I) = R pour tout ouvert non vide I. La construction n’utilise que la notion d’écriture décimale. En voici une variante : On pose f (1) = 0 et, pour 0 ≤ x < 1 écrit sous forme décimale : x = 0, x1 x2 x3 x4 . . . , on pose f (x) = 0, x2j+2 x2j+4 x2j+6 . . . avec j le plus petit tel que 0 = x2j+1 = x2j+3 = x2j+5 = . . . Si un tel j n’existe pas (ce qui est le cas avec probabilité 1 !) on pose simplement f (x) = 0 (la fonction f est donc presque partout nulle !). On notera que l’on peut avoir x2n = 9 pour tous les n grands et donc 0, x2j+2 x2j+4 x2j+6 . . . peut ne pas être l’écriture décimale canonique de f (x), mais néanmoins cela a toujours un sens. Par exemple f (0,0909090909 . . .) = 0,99999 · · · = 1, tandis que l’écriture canonique de 1 est 1,0000 . . . . 1 Montrons que ce f marche. Si 0 ≤ a < b ≤ 1 on prend N suffisamment grand de sorte qu’il existe un entier A avec 102N a ≤ A < A + 1 ≤ 102N b. Écrivons : 10−2N A = 0, a1 a2 . . . a2N Considérons les nombres réels de la forme : x = 0, a1 a2 . . . a2N 1 x0 0 x1 0 x2 0 x3 0 x4 . . . avec des chiffres x0 , x1 , x2 , . . ., arbitraires. Tous ces x sont dans ]a, b[ (car A < 102N x < A + 1). De plus pour un tel x on a par définition : f (x) = 0, x1 x2 x3 x4 . . . et donc toutes les valeurs possibles dans [0, 1] sont prises. On aurait pu utiliser l’écriture en base 2, ce qui aurait été un peu plus élégant. Donnons une construction moins concrète, mais qui est facile lorsque l’on dispose de quelques notions de théorie des ensembles. Comment voit-on que [0, 1[ et R sont équipotents ? Il est clair que ]0, 1[ et R sont en bijection, par exemple via x 7→ tg(πx − π2 ). Il suffit donc de trouver une bijection f : [0, 1[→]0, 1[. La définition suivante conviendra : f (0) = 21 , f ( 12 ) = 41 , f ( 14 ) = 18 , etc. . .et pour les autres f (x) = x. Un raisonnement semblable montre plus généralement que pour tout ensemble infini A, si B est l’union disjointe de A et d’un ensemble {∗} à un élément, alors il y a une bijection f de B sur A. En effet il suffit de prendre dans l’ensemble infini A une partie identifiée à N, et de poser f (∗) = 0, f (0) = 1, . . ., f (n) = n + 1, . . ., et finalement f (a) = a pour les autres. Par récurrence (ou construction directe du même type) l’union disjointe d’un ensemble infini A et d’un ensemble fini est équipotente à A. Par exemple il existe une bijection de [0, 1] sur ]0, 1[. J’en viens maintenant à l’existence plus subtile d’une bijection de A×N sur A lorsque A est infini. Si A est infini dénombrable, il s’agit donc d’affirmer la dénombrabilité de N × N, chose bien connue (par exemple en injectant N × N dans N par (a, b) 7→ 2a 3b , puis en énumérant dans l’ordre x0 < x1 < x2 < . . . les entiers ainsi obtenus). Dans le cas général on est amené à considérer les couples (X, f ) avec X ⊂ A et f : X × N → X bijective (notons qu’un tel X est sûrement infini). Il existe au moins un tel couple, puisque A est infini, donc contient un sous-ensemble équipotent à N. Un ordre partiel peut être défini via (X, f ) ≤ (Y, g) si X ⊂ Y et si g prolonge f . Lorsque l’on a une chaîne quelconque de tels couples (Xα , fα ) on peut prendre l’union X des Xα et définir f : X × N → X de sorte qu’elle prolonge les fα . Ce f est bijective. Donc toute chaîne possède une borne supérieure, et par le Lemme de Zorn (qui est « équivalent » à l’Axiome du Choix), il existe parmi tous ces couples un élément maximal (X, f ). Supposons que A \ X soit infini. Alors 2 il existe Z dénombrable disjoint de X. En utilisant une bijection Z × N → Z on peut alors prolonger f : X × N → X en une F bijective de (X ∪ Z) × N vers X ∪ Z. Ce qui contredit la maximalité de (X, f ). Donc A \ X est fini. Comme X est infini, on sait qu’il existe une bijection φ : A → X. On pose g(a, n) = φ−1 (f (φ(a), n)) ce qui donne une bijection g : A × N → A. 1 Considérons maintenant l’intervalle I = [0, 1[, que l’on peut voir comme R/Z de sorte qu’il est muni d’une addition (et d’une soustraction). On définit une relation d’équivalence par x ∼ y ⇐⇒ x − y ∈ Q ∩ [0, 1[ . Par l’axiome du choix on peut choisir un représentant dans chaque classe d’équivalence, soit donc A ⊂ [0, 1[ l’ensemble de ces représentants. Soit q0 , q1 , . . . une énumération de l’ensemble dénombrable Q ∩ [0, 1[. L’application : A × N → [0, 1[ (a, n) 7→ a + qn est par construction bijective. Par ce qui précède : card([0, 1[) = card(A × N) = card(A) Autrement dit il existe une bijection de A sur [0, 1[ donc aussi une bijection ψ de A sur R. Considérons l’application f : I → R définie par la formule f (x) = ψ(a) lorsque x = a + qn . Pour tout y ∈ R, son image réciproque est l’ensemble des a + q, q ∈ Q ∩ I, où a est l’unique élément de A tel que ψ(a) = y. Et par conséquent cette image réciproque est partout dense dans I : elle rencontre n’importe quel intervalle ouvert non vide ]α, β[ de I fixé à l’avance. Ainsi y ∈ f (]α, β[). Mais y est arbitraire. Donc f restreinte à ]α, β[ est surjective sur R. Cette fonction f vérifie trivialement la propriété des valeurs intermédiaires. Et elle est extrêmement loin d’être continue ! 1. Dans le même style on peut même montrer que A × A et A sont équipotents lorsque A est infini. Réf : « Introduction à la théorie des ensembles », Halmos, ou toute autre référence parlant des ordinaux, cardinaux, et axiomes de la théorie des ensembles. 3