Autour du Théorème des Valeurs Intermédiaires - Jean

Transcription

Autour du Théorème des Valeurs Intermédiaires - Jean
Autour du Théorème des Valeurs Intermédiaires :
théorème de Darboux, exemple de Lebesgue,
méthodes de théorie des ensembles
Jean-François Burnol, octobre 2008
Les fonctions continues possèdent la propriété des valeurs intermédiaires. Les fonctions
qui sont des dérivées aussi, c’est le Théorème de Darboux.
Preuve : on suppose f dérivable sur [a, b]. On veut montrer que f ′ prend sur ]a, b[
toutes les valeurs intermédiaires entre f ′ (a) et f ′ (b). Si f ′ (a) = f ′ (b) il n’y a rien à faire,
quitte à remplacer f par −f supposons f ′ (a) > f ′ (b). Soit λ ∈ ]f ′ (b), f ′ (a)[. En remplaçant
f par x 7→ f (x) − λx, on se ramène à f ′ (a) > 0 > f ′ (b) et il s’agit de montrer qu’il existe
un c avec f ′ (c) = 0. Comme f ′ (a) > 0, f (a) est strictement inférieur aux f (x) pour x > a
proche de a, donc a n’est pas un maximum local et encore moins global de f sur [a, b]. De
même f (x) > f (b) pour x < b et proche de b donc b n’est pas non plus un point où f atteint
un maximum local. Comme f est dérivable, elle est continue, et donc il existe un point c
de [a, b] tel que f (c) est maximal. Par ce qui précède ce c est intérieur. Donc (argument du
lemme de Rolle) f ′ (c) = 0. Ce qu’il fallait démontrer.
Lebesgue a donné une construction d’une fonction f : [0, 1] → [0, 1] qui vérifie f ([a, b]) =
[0, 1] pour tout 0 ≤ a < b ≤ 1. Cette fonction a donc la propriété des valeurs intermédiaires
mais elle est extrêmement non continue, puisqu’en tout point, ses valeurs limites remplissent
tout [0, 1]. Si l’on voulait on pourrait composer avec n’importe quelle surjection de [0, 1]
sur R pour avoir f (I) = R pour tout ouvert non vide I. La construction n’utilise que la
notion d’écriture décimale. En voici une variante :
On pose f (1) = 0 et, pour 0 ≤ x < 1 écrit sous forme décimale :
x = 0, x1 x2 x3 x4 . . . ,
on pose
f (x) = 0, x2j+2 x2j+4 x2j+6 . . .
avec j le plus petit tel que
0 = x2j+1 = x2j+3 = x2j+5 = . . .
Si un tel j n’existe pas (ce qui est le cas avec probabilité 1 !) on pose simplement f (x) = 0
(la fonction f est donc presque partout nulle !). On notera que l’on peut avoir x2n = 9 pour
tous les n grands et donc 0, x2j+2 x2j+4 x2j+6 . . . peut ne pas être l’écriture décimale canonique de f (x), mais néanmoins cela a toujours un sens. Par exemple f (0,0909090909 . . .) =
0,99999 · · · = 1, tandis que l’écriture canonique de 1 est 1,0000 . . . .
1
Montrons que ce f marche. Si 0 ≤ a < b ≤ 1 on prend N suffisamment grand de sorte
qu’il existe un entier A avec 102N a ≤ A < A + 1 ≤ 102N b. Écrivons :
10−2N A = 0, a1 a2 . . . a2N
Considérons les nombres réels de la forme :
x = 0, a1 a2 . . . a2N 1 x0 0 x1 0 x2 0 x3 0 x4 . . .
avec des chiffres x0 , x1 , x2 , . . ., arbitraires.
Tous ces x sont dans ]a, b[ (car A < 102N x < A + 1). De plus pour un tel x on a par
définition :
f (x) = 0, x1 x2 x3 x4 . . .
et donc toutes les valeurs possibles dans [0, 1] sont prises.
On aurait pu utiliser l’écriture en base 2, ce qui aurait été un peu plus élégant.
Donnons une construction moins concrète, mais qui est facile lorsque l’on dispose de
quelques notions de théorie des ensembles.
Comment voit-on que [0, 1[ et R sont équipotents ? Il est clair que ]0, 1[ et R sont
en bijection, par exemple via x 7→ tg(πx − π2 ). Il suffit donc de trouver une bijection
f : [0, 1[→]0, 1[. La définition suivante conviendra : f (0) = 21 , f ( 12 ) = 41 , f ( 14 ) = 18 , etc. . .et
pour les autres f (x) = x.
Un raisonnement semblable montre plus généralement que pour tout ensemble infini A,
si B est l’union disjointe de A et d’un ensemble {∗} à un élément, alors il y a une bijection
f de B sur A. En effet il suffit de prendre dans l’ensemble infini A une partie identifiée à
N, et de poser f (∗) = 0, f (0) = 1, . . ., f (n) = n + 1, . . ., et finalement f (a) = a pour
les autres. Par récurrence (ou construction directe du même type) l’union disjointe d’un
ensemble infini A et d’un ensemble fini est équipotente à A. Par exemple il existe une
bijection de [0, 1] sur ]0, 1[.
J’en viens maintenant à l’existence plus subtile d’une bijection de A×N sur A lorsque A
est infini. Si A est infini dénombrable, il s’agit donc d’affirmer la dénombrabilité de N × N,
chose bien connue (par exemple en injectant N × N dans N par (a, b) 7→ 2a 3b , puis en
énumérant dans l’ordre x0 < x1 < x2 < . . . les entiers ainsi obtenus). Dans le cas général
on est amené à considérer les couples (X, f ) avec X ⊂ A et f : X × N → X bijective
(notons qu’un tel X est sûrement infini). Il existe au moins un tel couple, puisque A est
infini, donc contient un sous-ensemble équipotent à N. Un ordre partiel peut être défini
via (X, f ) ≤ (Y, g) si X ⊂ Y et si g prolonge f . Lorsque l’on a une chaîne quelconque
de tels couples (Xα , fα ) on peut prendre l’union X des Xα et définir f : X × N → X
de sorte qu’elle prolonge les fα . Ce f est bijective. Donc toute chaîne possède une borne
supérieure, et par le Lemme de Zorn (qui est « équivalent » à l’Axiome du Choix), il existe
parmi tous ces couples un élément maximal (X, f ). Supposons que A \ X soit infini. Alors
2
il existe Z dénombrable disjoint de X. En utilisant une bijection Z × N → Z on peut alors
prolonger f : X × N → X en une F bijective de (X ∪ Z) × N vers X ∪ Z. Ce qui contredit
la maximalité de (X, f ). Donc A \ X est fini. Comme X est infini, on sait qu’il existe
une bijection φ : A → X. On pose g(a, n) = φ−1 (f (φ(a), n)) ce qui donne une bijection
g : A × N → A. 1
Considérons maintenant l’intervalle I = [0, 1[, que l’on peut voir comme R/Z de sorte
qu’il est muni d’une addition (et d’une soustraction). On définit une relation d’équivalence
par
x ∼ y ⇐⇒ x − y ∈ Q ∩ [0, 1[ .
Par l’axiome du choix on peut choisir un représentant dans chaque classe d’équivalence,
soit donc A ⊂ [0, 1[ l’ensemble de ces représentants. Soit q0 , q1 , . . . une énumération de
l’ensemble dénombrable Q ∩ [0, 1[. L’application :
A × N → [0, 1[
(a, n) 7→ a + qn
est par construction bijective. Par ce qui précède :
card([0, 1[) = card(A × N) = card(A)
Autrement dit il existe une bijection de A sur [0, 1[ donc aussi une bijection ψ de A sur R.
Considérons l’application f : I → R définie par la formule f (x) = ψ(a) lorsque x =
a + qn . Pour tout y ∈ R, son image réciproque est l’ensemble des a + q, q ∈ Q ∩ I, où a
est l’unique élément de A tel que ψ(a) = y. Et par conséquent cette image réciproque est
partout dense dans I : elle rencontre n’importe quel intervalle ouvert non vide ]α, β[ de
I fixé à l’avance. Ainsi y ∈ f (]α, β[). Mais y est arbitraire. Donc f restreinte à ]α, β[ est
surjective sur R.
Cette fonction f vérifie trivialement la propriété des valeurs intermédiaires. Et elle est
extrêmement loin d’être continue !
1. Dans le même style on peut même montrer que A × A et A sont équipotents lorsque A est infini.
Réf : « Introduction à la théorie des ensembles », Halmos, ou toute autre référence parlant des ordinaux,
cardinaux, et axiomes de la théorie des ensembles.
3