THÉOR`EME DE POLYA Introduction Le but de ce document est de

Transcription

THÉOR`EME DE POLYA Introduction Le but de ce document est de
THÉORÈME DE POLYA
ERIC LUÇON
Introduction
Le but de ce document est de proposer plusieurs preuves du Théorème de Polya (1921)
concernant la récurrence d’une marche aléatoire sur Zd , d ≥ 1. Les démonstrations proposées, très classiques, n’utilisent que des argument de probabilités usuelles et aucun argument de chaı̂nes de Markov. Ce document s’inspire en particulier du document [3],
“Récurrence d’une marche aléatoire” rédigé par Olivier Garet.
L’objet du Théorème de Polya est d’obtenir des résultats qualitatifs sur le comportement
d’une marche aléatoire isotrope sur Zd : partant de 0, la marche aléatoire revient-elle en
0 presque sûrement ? Si oui, revient-elle infiniment souvent ?
Dans tout le document, (Ω, F, P) sera un espace probabilisé.
1. Lemme de Borel-Cantelli
Avant de s’intéresser au problème de Polya, il s’agit d’abord de donner un sens rigoureux
à l’expression infiniment souvent. Pour cela, posons (An ) une suite dénombrable d’événements
de F.
Définition 1.1.
On définit la limite supérieure de la suite (An ), l’événement A ∈ F suivant :
\ [
A :=
Ak .
n≥0 k≥n
On notera cet événement lim An .
Remarque 1.2.
Soit ω ∈ Ω. ω ∈ lim An si et seulement si pour tout n, il existe k ≥ n tel que ω ∈ Ak .
Autrement dit, ω appartient à un nombre infini de Ak .
Inversement, ω ∈
/ lim An ssi il existe n tel que pour tout k ≥ n, ω ∈
/ Ak : ω n’appartient
qu’à un nombre fini de Ak .
La proposition suivante (Lemme de Borel-Cantelli) fournit un moyen de calculer la
probabilité de lim(An ) :
Proposition
1.3 (Lemme de Borel-Cantelli).
P
Si n≥0 P(An ) < ∞, alors P(lim An ) = 0.
S
Démonstration. Pour tout n ≥ 0, lim An est inclus dans k≥n Ak . Donc,
[
X
P(lim An ) ≤ P(
Ak ) ≤
P(Ak ).
k≥n
k≥n
Mais le dernier terme ci-dessus est le reste d’une série convergente, par hypothèse. Faisant
n → ∞ dans l’inégalité précédente, on obtient le résultat.
2. Le Modèle
Soit un entier d ≤ 1. On considère l’espace euclidien Rd , de base canonique e =
(e1 , . . . , ed ) où ei = (0, . . . , 0, 1, 0,n. . . , 0). On considèreodans Rd l’ensemble Zd des points
P
à coordonnées entières i.e. Zd =
1≤i≤d µi ei ; µi ∈ Z .
1
2
ERIC LUÇON
Sur un espace probabilisé (Ω, F, P), on considère une suite infinie de variables aléatoires
Xn , indépendantes et identiquement distribuées, à valeurs dans l’ensemble fini (de cardinal
2d) {e1 , · · · , ed , −e1 , . . . , −ed } de loi :
∀i ∈ {1, . . . , d},
P(X1 = +ei ) = P(X1 = −ei ) =
1
.
2d
On définit alors la marche aléatoire isotrope partant de 0, la suite (Sn ) de variables
aléatoires suivante :
(1)
S0 = 0,
Pn
Sn =
k=1 Xk ,
n ≥ 1.
Exemple 2.1.
Pour d = 1, Sn est la position au temps n d’une particule dans Z, partant de 0, et qui à
un instant k, étant sur l’entier l, saute à droite (en l + 1) avec probabilité 21 et à gauche
(en l − 1)) avec probabilité 12 .
Exemple 2.2.
Pour d = 2, Sn est la position au temps n d’une particule vivant dans le réseau Z2 , et qui à
un instant k, étant en position (l, m), saute au nord (en (l, m + 1)), au sud (en (l, m − 1)),
à l’est (en (l − 1, m)), ou à l’ouest (en (l + 1, m)), avec chaque fois une probabilité 14 ,
On s’intéresse ici au fait si, oui ou non, la marche aléatoire revient une infinité de fois
en 0, c’est-à-dire à la quantité :
A = lim{Sn = 0}.
A est l’événement : la marche aléatoire passe une infinité de fois en 0.
Le Théorème 2.3 donne un critère pour répondre à cette question en fonction du comportement de la série de terme général P(Sn = 0) :
Théorème 2.3.
Soit A = P
lim{Sn = 0}. On a l’alternative suivante :
– Soit +∞
P(Sn = 0) < ∞, auquel cas P(A) = 0,
Pn=1
+∞
– Soit n=1 P(Sn = 0) = ∞, auquel cas P(A) = 1.
Remarque 2.4.
Dans le premier cas, la marche aléatoire ne revient qu’un nombre fini de fois en 0 : on dit
que la marche aléatoire est transiente. Dans le second cas, la marche revient un nombre
infini de fois en 0 : on dite que la marche est récurrente.
Preuve du Théorème
2.3. Cette preuve peut se trouver dans [3].
P
– Le cas +∞
P(S
n = 0) < ∞ est une simple application du Lemme de Borel-Cantelli
n=1
1.3.
P
– Considérons le cas +∞
n=1 P(Sn = 0) = ∞. Dire que P(A) = 1 équivaut à dire que
P(B) = 0 avec B = Ac . B est l’événement : la suite ne passe qu’un nombre fini de fois
en 0. On peut partitionner cet événement en fonction de l’instant de dernier passage :
B = ∪∞
n=0 {Sn = 0} ∩ {∀k > n, Sk 6= 0},
= ∪∞
n=0 {Sn = 0} ∩ {∀k > n, Sk − Sn 6= 0},
= ∪∞
n=0 {Sn = 0} ∩ {∀i > 0, Sn + i − Sn 6= 0},
= ∪∞
n=0 {Sn = 0} ∩ {∀i > 0, Xn+1 + Xn+2 + · · · + Xn+i 6= 0}.
THÉORÈME DE POLYA
3
Comme c’est une partition, on a
P(B) =
=
∞
X
n=0
∞
X
P ({Sn = 0} ∩ {∀i > 0, Xn+1 + Xn+2 + · · · + Xn+i 6= 0}) ,
P (Sn = 0) P (∀i > 0, Xn+1 + Xn+2 + · · · + Xn+i 6= 0) ,
n=0
la dernière égalité venant du fait que Sn = X1 + · · · + Xn ne dépendant que des n
premières variables, Sn est indépendante de Xn+1 + Xn+2 + · · · + Xn+i .
Mais, la probabilité P (∀i > 0, Xn+1 + Xn+2 + · · · + Xn+i 6= 0) ne dépend pas de n
car les suites (Xn )n>0 et (Xn )n>i sont toutes deux des variables aléatoires indépendantes
de même loi. Notons α cette probabilité, α = P (∀i > 0, X1 + X2 + · · · + Xi 6= 0).
Nous avons donc d’une part que la série de terme général αP(Sn = 0) converge (puisque
c’est une série à termes positifs dont la limite vaut P(B)). Mais par hypothèse, la série de
terme général P(Sn = 0) diverge. Nécessairement, α vaut zéro. Donc P(B) = 0, ce qu’il
fallait démontrer.
La conclusion de ce paragraphe est la suivante : le Théorème 2.3 fournit un critère de
récurrence en fonction du comportement de la série numérique de terme général P(Sn = 0).
Le but de la partie suivante est donc de trouver des équivalents de P(Sn = 0) quand n →
∞. Plusieurs façons de procéder existent. On exhibe ici deux méthodes : l’une combinatoire,
l’autre analytique.
Nous noterons dans la suite P(d) (Sn = 0) pour spécifier la dépendance en la dimension
d.
3. Estimations de P(d) (Sn = 0) et Théorème de Polya
Le Théorème de Polya est le suivant :
Théorème 3.1 (Polya (1921)).
On distingue deux cas :
– Si d ∈ {1, 2}, (Sn ) est récurrente,
– Si d ≥ 3, (Sn ) est transiente.
Remarque 3.2.
Le Théorème 3.1 dit essentiellement la chose suivante : si d ≥ 3, l’espace ambiant Zd est
de dimension “trop grande” pour que la marche aléatoire revienne en 0.
D’après le Théorème 2.3, il suffit
de montrer la propriété suivante :
P+∞
Lemme 3.3. – Si d ∈ {1, 2}, n=1 P(d) (Sn = 0) = ∞,
P
(d)
– Si d ≥ 3, +∞
n=1 P (Sn = 0) < ∞.
3.1. Méthode combinatoire. Dans cette partie, on traite les cas d = 1, 2 et 3. Il s’agit
d’estimer P(d) (Sn = 0). Ces estimations combinatoires peuvent se trouver dans [1].
3.1.1. Le cas d = 1. On remarque tout d’abord la propriété suivante : partant de 0, la
particule se trouve aux instants pairs, sur les entiers pairs, et aux instants impairs sur les
entiers impairs. En particulier, la particule ne peut pas revenir en 0 en un instant impair :
P(1) (S2n+1 = 0) = 0. Il suffit donc de donner un équivalent de P(1) (S2n = 0).
Fixons n. Il existe une bijection évidente entre les trajectoires (S1 , S2 , . . . , S2n ) et les
2n-uplets (∆1 , ∆2 , . . . , ∆2n ), où ∆i ∈ {G, D} (G : gauche, D : droite) code le déplacement
de la particule entre les instants i − 1 et i.
4
ERIC LUÇON
Exemple 3.4.
Pour n = 4, une trajectoire possible est S0 = 0, S1 = −1, S2 = 0, S3 = 1, S4 = 2, S5 = 3,
S6 = 2, S7 = 3, S8 = 2. Le 8-uplet correspondant est alors : (G, D, D, D, D, G, D, G).
Parmi tous ces 2n-uplets possibles, quels sont ceux qui codent les trajectoires telles que
S2n = 0 ? Les trajectoires en question sont celles qui sont allées le même nombre de fois
à gauche qu’à droite. Il s’agit donc de dénombrer les 2n-uplets qui contiennent autant de
G que de D ; il y en a autant que de
possibles d’une famille de n éléments dans une
choix
2n
famille à 2n éléments, c’est-à-dire
. Ainsi,
n
1 2n
(1)
P (S2n = 0) = 2n
.
n
2
En utilisant la formule de Stirling (exercice), on obtient l’estimation suivante :
1
P(1) (S2n = 0) ∼n→∞ √ ,
πn
ce qui prouve le théorème pour d = 1.
3.1.2. Le cas d = 2. De la même manière que dans le cas unidimensionnel, un argument
de parité (exercice) montre que P(2) (S2n+1 = 0) = 0. Ici, il existe une bijection entre les
trajectoires (S1 , S2 , . . . , S2n ) et les 2n-uplets (∆1 , ∆2 , . . . , ∆2n ), où ∆i ∈ {N, S, E, W } (N :
nord, S : sud, E : est, W : ouest) code le déplacement de la particule entre les instants
i − 1 et i. De façon identique, les 2n-uplets codant une trajectoire revenant en 0 à l’instant
2n sont ceux pour lesquels il y a autant de E que de W d’une part, et autant de N et de
S d’autre part. Ainsi, en sommant sur toutes les façons possibles de partir vers l’ouest,
n n
1 X
2n!
1 2n X n 2
(2)
P (S2n = 0) = 2n
= 2n
.
n
k
4
k!k!(n − k)!(n − k)!
4
k=0
k=0
2 P
n
2n
(Indication : penser à la manière de choisir n boules dans une
Mais nk=0
=
k
n
urne à 2n boules, avec n boules noires et n boules blanches). Ainsi,
1 2n 2
1
(2)
.
P (S2n = 0) =
∼n→∞
2n
n
2
πn
Ce qui donne le résultat pour d = 2.
Remarque 3.5.
Le résultat obtenu est le carré du résultat unidimensionnel. Ce n’est pas une coı̈ncidence
(cf. Annexe).
3.1.3. Le cas d = 3. D’une manière analogue, on obtient :
1 X
(2n)!
P(3) (S2n = 0) = 2n
,
6
j!j!k!k!(n − j − k)!(n − j − k)!
j,k
où la somme est considérée pour j + k ≤ n. On peut écrire cette égalité de la manière
(1)
(2)
suivante (où P2n et P2n sont les probabilités calculées dans les cas précédents d = 1, 2) :
(3)
P
(S2n = 0) =
2n−2l 2l
n X
1
2
2n
l=0
n
3
3
Utilisant les résultats précédents, on obtient (exercice) que
P(3) (S2n = 0) = O(n−3/2 ),
ce qui donne le résultat.
(1)
(2)
P2n−2l P2l .
THÉORÈME DE POLYA
5
Remarque 3.6.
On pourrait montrer par récurrence que P(d) (S2n = 0) = O(n−d/2 ) pour d ≥ 4 ce qui
montre le Théorème 3.1 en toute généralité.
3.2. Méthode analytique. La preuve précédente repose sur des estimations de coefficients binomiaux qui peuvent s’avérer fastidieuses pour d grand. La preuve qui suit est
analytique et est vraie en toute dimension. Cette démonstration peut se trouver dans [2],
page 82. Certains passages sont redevables du polycopié de Vincent Pit [4].
On fixe d ≥ 1 et n ≥ 1. On considère fn la fonction caractéristique de la variable
aléatoire Sn , i.e.
(2)
fn :
Rd → C
P
x 7→ E e2πihSn , xi = k∈Zd P(Sn = k)e2πihk , xi .
Comme les Xn sont indépendantes
et identiquement
distribuées,
on obtient : fn (x) =
2πihX
,
xi
2πihX
,
xi
2πihX
,
xi
2πihX
,
xi
n
n
1
1
E e
...e
=E e
...E e
= (ϕd (x))n , où
ϕd (x) = E e2πihX1 , xi .
A n fixé, la définition (2) définit une fonction 1-périodique en chacune des d variables
de carré intégrable ; autrement dit, fn peut être vue comme une fonction de L2 (Td ), où
T est le tore à une dimension (qu’on peut voir comme [0, 1] avec 0 et 1 identifiés). En
particulier, P(Sn = k) est précisément le kième coefficient de Fourier de fn (attention k
est ici un d-uplet, mais la théorie de Fourier de fonctions à d variables fonctionne de façon
très analogue à celle pour d = 1) :
Z
P(Sn = k) = ck (fn ) :=
fn (y)e−2πihk , yi .
Td
En particulier, ce qui nous intéresse est :
Z
Z
(3)
P(Sn = 0) =
fn (y) dy =
Td
ϕd (y)n dy.
Td
Remarquons que ϕd (x) = (cos(2πx1 ) + · · · + cos(2πxd ))/d. En particulier, |ϕd | ≤ 1. De
façon heuristique, sommons selon n dans (3) :
X
XZ
P(Sn = 0) =
ϕd (y)n dy,
d
n≥0 T
n≥0
Z
=
X
ϕd (y)n dy,
Td
n≥0
Td
1
dy.
1 − ϕd (y)
Z
=
Pour peu qu’on puisse justifier rigoureusement l’interversion intégrale/somme, le problème
initial d’une convergence d’une série numérique se ramène à la finitude d’une intégrale.
1
est définie et continue sur [−1, 1]d privé des points {0, (1, . . . , 1), (−1, . . . , −1)}.
La fonction 1−ϕ
d
2
Or, au voisinage de 0 (idem pour les autres), 1 − ϕd (x) ∼ 4π kdx k . Or, en faisant le changement en coordonnées polaires y = rθ, où r ≥ 0 et θ ∈ Sd−1 , on obtient, pour un r0 petit :
Z
Z
Z r0
Z r0 Z
1
1 d−1
r Vd (s) dr ds =
Vd (s) ds
rd−3 dr.
2 dy =
2
B(0,r0 ) k y k
Sd−1
0
0
Sd−1 r
2
Or cette dernière intégrale converge si et seulement si d ≥ 3, ce qui prouve le théorème...
6
ERIC LUÇON
... à un détail près (qui n’en est pas un) : il reste à justifier proprement l’interversion
somme/intégrable précédente : nous avons d’une part :
X
X
P(Sn = 0) = lim
εn P(Sn = 0), (limite croissante),
n≥0
et d’autre part,
ε%1
n≥0
Z
1
1
lim
=
,
ε%1 Td 1 − εϕd
Td 1 − ϕd
en appliquant un théorème de convergence monotone à {ϕd ≥ 0} et {ϕd < 0}. Mais pour
ε < 1, comme ε|ϕd | ≤ ε < 1, les inégalités suivantes sont vraies :
Z X
Z
X
1
n
n
n
ε P(Sn = 0) =
ε ϕd (y) dy =
dy.
Td
Td 1 − εϕd (y)
n≥0
Z
n≥0
Annexe A. Le cas d = 2, autre preuve.
Revenons à la démonstration combinatoire pour d = 2. Notons Xn = (Xn1 , Xn2 ) et
Sn = (Sn1 , Sn2 ). Considérons Un = Xn1 + Xn2 et Vn = Xn1 − Xn2 . Alors (exercice) Un et Vn
sont indépendantes et de même loi (±1 avec probabilité 12 ). Mais alors,
1
2
1
2
1
2
P(S2n = 0) = P(S2n
= 0, S2n
= 0) = P(S2n
+ S2n
= 0, S2n
− S2n
= 0),
= P(U1 + · · · + U2n = 0)P(V1 + · · · + V2n = 0).
Mais d’après le cas d = 1, P(S2n = 0) =∼
1
πn .
Références
[1] P. Billingsley. Probability and measure. Wiley Series in Probability and Mathematical Statistics. John
Wiley & Sons Inc., New York, third edition, 1995.
[2] H. Dym and H. P. McKean. Fourier series and integrals. Academic Press, New York, 1972. Probability
and Mathematical Statistics, No. 14.
[3] O. Garet. Récurrence d’une marche aléatoire. http ://www.iecn.u-nancy.fr/ garet/.
[4] V. Pit. Quelques développements d’agrégation. http ://www.math.u-bordeaux1.fr/ pit/.
Laboratoire de Probabilités et Modèles Aléatoires (CNRS U.M.R. 7599) and Université
Paris 6 – Pierre et Marie Curie, U.F.R. Mathématiques, Case 188, 4 place Jussieu, 75252 Paris
cedex 05, France
E-mail address: [email protected]