Université Denis Diderot Paris 7 I. Mod`eles de populations

Transcription

Université Denis Diderot Paris 7 I. Mod`eles de populations
Université Denis Diderot Paris 7
I. Modèles de populations. ?
Un individu de la génération n de notre population est noté par u, où u est un
n-uplet d’entiers. La concaténation de u = (u1 , ..., un ) et v = (v1 , ..., vp ) est notée
uv = (u1 , ..., un , v1 , ..., vp ).
Le nombre de descendants de u est noté ξu , et on suppose les ξu i.i.d, ∼ Poisson(λ).
Précisément, on part, à la génération 0, d’un unique ancêtre, noté ∅. Ses
descendants sont notés (1), (2), ..., (ξ∅ ).
De même, les descendants d’un individu u sont u(1), u(2), ..., u(ξu ). L’ensemble des
individus de notre population est noté T , et
u ∈ T ⇒ u(i) ∈ T ssi i ≤ ξu .
On note Zn le nombre d’individus à la génération n, i.e.
Zn = #{u ∈ T : |u| = n}.
Enfin, on définit l’instant d’extinction E de la population par
E := inf{n ≥ 0, Zn = 0}.
1. (a) Ecrire un programme qui simule l’évolution de la population au cours des
15 premières générations, et ce pour λ = 0.1, 0.5, 0.9, 1, 1.1, 1.5, 2, 3. Que
remarque-t-on ?
(b) Ecrire un programme qui représente les 10 premières générations de
l’arbre T , à nouveau pour λ = 0.1, 0.5, 0.9, 1, 1.1, 1.5, 2, 3.
(c) Calculer P(Zn+1 = j | Zn = k), pour j, k ∈ N. Expliquer alors pourquoi
(Zn )n≥0 est une chaı̂ne de Markov (attention : l’espace d’état de la chaı̂ne
est N, qui n’est donc pas un espace d’état fini). Que se passe-t-il lorsque
cette chaı̂ne touche la valeur 0 ?
(d) Calculer
X
jP(Zn+1 = j | Zn = k).
En déduire que si Gn (x) := E[xZn ], pour n ≥ 0, x ∈ [0, 1], alors
Gn+1 (x) := Gn (exp(λ(x − 1))),
∀n ≥ 0.
Représenter alors, pour différentes valeurs de λ, les graphes de
G1 , G2 , ..., G10 , puis ceux de G10 , G20 , ..., G100 , puis ceux de
G100 , G200 , ..., G1000 , et enfin ceux de G1000 , G2000 , ..., G10000 . Que
remarque-t-on ?
2. On suppose désormais que λ < 1, et on note E = inf{n ≥ 0 : Zn = 0} le temps
d’extinction de la population.
1
(a) On note Y =
PE
n=0
Zn la population totale. Vérifier par simulation que
P (Y = k) = e−kλ (λk)k−1 /k!, k ≥ 1.
(b) Estimer numériquement E[E]. Tracer le graphe de E[E] en fonction de λ,
pour λ ∈ (0, 1).
3. On suppose désormais qu’à la génération n ≥ 1, la population voit arriver Yn
immigrants, avec Yn indépendant de Zn et Yn ∼ Poisson(µ). Le nombre de
descendants d’un individu, qu’il soit migrant ou non, reste ∼ Poisson(λ).
(a) Reprendre les simulations de 1.a, 1.b, pour ce modèle avec immigration, et
pour différentes valeurs de λ, µ.
(b) Montrer que
Gn+1 (x) = exp(µ(x − 1))Gn (exp(λ(x − 1))).
Tracer comme plus haut, les graphes de G1 , ..., G10000 , pour différentes
valeurs de λ, µ. Que remarque-t-on ?
4. On cherche ici à modéliser l’évolution de populations sur 2 ı̂les. On note T1 et
T2 ces populations, toutes deux issues d’un unique ancêtre, et on suppose ici
que λ1 = 1.1, λ2 = 0.9. A chaque génération n ≥ 1, on suppose que chaque
individu de la population 1, indépendamment des autres, migre vers l’ı̂le 2
avec probabilité p1 . De même chaque individu de la population 2 migre vers
l’ı̂le 1 avec probabilité p2 .
(i)
On note Zn le nombre d’individus présents à la génération n sur l’ı̂le i, i = 1, 2.
(a) Reprendre les simulations de 1.a, 1.b (on représentera les deux
populations, puis les 2 arbres), pour différentes valeurs de p1 , p2 .
(1)
(2)
(1)
(2)
(b) Calculer Gn+1 , G(n+1) en fonction de Gn , Gn . Tracer les graphes
successifs, comme plus haut, et discuter.
2
II. Coalescent. ?
1. On considère un modèle de coalescence. Au temps initial T0 = 0 sont présents
N amas. On introduit des variables i.i.d, ei,j ∼ exp(λN ), 1 ≤ i < j ≤ N . Au
temps
T1 := inf{ei,j , 1 ≤ i < j ≤ N },
les amas i et j tels que T1 = ei,j coagulent, au sens où ils se joignent pour ne
former qu’un seul et même amas, que l’on choisit de noter i (il n’y a donc plus
d’amas j à partir du temps T1 ).
Au temps
T2 := inf{ek,` , 1 ≤ k < ` ≤ N, k 6= j, ` 6= j},
ce sont les amas k et ` tels que T2 := ek,` qui coagulent pour ne former qu’un
seul amas, noté k.
On continue de la sorte jusqu’à ce qu’il n’y ait plus qu’un seul amas. On note
Tcoag le temps nécessaire à ce que tous les amas aient coagulé en un seul.
(a) Combien d’amas reste-t-il au temps TN −2 ? Montrer que les variables
{Tk+1 − Tk , k = 0, ..., N − 2} sont indépendantes ? Sont-elles identiquement
distribuées ?
(b) Exprimer, en fonction de N et λN , la transformée de Laplace de Tcoag .
Que vaut l’espérance de Tcoag ? Lorsque λN = 1, quelle est la limite de
cette espérance lorsque N → ∞ ?
(c) Tracer, pour λN = 1, et N = 2, 3, ...10 puis N = 20, 30, ..., 100,
N = 200, 300, ..., 1000 le graphe du nombre d’amas en fonction du temps.
Que remarque-t-on ?
Faire de même lorsque λN = 1/N .
Vérifier numériquement les calculs de la question précédente.
2. On considère le modèle de génétique pour l’ADN mitochondrial suivant :
chaque génération compte exactement M individus féminins. La génération 0
est la génération actuelle, et on va s’intéresser aux lignées ancestrales.
L’individu i de la génération 0 choisit, indépendamment des autres et
uniformément au hasard, son unique mère m1 (i) parmi les M individus de la
génération −1. La mère de mn (i) (de la génération −n) est choisie
uniformément au hasard à la génération −n − 1, et est notée mn+1 (i).
La lignée ancestrale du i-ème individu de la génération n est la suite
(i, m1 (i), m2 (i), ...).
(a) Si mk (i) = mk (j), que peut-on dire de mk+1 (i) et mk+1 (j) ?
(b) Soit Gi,j le nombre de générations qu’il faut remonter pour que les lignes
ancestrales de i et j se rencontrent. Quelle est la loi de Gi,j ?
Trouver la limite en loi de M −1 Gi,j lorsque M → ∞.
3
(c) Soit N ≤ M fixé.
On considère les N premiers individus de la génération actuelle, et les
(N )
lignées ancestrales correspondantes. On note TP RAC le nombre de
générations qu’il faut remonter pour découvrir le plus récent ancêtre
commun de ces individus, i.e. le nombre de générations qu’il faut remonter
pour que ces N lignées ancestrales aient fusionné en une seule.
(2)
i. Donner la loi de TP RAC .
ii. Montrer par ailleurs que si N > 2, et si τ est la première génération à
laquelle il faut remonter pour qu’au moins deux des N lignées se
rencontrent, Xτ est le nombre de lignées ancestrales restantes après
cette première rencontre, alors sachant {τ = k}, {Xτ = j} on a
(loi)
(N )
(j)
TP RAC = k + TP RAC .
Décrire alors la loi de τ , et de Xτ en fonction de N, M .
iii. Quelle est la limite de la loi de Xτ pour N fixé et M → ∞.
iv. En déduire la limite en loi de TP RAC /M toujours pour N fixé, M → ∞
v. Soit L1 , L2 , L3 , ... le nombre de lignées qui se restent après avoir
remonté 1, 2, 3, ... générations, lorsque N = M . Evaluer
numériquement limM →∞ E[Li /M ], i = 1, 2, 3, .... Que remarque-t-on ?
(d) Vérifier par une simulation les calculs des questions précédentes.
(e) Tracer, pour différentes valeurs de N , et pour M = 100000 le graphe du
nombre de lignées ancestrales encore présentes à la génération −bM tc, en
fonction de t.
Comparer avec les graphiques obtenus pour le modèle de la question 1.
3. Dans cette partie on reprend le modèle de la partie précédente, mais cette fois
on va regarder les générations à venir {0, 1, 2, · · · }.
Supposons qu’à la génération 0 tous les individus sont porteurs d’un ADN
mitochondrial distinct, et qu’il n’y a aucune mutation (i.e. l’ADN
mitochondrial d’un individu donné est exactement l’ADN maternel). Combien
de générations sont nécessaires pour que seul l’un de ces ADN soit présent
dans la population ?
Tracer, pour différentes valeurs de M , les graphes du nombre d’ADN
mitochondriaux distincts présents dans la population à la génération bM tc en
fonction de t.
4
III. Marches branchantes et sélection. ?
Comme en I, un individu de la génération n de notre population est noté par u, où
u est un n-uplet d’entiers. La concaténation de u = (u1 , ..., un ) et v = (v1 , ..., vp ) est
notée uv = (u1 , ..., un , v1 , ..., vp ).
Comme en I, le nombre de descendants de l’individu u est ξu , et les ξu sont i.i.d.
(mais ici la loi de ξu ne sera pas Poisson).
On s’intéresse à la position de nos individus dans l’espace. La particule u de la
génération n est situé à la position Xu ∈ R. Les positions de ses descendants
u(1), ..., u(ξu ) sont choisies de façon i.i.d (et indépendantes des {ξu , u ∈ T }), de
sorte que pour tout 1 ≤ i ≤ ξu ,
(
1 avec proba 1/2
Xu(i) − Xu =
.
−1 avec proba 1/2
1. Dans cette partie on suppose que ξu ≡ 2 pour tout u ∈ T .
(a) Tracer le graphe des positions des particules sur 15 générations.
(b) Soit la particule u = (1, 1, ..., 1), avec |u| = n. Montrer que
1
(Xu + n) ∼ Bin(n, 1/2). En déduire le comportement asymptotique de
2
Xu , lorsque n → ∞.
(c) Soient Y1 , ..., Y2n des copies indépendantes de Xu , et Zn = max(Y1 , ..., Y2n ).
Etablir que pour tout x < 1 fixé,
lim P(Zn ≥ nx) = 1.
n→∞
Déterminer alors (au sens de la convergence en probabilité)
Zn
.
n→∞ n
lim
Vérifier numériquement.
(d)
(d) Soit Xn la position de la particule située la plus à droite des particules de
la n-ème génération, i.e.
Xn(d) = max{Xu , |u| = n}.
Déterminer alors numériquement
(d)
Xn
lim
.
n→∞ n
Pourquoi le résultat est-il différent de celui obtenu pour Zn /n ?
(g)
(e) Que dire de Xn , la position de la particule la plus à gauche des particules
de la n-ème génération ?
5
2. (a) On suppose que ξu ≡ 3 pour tout u ∈ T . Reprendre la question (d) de la
partie précédente, qu’observe-t-on ? Expliquer.
(loi)
(b) Dans cette partie on suppose que ξu = Y + 1, où Y ∼ Poisson(λ) avec
λ > 0. Reprendre la question (d) de la partie précédente. Qu’observe-t-on ?
3. Dans cette partie on suppose comme en 1 que ξu ≡ 2 pour tout u ∈ T . Mais on
ajoute la contrainte suivante : dès que notre population totale dépasse N , alors
on ne garde que les N particules les plus à droite, et on supprime les autres.
(a) Simuler la position des particules au cours du temps, avec
N = 10, 20, ..., 100, 200, pour 1000 générations.
(d)
(b) On note Yn la position de la particule la plus à droite dans ce nouveau
(d)
modèle. On ne cherchera pas à calculer la loi de Yn .
(d)
(d)
Estimer numériquement l’écart entre Yn et Xn (position de la particule
la plus à droite pour le modèle de 1.)
6
IV. Mélange d’un jeu de cartes. ?
On dispose d’un jeu de r cartes initialement dans une pile. On a numéroté les cartes
de 1 à r : la carte numéro 1 est celle initialement en haut du tas. On arrange les
cartes en prenant celle du dessus et en l’insérant uniformément en k entre la k-ème
et la k + 1-ème, ce qu’on appelle la k-insertion. La 1-insertion ne change rien et la
r-insertion met la carte tout en bas. Une configuration du paquet sera donc décrite
par une permutation σ ∈ Sr avec σ(i) qui note la position de la carte initialement
en i.
Faire une k-insertion revient à σ 7→ (k, k − 1, . . . , 1)σ. En effet toutes les cartes
avant la k-ème (en dehors de la premiere) sont remontées de 1 cran.
Les insertions sont i.i.d. choisies uniformement sur C = {C1 , . . . , Cr } avec
Ci = (i, i − 1, . . . , 1). On peut decrire l’arrangement des cartes par
Xn+1 =
1
Y
i X0 .
i=n+1
1. (a) Montrer que (Xn ), n ≥ 0 est une chaine de Markov sur S(r), en donner les
probabilités de transition.
(b) Montrer qu’elle est irréductible, apériodique et récurrente. Identifier sa loi
invariante.
(c) Notons Ti les durées entre deux remontées successives de la carte
initialement en bas du tas : posons Yn = Xn (r).
k−1
X
Tk = min{n ≥ 1, Yn = r − k} − (
Ti ); T0 = 0.
i=0
Simuler les variables Ti pour r = 3, 4, 5, 10, 20, 52, puis
T = T1 + . . . + Tr−1 . On tracera les histogrammes correspondants.
(d) Quelle est la position de la carte initialement au bas du tas aux temps
T1 , T1 + T2 , T1 + T2 + T3 , . . . , T1 + · · · + Tr−1 ?
Calculer E[T ] et vérifier le calcul grâce à la simulation de la question
précédente.
(e) Vérifier par simulation que pour tout n ≥ 0, XT +1+n suit la loi uniforme
sur Sr .
2. Dans cette partie r = 3, 4, 5.
On note Pn la loi de Xn , et π la loi invariante trouvée en 1.b. Représenter,
grâce à une simulation, le graphe de
1 X
|Pn (σ) − π(σ)|.
n→
2 σ∈S
r
Que remarque-t-on ?
7
3. Suivons à présent les positions successives de l’une des cartes de notre paquet
au cours de notre mélange. On note (Yn , n ≥ 0) la suite de ces positions (de
sorte que si Y0 = i, on suit la carte qui se trouve initialement en i-ème
position).
(a) Montrer que (Yn ), n ≥ 0 est une chaine de Markov sur {1, ..., r}, en donner
les probabilités de transition.
(b) Montrer qu’elle est irréductible, apériodique et récurrente. Identifier sa loi
invariante.
(i)
(c) On note Qn la loi de Yn lorsque Y0 = i, et π̃ la loi invariante. Représenter,
grâce à une simulation, les graphes de
r
1 X (i)
n→
|Q (k) − π̃(k)|,
2 k=1 n
pour i = 1, ..., r.
Que remarque-t-on ?
(d) Au regard des simulations de la question précédente, au bout d’environ
combien d’insertions successives semble-t-on pouvoir affirmer qu’un jeu de
52 cartes est bien mélangé ? Quel lien peut-on faire avec les résultats des
questions 1.(c.d.e) ?
8
V. Mélange bis. ? Comme en IV, on va considérer un modèle de battage de cartes,
mais celui-ci est un peu plus proche de la réalité. A nouveau on considère un jeu de
r cartes.
Une étape de notre mélange consiste en la démarche suivante :
• On choisit M ∼ Bin(r, 1/2), et on coupe le jeu au niveau de la M -ème carte (i.e.
on sépare les M premières cartes des r − M dernières).
• On ”re-mélange” nos 2 paquets (on préserve, bien sûr l’ordre relatif
dans chacun
des 2 sous-paquets) en choisissant uniformément parmi les Mr façons de le faire.
On note (Xn , n ≥ 0) la suite de permutations de {1, ..., r} obtenue.
Une sous-suite croissante de longueur n d’une permutation σ ∈ Sr est un ensemble
d’indices i1 < ... < in tels que
σ(i1 ) < σ(i2 ) < · · · < σ(in ).
Une plus longue sous-suite croissante (p.l.s.s.c.) de longueur n est un tel ensemble
d’indices maximal au sens de l’inclusion (i.e. si j ∈ (ik , ik+1 ), σ(j) ∈
/ (σ(ik ), σ(ik+1 ))).
Par exemple la permutation
1 2 3 4 5 6 7 8 9 10
4 7 1 8 10 2 6 3 9 5
possède, par exemple, les trois p.l.s.s.c. suivantes :
σ(1) = 4 < σ(2) = 7 < σ(4) = 8 < σ(5) = 10,
σ(3) = 1 < σ(6) = 2 < σ(8) = 3 < σ(10) = 5
σ(7) = 6 < σ(9) = 9.
1. (a) Montrer que (Xn ), n ≥ 0 est une chaine de Markov. Montrer que son noyau
de transition vérifie P (σ1 , σ2 σ1 ) = P (Id, σ2 ) pour tous σ1 , σ2 ∈ Sr , et que

r+1

 2r si σ = Id,
1
P (Id, σ) =
si σ possède exactement 2 p.l.s.s.c.,
2n


0 sinon.
(b) Montrer que (Xn ) est irréductible, apériodique et récurrente. Identifier sa
loi invariante.
(c) Ecrire un programme qui simule ce mélange de cartes.
2. Soit la procédure suivante : à chaque carte du jeu on attribue l’étiquette
ξi ∼ Ber(1/2) ; on replace alors les cartes étiquetées 0 en haut du paquet (en
respectant leur ordre relatif).
On note (Yn , n ≥ 0) la suite de permutations de {1, ..., r} obtenue.
9
(a) Montrer que (Yn ), n ≥ 0 est une chaine de Markov. Montrer que son noyau
de transition Q vérifie, pour tous σ1 , σ2 ∈ Sr ,
Q(σ2 , σ1 ) = P (σ1 , σ2 ).
Expliquer le lien entre les chaı̂nes X et Y .
(b) Ecrire un programme qui simule la chaı̂ne Y .
3. (a) Dans cette partie uniquement on ne considérera que r = 3, 4, 5. On note
Pn la loi de Xn , et π la mesure invariante trouvée en 1.b. Représenter le
graphe de
1 X
n→
|Pn (σ) − π(σ)|.
2 σ∈S
r
Que remarque-t-on ?
(b) Même question avec Qn , loi de Yn .
4. On admet que
X
σ∈Sr
r
1X
|Pn (σ) − π(σ)| =
E(r, k) 2 k=1
2n +r−k
k
2nr
1 − ,
r! avec
E(1, 1) = 1, E(1, k) = 0 pour tout k 6= 1,
E(r, k) = (r − k + 1)E(r − 1, k − 1) + kE(r − 1, k) pour tous r ≥ 2, k ≥ 1.
(a) Ecrire un programme qui calcule les valeurs des E(r, k), pour
r = 10, 52, 100, et k ∈ {1, ..., r}.
(b) Utiliser la formule admise pour représenter le graphe de
n→
1 X
|Pn (σ) − π(σ)|,
2 σ∈S
10
à nouveau pour r = 3, 4, 5 puis pour r = 10, 52 et enfin pour r = 100.
Discuter.
10
VI. Marche λ-biaisée sur un arbre binaire. ? On considère un arbre binaire T de
hauteur N ∈ N∗ . On pourra par exemple considérer qu’un tel arbre est constitué par
• un premier noeud que l’on note ∅ et qu’on place à hauteur nulle. Ce noeud n’a
pas de parent, on l’appelle donc ”racine” de l’arbre.
• deux noeuds à hauteur 1, que l’on note 1 et 2, et qui sont chacun directement
reliés à la racine.
• A hauteur 2 on compte 4 noeuds. Les deux descendants issus du noeuds 1 seront
notés 11, 12, tandis que les deux descendants de 2 seront notés 21, 22.
• pour tout k ∈ {1, ..., h − 1} on compte 2k noeuds à hauteur k. Les deux
descendants du noeud u de hauteur k − 1 sont notés u1, u2.
• A la hauteur N , on compte 2N noeuds, mais ils n’ont pas de descendants (on
parlera donc de ”feuilles” pour les noeuds situés à la hauteur h). Comme
précédemment les deux noeuds descendantes d’un noeud u de hauteur h − 1 sont
notées u1, u2.
On notera que la hauteur d’un noeud u est tout simplement le nombre de chiffres
utilisés pour écrire u. On note hauteur(u) = |u|. Un tel noeud possède un unique
parent noté p(u), que l’on obtient à partir de u en effaçant le dernier chiffre.
On fixe alors λ ∈ (0, 1) et on considère alors la marche aléatoire λ-biaisée
(Xn , n ≥ 0) sur cet arbre, démarée en la racine de l’arbre. Cette marche est une
chaı̂ne de Markov à valeurs dans T . Au temps n + 1, X saute de Xn vers l’un des
plus proches voisins de Xn choisis au hasard de la façon suivante :
• si Xn = ∅, alors


 ∅ avec probabilité λ
Xn+1 =
Xn+1 = 1 avec probabilité (1 − λ)/2 .


Xn+1 = 2 avec probabilité (1 − λ)/2
• Si Xn = u, avec 1 ≤ |u| ≤ N − 1, alors


 p(Xn ) avec probabilité λ
Xn+1 =
Xn+1 = Xn 1 avec probabilité (1 − λ)/2 .


Xn+1 = Xn 2 avec probabilité (1 − λ)/2
• Si |Xn | = N alors Xn+1 = p(Xn ).
1. (a) Montrer que (Xn , n ≥ 0) est irréductible, apériodique, et calculer sa
distribution invariante en fonction de λ et N .
(b) Simuler (Xk , 0 ≤ k ≤ n) et vérifier les calculs de la question précédente,
pour des valeurs de N ∈ {1, ..., 10}, et pour λ = 1/5, 1/3, 2/5, 1/2, 3/5, 4/5.
(c) Montrer que (Yn := |Xn |, n ≥ 0) est une chaı̂ne de Markov, calculer son
noyau de transition. Montrer que cette chaı̂ne est irréductible,
apériodique, et calculer sa distribution invariante en fonction de λ, N . Que
vaut E0 (τ0+ ), lorsque τ0+ = inf{k ≥ 1 : Yk = 0} ?
11
(d) Simuler directement (Yn , n ≥ 0). Estimer E0 [τ0+ ].
(e) On note τj = inf{k ≥ 0 : Yk = j}, et pk := Pk (τ0 < τN ). Que valent p0 , pN ?
Montrer que pour tout k ∈ {1, ..., N − 1}, pk = λpk−1 + (1 − λ)pk+1 .
Ecrire alors un programme qui calcule les différentes valeurs de
pk , k ∈ {0, ..., N }, et tracer le graphe correspondant pour
N = 1, 2, ..., 10, 20, ..., 100, 200, ..., 1000 et pour les valeurs de
λ = 1/3, 0.4, 0.5, 0.6.
(f) Vérifier les calculs de la question précédente à l’aide de simulations de la
chaı̂ne (Yn , 0 ≤ n ≤ min(τ0 , τn )).
2. Dans cette partie on fixe λ = 1/3 (cas de la marche simple sur l’arbre).
(a) Soit τu = inf{k ≥ 0 : Xk = u}.
Pour u une feuille de l’arbre, simuler la loi de τu /(2N +1 N ).
(b) On s’intéresse alors au temps nécessaire pour que la marche (Xn )n≥0 soit
passée au moins une fois par tous les noeuds de l’arbre :
τcouv = inf{n ≥ 0 : ∀u ∈ T ∃k ≤ n : Xk = u}.
On rappelle que notre marche est issue de la racine de l’arbre.
Simuler pour N = 3, 4, ..., 10, 15, 20 la loi de τcouv /(2N +1 N 2 ). Que
remarque-t-on ?
3. Par simulation, et pour les mêmes valeurs de N , estimer les quantités τu ,
τcouv définies en 2, mais cette fois pour λ = 1/5, 2/5, 1/2, 3/5, 4/5. Discuter
suivant ces valeurs de λ.
12
VII. Temps d’atteinte, temps de couverture sur le tore. On considère une
marche aléatoire simple symétrique X = {Xn }n=0,1,... dans TdN := {1, 2, . . . , N }d . On
précise que sur le tore TdN , x, y ∈ TdN sont voisins lorsque, pour un i ∈ {1, ..., d},
• xj = yj pour tout j 6= i
• |xi − yi | = 1 ou xi = 1, yi = N ou xi = N, yi = 1.
On suppose que, sous Py la chaı̂ne de Markov X démarre au point y. Au temps
n + 1 elle saute sur l’un des 2d sites voisins de Xn avec probabilité 1/(2d).
On va s’intéresser aux temps d’atteinte et au temps de couverture :
pour x ∈ TdN , τx := inf{n ≥ 0 : Xn = x},
τcouv := inf{n : pour tout x ∈ TdN il existe j ≤ n tel que Xj = x}
1. Généralités (d quelconque). Montrer que X est irréductible. Est-elle
apériodique ? Quelle est la loi invariante π de X ? La loi de Xn converge-t-elle
vers la loi invariante ?
2. Le cas d = 1.
(a) Fixons tout d’abord x = 1. On note h(y) = Ey [τ1 ]. Que vaut h(1)?
Montrer que pour tout y ∈ {2, ..., N − 1} on a
1
1
h(y) = 1 + h(y − 1) + h(y + 1).
2
2
Trouver des équations similaires reliant h(1) à h(2), h(N ) d’une part, et
h(N ) à h(1), h(N − 1) d’autre part.
A quoi ressemble le graphe de h ?
(b) Que vaut E1 [τ1+ ] ? Comment cette quantité est-elle relié à h(2), h(N ) ?
Donner une formule explicite de h en fonction de N . Que vaut
max
x∈{1,...,N }
h(x)?
Pour quelle valeur de x ce maximum est-il réalisé ?
(c) Pour x ∈ {1, ..., N } quelconque, expliciter hx telle que hx (y) = Ey [τx ].
(d) Vérifier les calculs des questions précédentes par des simulations de
{Ey [τx ], y ∈ {2, ..., N }, et ce pour différentes valeurs de x et de N .
(e) Montrer que
τcouv ≥ 2
max
x∈{1,...,N }
Ex [τ1 ].
(f) (*) Montrer que,
E[τcouv ] ≤ 2(N 2 + N ).
On pourra considérer le temps qu’il faut pour aller de 1 à N/2, et
introduire une certaine variable géométrique.
13
(g) Estimer, par simulation, E[τcouv ]/N 2 .
3. Le cas d = 2 Etudier numériquement la distribution de la variable aléatoire
ζN :=
τcouv
.
N 2 (log N )2
pour différentes valeurs de N . On estimera en particulier E[ζN ], Var[ζN ], par
exemple pour N = 5, 10, 20, 40, . . .. Que semble-t-il se passer lorsque N croit ?
4. Le cas d = 3 Etudier numeriquement la distribution de la variable aléatoire
ζN :=
τcouv
N 3 (log N )
.
On pourra choisir N = 5, 10, 20, . . .. Estimer en particulier E[ζN ], Var[ζN ]. Que
semble-t-il se passer lorsque N croı̂t ?
14
VIII. Modèle d’opinion. ? On considère le modèle suivant, introduit initialement
pour modéliser l’évolution d’opinions.
On se place sur le graphe complet à N sommets que l’on note {1, ..., N }. Dans ce
graphe, tous les noeuds sont voisins de chacun des autres noeuds.
En chaque noeud se situe une personne qui possède en tous temps une certaine
opinion. Pour faire simple on suppose qu’il n’y a que deux opinions, que l’on note 0
et 1. L’opinion au temps t de la personne située au noeud i est notée ξt (i). Les
opinions initiales sont tirées indépendamment, avec
ξ0 (i) ∼ Ber(p),
pour un certain p ∈ (0, 1) fixé.
Le mécanisme d’évolution est le suivant. A chaque temps discret t ∈ N∗ , on tire une
personne, disons j, uniformément au hasard parmi les N . La personne j décide
alors de consulter une autre personne, disons k 6= j, qu’elle choisit uniformément au
hasard parmi les N − 1 personnes restantes, et adopte son opinion, quelle qu’elle
soit. Les opinions des personnes autres que j restent inchangées. Autrement dit, au
temps t ∈ N∗ , on a
ξt (`) = ξt−1 (`) ∀` 6= j.
ξt (j) = ξt−1 (k),
On dit qu’il y a consensus lorsque les N personnes partagent la même opinion. On
note
Y
Y
τconsensus := inf{t ∈ N :
ξt (x) = 1 ou
(1 − ξt (x)) = 1}
x∈{1,...,N }
x∈{1,...,N }
1. Généralités
(a) Montrer que ξ = (ξt (x), x ∈ {1, ..., N }, t ∈ N) est une chaı̂ne de Markov à
valeurs dans {1, ..., N }{0,1} . Quel est son noyau de transition ?
(b) En observant que les deux cas de consensus sont absorbants, donner deux
exemples de lois invariantes pour ξ. Quelle est l’hypothèse du théorème
sur l’existence d’une unique mesure invariante qui est ici mise en défaut ?
2. Opinion majoritaire, opinion gagnante
(a) Simuler ξt pour différentes valeurs de N, e.g.5, 10, 30, 100, ..., et estimer
empiriquement, et pour différentes valeurs de
t, e.g.0, 1, 5, 10, 20, 100, 200, 500, 1000, 10000, 100000, ..., la proportion
d’opinion 1. Que remarque-t-on ?
(b) Simuler la chaı̂ne ξ pour différentes valeurs de N, e.g.5, 10, 30, 100, ..., au
moins jusqu’au temps de consensus. Estimer alors, en fonction de p, la
probabilité que l’opinion 1 ”l’emporte” (i.e. le consensus s’établit sur
l’opinion 1)
15
3. Temps de consensus
(a) Estimer, par simulation, E[τconsensus ] en fonction de N , puis tracer le
graphe de E[τconsensus ]/N 2 en fonction de N .
(b) Fixons 1 ≤ k ≤ N . Pour être capable de déterminer les opinions des
personnes {1, ..., k} au temps t, montrer qu’avec probabilité k(k − 1)/N 2 ,
il suffit de connaı̂tre l’opinion de k − 1 d’entre elles au temps t − 1, et
qu’avec la probabilité complémentaire 1 − (k(k − 1))/N 2 on est en revanche
obligé de connaı̂tre l’opinion de toutes ces personnes au temps t − 1.
(c) Déduire de la question précédente que
E[τconsensus ] = N 2 (1 −
1
).
N
Vérifier que ce résultat est en accord avec les simulations !
16
IX. Graphe aléatoire. ? On considère le graphe aléatoire suivant. Les noeuds sont
{1, ..., N }, et chaque arête {(i, j), i 6= j, i, j ∈ {1, ..., N }} est, indépendamment des
autres, présente avec probabilité pN ∈ (0, 1), et absente sinon.
On dit que deux noeuds i, j ∈ {1, ..., N } sont voisins ssi l’arête (i, j) est présente.
On dit que deux noeuds i, j sont reliés ssi il existe un chemin reliant i à j,
c’est-à-dire s’il existe i0 = i, i1 , ..., ip−1 , ip = j tels que pour tout 0 ≤ k ≤ p − 1 les
noeuds ik et ik+1 sont voisins. On parle de chemin élémentaire lorsque les noeuds
empruntés sont tous distincts.
La distance de i à j, notée d(i, j), est l’entier p minimal tel que i0 , i1 , ..., ip réalise un
chemin de i à j. Lorsqu’il n’existe pas de tel chemin on pose d(i, j) = +∞.
1. Nombre d’arêtes total, nombre de voisins d’un noeud donné
On note EN le nombre d’arêtes total du graphe, tandis que pour un noeud x,
on note Dx le nombre de voisins de x (i.e. le nombre d’arêtes ayant pour
sommet x, on parle aussi de degré).
P
(a) Que vaut x∈{1,...,N } Dx − 2EN ?
(b) Dans les cas pN = 0, pN = 1, que peut-on dire de EN , et des
Dx , x ∈ {1, ..., N } ?
(c) Pour pN quelconque, quelle est la loi de EN ? Lorsque pN ∼N →∞ λ/N avec
λ > 0, donner un équivalent de la moyenne de EN lorsque N → ∞.
(d) Pour pN quelconque, quelle est la loi de Dx ?
Si pN ∼N →∞ λ/N , montrer qu’alors Dx converge en loi vers une variable
de Poisson de paramètre λ.
(e) Vérifier les résultats des questions précédentes grâce à des simulations.
2. Explorer la composante de 1.
La composante de 1, notée C1 , est l’ensemble des noeuds qui se trouvent à
distance finie de 1. Autrement dit, dans C1 , on trouve 1, les voisins de 1, les
voisins des voisins de 1, etc...
(a) Ecrire un programme qui permet de simuler la taille #(C1 ) de la
composante de 1. Estimer la loi, et en particulier l’espérance de #(C1 ),
pour N = 10, 100, 1000, ..., et pour pN = λ/N en essayant différentes
valeurs de λ ∈ R∗+ .
Pour N = 1000, tracer le graphe de E[#(C1 )]/N en fonction de λ. Que
remarque-t-on ?
(b) Ecrire un programme qui calcule
1 X
d(1, j).
dmoy (1) =
#(C1 ) j∈C
1
la distance moyenne de 1 aux noeuds de sa composante.
Estimer la loi de dmoy (1) (et en particulier sa moyenne), pour différentes
valeurs de N et λ. Pour N = 1000, tracer le graphe de dmoy (1) en fonction
de λ. Discuter.
17
(c) Ecrire un programme qui calcule
dmax (1) = max d(1, j).
j∈C1
Estimer la loi de dmax (1) (et en particulier sa moyenne), pour différentes
valeurs de N et λ. Comparer aux résultats de la question précédente.
3. Cycles dans la composante de 1.
Un cycle de longueur p, est un chemin de longueur p qui boucle sur lui-même
en n’empruntant au passage que des noeuds distincts. Sans perte de généralité,
on pourra toujours considérer que ce chemin est démarré au noeud minimal.
Précisément un cycle est exactement un chemin élémentaire (i1 , ..., ip ) tel que
i1 et ip sont voisins, et de plus i1 = min1≤k≤p ik .
(a) Montrer que si C1 ne possède aucun cycle, alors
X
Dx = 2#(C1 ) − 2.
x∈C1
(b) Montrer que si C1 possède exactement k cycles distincts, alors
X
Dx = 2#(C1 ) − 2k − 2.
x∈C1
(c) Déduire de la question précédente l’écriture d’un programme qui permet
de déterminer le nombre de cycles de C1 . On estimera la loi et l’espérance
de ce nombre pour différentes valeurs de N et de λ.
18
X. Agrégation limitée par diffusion interne
On considère une suite An de sous-ensembles de Zd (où d est la dimension), qui
croı̂t selon la règle suivante. À l’étape n, une particule est lancée à l’origine puis se
déplace suivant une marche aléatoire simple (si d = 1, les probabilités d’aller à
gauche et à droite valent 1/2 ; si d = 2, les probabilités d’aller au Nord, au Sud, à
l’Est et à l’Ouest valent 1/4). La particule se déplace jusqu’à ce qu’elle sorte de An
en un point Xn+1 . On définit alors :
An+1 = An ∪ Xn .
On initialise le modèle avec A0 = ∅ ou A1 = {0}. An est appelé l’agrégat à l’étape n.
1. Dans cette question, on considère le cas d = 1.
(a) Écrire un programme qui simule l’évolution de l’agrégat jusqu’à l’étape
1000.
(b) Expliquer pourquoi l’ensemble des sites occupés est un intervalle d’entiers.
Quelle est sa longueur ?
(c) On écrit An = {Gn , · · · , Dn }, où Dn et Gn sont respectivement les points
les plus à gauche et à droite de l’agrégat. On pose Zn = Dn + Gn .
Comment retrouve-t-on Dn et Gn à partir de Zn ? Montrer que (Zn )n≥0 est
une chaine de Markov ( attention : l’espace d’états de la chaı̂ne est N, qui
n’est donc pas un espace d’états fini ).
(d) En comparant la situation au problème de la ruine du joueur, montrer que
n+2−i
2(n + 2)
n+2+i
= i − 1|Zn = i) =
2(n + 2)
P(Zn+1 = i + 1|Zn = i) =
P(Zn+1
Représenter l’évolution des valeurs de pn =
10000. Que remarque-t-on ?
n+2−Zn
2(n+2)
pour n variant de 1 à
(e) On considère la chaı̂ne de Markov Zn0 régie par la transition
1
2
1
0
= i − 1|Zn = i) =
2
0
P(Zn+1
= i + 1|Zn0 = i) =
0
P(Zn+1
Quel est le comportement de Zn0 ? Quel est le comportement de
G0n = Xn2−n , Dn0 = Xn2+n ?
Simuler le comportement de Gn , Dn , puis comparer.
(f) A l’aide d’un histogramme, représenter graphiquement une estimée de la
1000
loi de √Z1000
. Quelles sont les positions asymptotiques de Dn et Gn ?
Quelles sont les fluctuations par rapport à cette position ?
19
2. On se place désormais dans le cas d = 2.
(a) On rappelle que An est de volume n. Si on considère que An grossit de
façon régulière, à quelle distance de l’origine (en ordre de grandeur) le
n-ième point est-il ajouté ?
(b) Représenter An graphiquement pour n = 10, 1000, 100000. Que
remarque-t-on ? Quelle semble être la forme limite ?
On pourra réaliser un film/gif animé à l’aide de la commande xs2gif (voir
l’aide de scilab).
(c) Que représentent les quantités :
p
n/π
x∈An
p
I (n) = min ||x|| − n/π
O (n) = max ||x|| −
x∈A
/ n
Simuler ces valeurs lorsque n est grand. Que peut-on dire des fluctuations
par rapport à la dimension 1 ?
20
XI. Modèle d’Eden-Richardson
On considère une suite En de sous ensembles de Zd . Initialement, E1 = {0}, puis à
chaque instant n, chaque point ayant au moins un plus proche voisin dans En est
ajouté à En avec probabilité p (indépendamment des autres points).
1. Dans cette question, on considère le cas d = 1.
(a) Ecrire un programme qui simule l’évolution de En jusqu’à l’étape 100000.
(b) Montrer que l’ensemble des sites occupés est un intervalle d’entiers, puis
vérifier que
E(#En ) = 1 + 2p(n − 1)
(c) On écrit En = {Gn , · · · , Dn }. Donner la loi de Dn et expliquer pourquoi
on a
Dn
= p.
lim
n→∞ n
2. On se place désormais dans le cas d = 2.
(a) Réaliser une simulation dans le cas où p = 1, pour n = 100. Que
remarque-t-on ? Expliquer.
(b) Réaliser des simulations pour différentes valeurs de p. On pourra prendre,
par exemple, p = 0.1, 0.3, 0.5, 0.7, 0.9. Que remarque-t-on ? Commenter.
Pour l’un de ces p, on pourra réaliser un film/gif animé représentant la
croissance de En lorsque n croı̂t (à l’aide par exemple de la commande
xs2gif, voir l’aide de scilab).
(c) Pour p = 0.7, réaliser une simulation qui compte le nombre de points de
#E200
E100 , puis de E200 . Que vaut #E
? Expliquer pourquoi il est raisonnable
100
de penser que #En croı̂t proportionnellement à n2 .
3. On se place toujours dans le cas d = 2, et on s’intéresse à l’ensemble
En = {(x, y) ∈ En , x + y = n}.
(a) Pour x compris entre 0 et n, on note Zn (x) = 1 si (x, n − x) ∈ En , et
Zn (x) = 0 sinon. Montrer que Zn est une chaı̂ne de Markov, dont les
transitions sont données par :
P(Zn (x) = 0|Zn−1 (x − 1) = Zn−1 (x) = 0) = 1
P(Zn (x) = 0|Zn−1 (x − 1) = 1 ou Zn−1 (x) = 1) = 1 − p
P(Zn (x) = 1|Zn−1 (x − 1) = 1 ou Zn−1 (x) = 1) = p
(b) Simuler Zn pour p = 0.1, puis pour p = 0.9. Commenter.
4. On considère un arbre généalogique T construit de la façon suivante : à la
première génération, l’arbre ne comporte qu’un individu. À chaque génération,
chaque individu a un enfant avec probabilité p, deux avec probabilité p2 , et
aucun avec probabilité 1 − p − p2 . On note Tn le nombre d’enfants à la
génération n.
21
(a) Calculer E(T2 ). Montrer que E(Tn+1 |Tn = k) = (p + 2p2 )k. En déduire que
E(Tn ) = (p + 2p2 )n .
(b) En utilisant l’inégalité de Markov, montrer que P(Tn > 0) ≤ (p + 2p2 )n .
En déduire que si p < 1/2, la probabilité d’extinction de l’arbre vaut 1.
(c) Expliquer pourquoi on peut comparer #En et Tn , et en déduire que si
p < 1/2, En est vide à partir d’un certain rang.
(d) Vérifier ce résultat à l’aide de simulations. Pour quelles valeurs de p
semble-t-on avoir En non vide pour tout n ?
22
XII Bootstrap Percolation
Le Baron de Münchhausen, embourbé dans un marécage, se serait d’après la légende
tiré d’affaire en tirant sur ses propres attaches de bottes (bootstraps en anglais), ce
qui l’aurait bien entendu projeté en l’air. Depuis, le terme bootstrap désigne la façon
dont un système peut s’amorcer puis évoluer par lui-même à partir d’un état initial.
On se place sur Zd et on considère l’état initial où chaque point est présent (valeur
1) avec probabilité p, et absent (valeur 0) avec probabilité 1 − p. On suppose de
plus que tous ces évènements sont indépendants. On appelle une telle configuration
une percolation de paramètre p.
On considère la règle d’évolution suivante : à l’étape n, tous les points absents qui
ont une majorité (au sens large) de plus proches voisins présents deviennent
présents pour l’étape n + 1. On note Bn l’ensemble à l’étape n.
1. Dans cette question, on considère le cas d = 1.
(a) Écrire un programme qui simule le comportement de Bn sur l’intervalle
d’entiers [1, 1000].
(b) Décrire l’évolution depuis l’état initial. Que remarque-t-on ?
(c) On considère les suites Hi et Hi0 définies par récurrence de la façon
suivante.
H1 = inf{i ≥ 0, i ∈
/ B0 },
0
Hi = sup{k ≥ Hi , ∀j ∈ {Hi , · · · , k}, j ∈
/ B0 } pour i ≥ 1, et
0
0
Hi = sup{k > Hi , ∀j ∈ {Hi−1 + 1, · · · , k − 1}, j ∈ B0 } pour i > 1.
Que peut-on dire de {0, · · · , H1 − 1} ? de {Hi , · · · , Hi0 } ? de
{Hi0 + 1, · · · Hi+1 − 1} ?
(d) On note G1 = H1 , G0i = Hi0 − Hi + 1, Gi = Hi+1 − Hi0 . Vérifier que Gi est le
nombre de points absents dans chaque composante connexe de points
absents (la première peut être vide), et que G0i est le nombre de points
présents dans chaque composante connexe de points présents.
(e) Montrer que les Gi , i > 1 suivent une loi géométrique de paramètre 1 − p.
Montrer de même que les G0i , i ≥ 0 suivent une loi géométrique de
paramètre p. On remarquera aussi que G1 + 1 suit une loi géométrique de
paramètre 1 − p.
1
(f) En déduire que pour i 6= 1, E(Gi + G0i ) = p1 + 1−p
. Soit N le plus petit
0
entier tel que HN ≥ n ou HN ≥ n. En utilisant la loi des grands nombres,
montrer que
n
N= 1
1 + o(n).
+ 1−p
p
(g) Pour k ∈ N, donner la fonction de répartition de maxi=1..k G0i . Montrer que
maxi=1..N G0i est d’ordre ln(n).
23
(h) On appelle τn le temps de remplissage complet de l’intervalle [1, n].
Montrer que τn = maxi=1..N G0i /2. Réaliser un histogramme de τn /ln(n)
pour n = 10000 et commenter.
2. On se place maintenant dans le cas d = 2.
(a) Simuler le comportement de Bn dans le tore [1, 1000] × [1, 1000], avec
différentes valeurs de p. Commenter. Pour l’un de ces p, on pourra réaliser
un film/gif animé représentant la croissance de Bn lorsque n croı̂t (à l’aide
par exemple de la commande xs2gif, voir l’aide de scilab).
(b) Y a-t-il des valeurs de p pour lesquelles Bn ne finit pas par recouvrir le
tore tout entier ? Expliquer pourquoi on s’attend à ce que la probabilité de
l’évènement ”le tore entier est recouvert en un temps fini” soit croissante.
Simuler les valeurs de cette probabilité pour différentes valeurs de p.
(c) Réaliser des simulations pour différentes tailles de tore. La taille du tore
a-t-elle un effet sur la probabilité de la question précédente ?
3. On considère, pour d = 2, la modification suivante du modèle. L’initialisation
du modèle reste la même, mais un site (x, y) devient présent si trois au moins
des sites (x − 1, y), (x + 1, y), (x, y − 1), (x, y − 2), (x, y + 1), (x, y + 2) sont
présents.
(a) Simuler le comportement de Bn dans le tore, avec différentes valeurs de p.
(b) Commenter. Quelle est la différence avec la question précedente ?
24
XIII. Marcheurs Eulériens, Modèle du Rotor-Routeur uniforme ?
On considère le graphe Z2 , qu’on munit de flèches correspondant aux 4 directions
possibles depuis chaque point. À l’étape initiale, on attribue à chaque site l’une des
4 flèches, indépendamment et équiprobablement.
On suppose qu’on a un ordre sur les flèches (par exemple Nord-Est-Sud-Ouest).
On considère ensuite un marcheur qui part de l’origine. À chaque étape, le
marcheur fait un pas dans la direction de la flèche du site qu’il occupe puis modifie
la valeur de la flèche (du site qu’il vient de quitter) en suivant l’ordre indiqué
ci-dessus (Nord devient Est,..., Ouest devient Nord). On passe ensuite à l’étape
suivante. Ce marcheur est appelé marcheur Eulérien.
1. On considère un marcheur Eulérien, et on appelle Xn sa position au temps n.
(a) Écrire un programme qui simule la position de Xn et le champ des flèches
sur Z2 au fil du temps.
(b) Soit z ∈ Z2 . On note νn (z) = #{t ≤ n, Xt = z}. Si z1 et z2 sont deux
points voisins de Z2 , montrer que l’on a :
1
(νn (z1 ) − 3) ≤ νn (z2 ) ≤ 4(νn (z1 ) + 3)
4
(c) En déduire que l’ensemble des points visités une infinité de fois par Xn est
ou bien vide ou bien Z2 tout entier.
√
(d) En se plaçant dans rectangle assez grand, simuler ||Xn ||/ n. Que
remarque-t-on ?
√
(e) En supposant que ||Xn ||/ n tend vers 0, montrer que pour tout K > 0, il
existe un point visité au moins K fois.
(f) On suppose de plus que νn (0) ≥ 12 maxz∈Z2 νn (z) pour n assez grand.
Montrer qu’alors l’ensemble des points visités une infinité de fois par Xn
est Zd .
2. On s’intéresse à Xn = {z ∈ Z2 , νn (z) > 0}.
(a) Montrer que Xn est croissant et connexe. Simuler Xn en fonction de n. On
pourra réaliser un film/gif animé représentant la croissance de Xn lorsque
n croı̂t (à l’aide par exemple de la commande xs2gif, voir l’aide de scilab).
(b) Représenter les valeurs de νn sur Z2 . Que remarque-t-on ?
3. On considère un ensemble An qui évolue de la façon suivante. À chaque étape,
on lance un marcheur Eulérien de l’origine, et on le laisse évoluer jusqu’à ce
qu’il sorte de An . On appelle zn le premier point visité à l’extérieur de An et
on définit
An+1 = An ∪ {zn }.
On initialise à A1 = {0}. Attention, tous les marcheurs évoluent sur la même
configuration de flèches (et la modifient pour le prochain marcheur).
25
(a) Pourquoi le point zn existe-t-il toujours ?
(b) Écrire un programme qui simule An . Représenter An graphiquement et/ou
cinématiquement. Quelle forme prend An ?
(c) Représenter An en coloriant chaque point suivant la flèche qui l’occupe.
Discuter des motifs qui apparaissent.
(d) Que représentent les quantités :
p
n/π
x∈An
p
I (n) = min ||x|| − n/π
O (n) = max ||x|| −
x∈A
/ n
Simuler ces valeurs lorsque n est grand. Que remarque-t-on ?
4. On modifie la règle précédente : à chaque étape, on choisit uniformément un
point z ∈ An qui sera le point de départ du nouveau marcheur.
(a) Expliquer pourquoi la méthode du rejet est adaptée à ce choix. Comment
peut-on s’assurer qu’on ne rejette pas trop de points ?
(b) Écrire un programme qui simule An . Quelle forme prend-il ? Comparer
avec la question précédente.
26
XIV. Marche simple ?
On considère une marche aléatoire simple S sur Z : S0 = 0, la suite
{Xk = Sk+1 − Sk }k=0,1,... est IID et P(X1 = 1) = P(X1 = −1) = 1/2.
1. (a) Montrer que S est une chaı̂ne de Markov d’espace d’états Z. Quel est son
noyau de transition ? La chaı̂ne est-elle irréductible, apériodique ?
(b) Exprimer P(S2k = 0), P(S2k+1 = 0) en fonction de k (on dénombrera
l’ensemble des trajectoires qui prennent la valeur 0 au temps 2k, resp.
2k + 1).
(c) En utilisant la formule de Stirling, montrer alors que
√
lim πnP(S2n = 0) = 1.
n→∞
(d) Vérifier numériquement le calcul de la question précédente.
P
2. Pour n ∈ {1, 2, . . .} on appelle Ln = ni=0 1Si =0 la variable aléatoire qui
compte le nombre des visites en zéro jusqu’au temps n.
(a) Calculer E[Ln ], puis trouver ` tel que
√
lim E[Ln ]/ n = `.
n→∞
Vérifier numériquement.
(b) Montrer que
E[L2n ]
=
n
X
P(Si = 0) + 2
i=0
X
P(Si = Sj = 0).
0≤i<j≤n
(c) Montrer que pour 0 ≤ i < j ≤ n,
P(Si = Sj = 0) = P(Si = 0)P(Sj−i = 0),
et en déduire que
Z r
1 1 1−x
1 X
P(Si = Sj = 0) −→
dx,
n→∞ π 0
n 0≤i<j≤n
x
Déterminer alors la limite de E
h
L2n
n
i
, puis vérifier numériquement.
√
(d) Etudier numériquement le comportement de Ln / n lorsque n → ∞.
Essayer de déterminer la loi de la variable limite Y . Sur la base de
l’observation numérique, de quel type de convergence s’agit-il ?
3. Dans cette partie on cherche à étudier le comportement de la marche sous la
probabilité P(·| S2n = 0).
Pn−1
On introduit la variable Tn := k=0
1{Sk +Sk+1 >0} qui donne le temps passé
dans le demi-plan positif par la marche lors de ses n premiers pas.
27
(a) Tracer un histogramme de la loi de T2n sous P(·| S2n = 0), en utilisant une
méthode du rejet, pour n = 50, 100, 200, ..., 1000.
(b) Remarquer que lorsque S2n = 0, la marche effectue forcément n pas vers le
haut et n pas vers le bas lors de ses 2n premiers pas. Il suffit donc de
choisir les indices des pas effectués vers le haut pour simuler une
trajectoire de la marche sous P(·| S2n = 0). Tracer alors l’histogramme de
T2n sous P(·| S2n = 0) pour n = 104 , 105 , 106 .
(c) En utilisant la méthode de la question précédente, représenter
grpahiquement quelques dizaines de trajectoires de { √Skn , k = 1, ..., 2n} sous
P(·| S2n = 0), pour n = 107 . Tenter alors d’expliquer la forme de
l’histogramme de T2n sous P(·| S2n = 0).
4. On prend maintenant en considération une suite IID {ηj }j=1,2,... de variables à
valeurs dans {1, 2, .P
. .}, avec P(η1 = k) = c/k 3/2 . On pose τ0 = 0 et, pour
N = 1, 2, . . ., τN = N
j=1 ηj . Finalement on introduit Nn := max{j : τj ≤ n}.
√
Etudier Nn / n pour n grand (voyez-vous un lien avec la partie 2 ?).
28
XV. Modèle de génétique, sans et avec mutations ? On considère un modèle de
génétique pour une partie spécifique d’ADN mitochondrial.
• Chaque génération compte exactement M individus féminins. On numérote les
individus de chaque génération de 1 à M . Le i-ème individu de la g-ème
génération est noté (g, i).
• Chaque configuration de la partie spécifique d’ADN mitochondrial que l’on
considère est appelée un allèle. On numérote les allèles distincts {1, 2, 3, · · · }. On
note A(g, i) l’allèle porté par le i-ème individu de la g-ème génération.
On suppose de plus qu’initialement, pour un certain K0 ∈ {0, ..., M }, les K0
premiers individus sont porteurs de l’allèle 1, et les M − K0 derniers porteurs de
l’allèle 2.
• Pour tout g ≥ 1, l’individu (g, i) choisit, indépendamment de tous les autres
choix, et uniformément au hasard, son unique mère m(g, i) parmi les M individus
de la génération g − 1.
• Dans le modèle sans mutation, l’allèle porté par l’individu (g, i) est exactement
celui porté par sa mère à la génération g − 1. Dans ce cas on a donc pour tout
g ≥ 1, et pour tout i ∈ {1, ..., M }, A(g, i) = A(m(i)).
• Dans le modèle avec mutation, on fixe p ∈ (0, 1). L’allèle porté par l’individu
(g, i) est,
– avec probabilité 1 − p, exactement celui porté par sa mère m(g, i).
– avec probabilité p, un nouvel allèle qui n’a été jusqu’à présent porté par aucun
individu.
1. Dans cette partie on considère le modèle sans mutations. On note alors
N1 (g) = #{i : A(g, i) = 1}, N2 (g) = #{i : A(g, i) = 2}.
Tfixation := inf{g ∈ N : max(N1 (g), N2 (g)) = M },
Afixation := 1 × 1{N1 (g)=M } + 2 × 1{N2 (g)=M } .
(a) Combien d’allèles sont présents dans la population à la génération Tfixation ?
Quel est l’allèle porté par le i-ème individu de la génération Tfixation ?
Que se passe-t-il aux générations suivantes ?
(b) Que vaut N1 (0) ? Montrer que N1 (1) ∼ Bin(M, K0 /M ).
Calculer E[N1 (1)] en fonction de K0 .
(c) Soit g ≥ 1, k ∈ {0, ..., M }. Sachant N1 (g − 1) = k, quelle est la loi de
N1 (g) ?
Calculer
E[N1 (g) | N1 (g − 1) = k].
En déduire que pour tout g ≥ 1,
E[N1 (g)] = E[N1 (g − 1)].
29
(d) Soit l’événement Eg := { tous les individus de la génération g choisissent
exactement la même mère à la génération g − 1}. Calculer P(Eg ). En
S
déduire P( N
g=1 Eg ).
S
Expliquer pourquoi {Tfixation ≤ N } ⊂ N
g=1 Eg .
(e) Evaluer numériquement l’espérance, puis la loi de Tfixation /M (on tracera
un histogramme).
(f) Evaluer numériquement P(Afixation = 1), pour différentes valeurs de K0 , M .
Que remarque-t-on ?
(g) Représenter, pour M = 100, 1000, 10000 des trajectoires de
1
N1 (bM tc), t ∈ [0, Tfixation /M ]
M
2. Dans cette partie on considère le modèle avec mutations. On note alors µ(g) le
nombre de mutations effectuées jusqu’à (et incluant) la génération g. On note
par ailleurs Gmut la première génération où une mutation a été effectuée.
On note d’autre part N (g) le nombre d’allèles présents à la génération g.
(a) Quelle est la loi de µ(g) en fonction de p, g, M ?
(b) Quelle est la loi de Gmut ?
(c) Lorsque p =
λ
,
M2
déterminer la limite de Gmut /M lorsque M → ∞.
(d) Vérifier numériquement les questions précédentes.
(e) Simuler une trajectoire de N (g), pour M = 100, 200, 500, 1000, 2000,
K = M/2, p = λ/M 2 , et différentes valeurs de λ. Que remarque-t-on ?
30