Université Denis Diderot Paris 7 I. Mod`eles de populations
Transcription
Université Denis Diderot Paris 7 I. Mod`eles de populations
Université Denis Diderot Paris 7 I. Modèles de populations. ? Un individu de la génération n de notre population est noté par u, où u est un n-uplet d’entiers. La concaténation de u = (u1 , ..., un ) et v = (v1 , ..., vp ) est notée uv = (u1 , ..., un , v1 , ..., vp ). Le nombre de descendants de u est noté ξu , et on suppose les ξu i.i.d, ∼ Poisson(λ). Précisément, on part, à la génération 0, d’un unique ancêtre, noté ∅. Ses descendants sont notés (1), (2), ..., (ξ∅ ). De même, les descendants d’un individu u sont u(1), u(2), ..., u(ξu ). L’ensemble des individus de notre population est noté T , et u ∈ T ⇒ u(i) ∈ T ssi i ≤ ξu . On note Zn le nombre d’individus à la génération n, i.e. Zn = #{u ∈ T : |u| = n}. Enfin, on définit l’instant d’extinction E de la population par E := inf{n ≥ 0, Zn = 0}. 1. (a) Ecrire un programme qui simule l’évolution de la population au cours des 15 premières générations, et ce pour λ = 0.1, 0.5, 0.9, 1, 1.1, 1.5, 2, 3. Que remarque-t-on ? (b) Ecrire un programme qui représente les 10 premières générations de l’arbre T , à nouveau pour λ = 0.1, 0.5, 0.9, 1, 1.1, 1.5, 2, 3. (c) Calculer P(Zn+1 = j | Zn = k), pour j, k ∈ N. Expliquer alors pourquoi (Zn )n≥0 est une chaı̂ne de Markov (attention : l’espace d’état de la chaı̂ne est N, qui n’est donc pas un espace d’état fini). Que se passe-t-il lorsque cette chaı̂ne touche la valeur 0 ? (d) Calculer X jP(Zn+1 = j | Zn = k). En déduire que si Gn (x) := E[xZn ], pour n ≥ 0, x ∈ [0, 1], alors Gn+1 (x) := Gn (exp(λ(x − 1))), ∀n ≥ 0. Représenter alors, pour différentes valeurs de λ, les graphes de G1 , G2 , ..., G10 , puis ceux de G10 , G20 , ..., G100 , puis ceux de G100 , G200 , ..., G1000 , et enfin ceux de G1000 , G2000 , ..., G10000 . Que remarque-t-on ? 2. On suppose désormais que λ < 1, et on note E = inf{n ≥ 0 : Zn = 0} le temps d’extinction de la population. 1 (a) On note Y = PE n=0 Zn la population totale. Vérifier par simulation que P (Y = k) = e−kλ (λk)k−1 /k!, k ≥ 1. (b) Estimer numériquement E[E]. Tracer le graphe de E[E] en fonction de λ, pour λ ∈ (0, 1). 3. On suppose désormais qu’à la génération n ≥ 1, la population voit arriver Yn immigrants, avec Yn indépendant de Zn et Yn ∼ Poisson(µ). Le nombre de descendants d’un individu, qu’il soit migrant ou non, reste ∼ Poisson(λ). (a) Reprendre les simulations de 1.a, 1.b, pour ce modèle avec immigration, et pour différentes valeurs de λ, µ. (b) Montrer que Gn+1 (x) = exp(µ(x − 1))Gn (exp(λ(x − 1))). Tracer comme plus haut, les graphes de G1 , ..., G10000 , pour différentes valeurs de λ, µ. Que remarque-t-on ? 4. On cherche ici à modéliser l’évolution de populations sur 2 ı̂les. On note T1 et T2 ces populations, toutes deux issues d’un unique ancêtre, et on suppose ici que λ1 = 1.1, λ2 = 0.9. A chaque génération n ≥ 1, on suppose que chaque individu de la population 1, indépendamment des autres, migre vers l’ı̂le 2 avec probabilité p1 . De même chaque individu de la population 2 migre vers l’ı̂le 1 avec probabilité p2 . (i) On note Zn le nombre d’individus présents à la génération n sur l’ı̂le i, i = 1, 2. (a) Reprendre les simulations de 1.a, 1.b (on représentera les deux populations, puis les 2 arbres), pour différentes valeurs de p1 , p2 . (1) (2) (1) (2) (b) Calculer Gn+1 , G(n+1) en fonction de Gn , Gn . Tracer les graphes successifs, comme plus haut, et discuter. 2 II. Coalescent. ? 1. On considère un modèle de coalescence. Au temps initial T0 = 0 sont présents N amas. On introduit des variables i.i.d, ei,j ∼ exp(λN ), 1 ≤ i < j ≤ N . Au temps T1 := inf{ei,j , 1 ≤ i < j ≤ N }, les amas i et j tels que T1 = ei,j coagulent, au sens où ils se joignent pour ne former qu’un seul et même amas, que l’on choisit de noter i (il n’y a donc plus d’amas j à partir du temps T1 ). Au temps T2 := inf{ek,` , 1 ≤ k < ` ≤ N, k 6= j, ` 6= j}, ce sont les amas k et ` tels que T2 := ek,` qui coagulent pour ne former qu’un seul amas, noté k. On continue de la sorte jusqu’à ce qu’il n’y ait plus qu’un seul amas. On note Tcoag le temps nécessaire à ce que tous les amas aient coagulé en un seul. (a) Combien d’amas reste-t-il au temps TN −2 ? Montrer que les variables {Tk+1 − Tk , k = 0, ..., N − 2} sont indépendantes ? Sont-elles identiquement distribuées ? (b) Exprimer, en fonction de N et λN , la transformée de Laplace de Tcoag . Que vaut l’espérance de Tcoag ? Lorsque λN = 1, quelle est la limite de cette espérance lorsque N → ∞ ? (c) Tracer, pour λN = 1, et N = 2, 3, ...10 puis N = 20, 30, ..., 100, N = 200, 300, ..., 1000 le graphe du nombre d’amas en fonction du temps. Que remarque-t-on ? Faire de même lorsque λN = 1/N . Vérifier numériquement les calculs de la question précédente. 2. On considère le modèle de génétique pour l’ADN mitochondrial suivant : chaque génération compte exactement M individus féminins. La génération 0 est la génération actuelle, et on va s’intéresser aux lignées ancestrales. L’individu i de la génération 0 choisit, indépendamment des autres et uniformément au hasard, son unique mère m1 (i) parmi les M individus de la génération −1. La mère de mn (i) (de la génération −n) est choisie uniformément au hasard à la génération −n − 1, et est notée mn+1 (i). La lignée ancestrale du i-ème individu de la génération n est la suite (i, m1 (i), m2 (i), ...). (a) Si mk (i) = mk (j), que peut-on dire de mk+1 (i) et mk+1 (j) ? (b) Soit Gi,j le nombre de générations qu’il faut remonter pour que les lignes ancestrales de i et j se rencontrent. Quelle est la loi de Gi,j ? Trouver la limite en loi de M −1 Gi,j lorsque M → ∞. 3 (c) Soit N ≤ M fixé. On considère les N premiers individus de la génération actuelle, et les (N ) lignées ancestrales correspondantes. On note TP RAC le nombre de générations qu’il faut remonter pour découvrir le plus récent ancêtre commun de ces individus, i.e. le nombre de générations qu’il faut remonter pour que ces N lignées ancestrales aient fusionné en une seule. (2) i. Donner la loi de TP RAC . ii. Montrer par ailleurs que si N > 2, et si τ est la première génération à laquelle il faut remonter pour qu’au moins deux des N lignées se rencontrent, Xτ est le nombre de lignées ancestrales restantes après cette première rencontre, alors sachant {τ = k}, {Xτ = j} on a (loi) (N ) (j) TP RAC = k + TP RAC . Décrire alors la loi de τ , et de Xτ en fonction de N, M . iii. Quelle est la limite de la loi de Xτ pour N fixé et M → ∞. iv. En déduire la limite en loi de TP RAC /M toujours pour N fixé, M → ∞ v. Soit L1 , L2 , L3 , ... le nombre de lignées qui se restent après avoir remonté 1, 2, 3, ... générations, lorsque N = M . Evaluer numériquement limM →∞ E[Li /M ], i = 1, 2, 3, .... Que remarque-t-on ? (d) Vérifier par une simulation les calculs des questions précédentes. (e) Tracer, pour différentes valeurs de N , et pour M = 100000 le graphe du nombre de lignées ancestrales encore présentes à la génération −bM tc, en fonction de t. Comparer avec les graphiques obtenus pour le modèle de la question 1. 3. Dans cette partie on reprend le modèle de la partie précédente, mais cette fois on va regarder les générations à venir {0, 1, 2, · · · }. Supposons qu’à la génération 0 tous les individus sont porteurs d’un ADN mitochondrial distinct, et qu’il n’y a aucune mutation (i.e. l’ADN mitochondrial d’un individu donné est exactement l’ADN maternel). Combien de générations sont nécessaires pour que seul l’un de ces ADN soit présent dans la population ? Tracer, pour différentes valeurs de M , les graphes du nombre d’ADN mitochondriaux distincts présents dans la population à la génération bM tc en fonction de t. 4 III. Marches branchantes et sélection. ? Comme en I, un individu de la génération n de notre population est noté par u, où u est un n-uplet d’entiers. La concaténation de u = (u1 , ..., un ) et v = (v1 , ..., vp ) est notée uv = (u1 , ..., un , v1 , ..., vp ). Comme en I, le nombre de descendants de l’individu u est ξu , et les ξu sont i.i.d. (mais ici la loi de ξu ne sera pas Poisson). On s’intéresse à la position de nos individus dans l’espace. La particule u de la génération n est situé à la position Xu ∈ R. Les positions de ses descendants u(1), ..., u(ξu ) sont choisies de façon i.i.d (et indépendantes des {ξu , u ∈ T }), de sorte que pour tout 1 ≤ i ≤ ξu , ( 1 avec proba 1/2 Xu(i) − Xu = . −1 avec proba 1/2 1. Dans cette partie on suppose que ξu ≡ 2 pour tout u ∈ T . (a) Tracer le graphe des positions des particules sur 15 générations. (b) Soit la particule u = (1, 1, ..., 1), avec |u| = n. Montrer que 1 (Xu + n) ∼ Bin(n, 1/2). En déduire le comportement asymptotique de 2 Xu , lorsque n → ∞. (c) Soient Y1 , ..., Y2n des copies indépendantes de Xu , et Zn = max(Y1 , ..., Y2n ). Etablir que pour tout x < 1 fixé, lim P(Zn ≥ nx) = 1. n→∞ Déterminer alors (au sens de la convergence en probabilité) Zn . n→∞ n lim Vérifier numériquement. (d) (d) Soit Xn la position de la particule située la plus à droite des particules de la n-ème génération, i.e. Xn(d) = max{Xu , |u| = n}. Déterminer alors numériquement (d) Xn lim . n→∞ n Pourquoi le résultat est-il différent de celui obtenu pour Zn /n ? (g) (e) Que dire de Xn , la position de la particule la plus à gauche des particules de la n-ème génération ? 5 2. (a) On suppose que ξu ≡ 3 pour tout u ∈ T . Reprendre la question (d) de la partie précédente, qu’observe-t-on ? Expliquer. (loi) (b) Dans cette partie on suppose que ξu = Y + 1, où Y ∼ Poisson(λ) avec λ > 0. Reprendre la question (d) de la partie précédente. Qu’observe-t-on ? 3. Dans cette partie on suppose comme en 1 que ξu ≡ 2 pour tout u ∈ T . Mais on ajoute la contrainte suivante : dès que notre population totale dépasse N , alors on ne garde que les N particules les plus à droite, et on supprime les autres. (a) Simuler la position des particules au cours du temps, avec N = 10, 20, ..., 100, 200, pour 1000 générations. (d) (b) On note Yn la position de la particule la plus à droite dans ce nouveau (d) modèle. On ne cherchera pas à calculer la loi de Yn . (d) (d) Estimer numériquement l’écart entre Yn et Xn (position de la particule la plus à droite pour le modèle de 1.) 6 IV. Mélange d’un jeu de cartes. ? On dispose d’un jeu de r cartes initialement dans une pile. On a numéroté les cartes de 1 à r : la carte numéro 1 est celle initialement en haut du tas. On arrange les cartes en prenant celle du dessus et en l’insérant uniformément en k entre la k-ème et la k + 1-ème, ce qu’on appelle la k-insertion. La 1-insertion ne change rien et la r-insertion met la carte tout en bas. Une configuration du paquet sera donc décrite par une permutation σ ∈ Sr avec σ(i) qui note la position de la carte initialement en i. Faire une k-insertion revient à σ 7→ (k, k − 1, . . . , 1)σ. En effet toutes les cartes avant la k-ème (en dehors de la premiere) sont remontées de 1 cran. Les insertions sont i.i.d. choisies uniformement sur C = {C1 , . . . , Cr } avec Ci = (i, i − 1, . . . , 1). On peut decrire l’arrangement des cartes par Xn+1 = 1 Y i X0 . i=n+1 1. (a) Montrer que (Xn ), n ≥ 0 est une chaine de Markov sur S(r), en donner les probabilités de transition. (b) Montrer qu’elle est irréductible, apériodique et récurrente. Identifier sa loi invariante. (c) Notons Ti les durées entre deux remontées successives de la carte initialement en bas du tas : posons Yn = Xn (r). k−1 X Tk = min{n ≥ 1, Yn = r − k} − ( Ti ); T0 = 0. i=0 Simuler les variables Ti pour r = 3, 4, 5, 10, 20, 52, puis T = T1 + . . . + Tr−1 . On tracera les histogrammes correspondants. (d) Quelle est la position de la carte initialement au bas du tas aux temps T1 , T1 + T2 , T1 + T2 + T3 , . . . , T1 + · · · + Tr−1 ? Calculer E[T ] et vérifier le calcul grâce à la simulation de la question précédente. (e) Vérifier par simulation que pour tout n ≥ 0, XT +1+n suit la loi uniforme sur Sr . 2. Dans cette partie r = 3, 4, 5. On note Pn la loi de Xn , et π la loi invariante trouvée en 1.b. Représenter, grâce à une simulation, le graphe de 1 X |Pn (σ) − π(σ)|. n→ 2 σ∈S r Que remarque-t-on ? 7 3. Suivons à présent les positions successives de l’une des cartes de notre paquet au cours de notre mélange. On note (Yn , n ≥ 0) la suite de ces positions (de sorte que si Y0 = i, on suit la carte qui se trouve initialement en i-ème position). (a) Montrer que (Yn ), n ≥ 0 est une chaine de Markov sur {1, ..., r}, en donner les probabilités de transition. (b) Montrer qu’elle est irréductible, apériodique et récurrente. Identifier sa loi invariante. (i) (c) On note Qn la loi de Yn lorsque Y0 = i, et π̃ la loi invariante. Représenter, grâce à une simulation, les graphes de r 1 X (i) n→ |Q (k) − π̃(k)|, 2 k=1 n pour i = 1, ..., r. Que remarque-t-on ? (d) Au regard des simulations de la question précédente, au bout d’environ combien d’insertions successives semble-t-on pouvoir affirmer qu’un jeu de 52 cartes est bien mélangé ? Quel lien peut-on faire avec les résultats des questions 1.(c.d.e) ? 8 V. Mélange bis. ? Comme en IV, on va considérer un modèle de battage de cartes, mais celui-ci est un peu plus proche de la réalité. A nouveau on considère un jeu de r cartes. Une étape de notre mélange consiste en la démarche suivante : • On choisit M ∼ Bin(r, 1/2), et on coupe le jeu au niveau de la M -ème carte (i.e. on sépare les M premières cartes des r − M dernières). • On ”re-mélange” nos 2 paquets (on préserve, bien sûr l’ordre relatif dans chacun des 2 sous-paquets) en choisissant uniformément parmi les Mr façons de le faire. On note (Xn , n ≥ 0) la suite de permutations de {1, ..., r} obtenue. Une sous-suite croissante de longueur n d’une permutation σ ∈ Sr est un ensemble d’indices i1 < ... < in tels que σ(i1 ) < σ(i2 ) < · · · < σ(in ). Une plus longue sous-suite croissante (p.l.s.s.c.) de longueur n est un tel ensemble d’indices maximal au sens de l’inclusion (i.e. si j ∈ (ik , ik+1 ), σ(j) ∈ / (σ(ik ), σ(ik+1 ))). Par exemple la permutation 1 2 3 4 5 6 7 8 9 10 4 7 1 8 10 2 6 3 9 5 possède, par exemple, les trois p.l.s.s.c. suivantes : σ(1) = 4 < σ(2) = 7 < σ(4) = 8 < σ(5) = 10, σ(3) = 1 < σ(6) = 2 < σ(8) = 3 < σ(10) = 5 σ(7) = 6 < σ(9) = 9. 1. (a) Montrer que (Xn ), n ≥ 0 est une chaine de Markov. Montrer que son noyau de transition vérifie P (σ1 , σ2 σ1 ) = P (Id, σ2 ) pour tous σ1 , σ2 ∈ Sr , et que r+1 2r si σ = Id, 1 P (Id, σ) = si σ possède exactement 2 p.l.s.s.c., 2n 0 sinon. (b) Montrer que (Xn ) est irréductible, apériodique et récurrente. Identifier sa loi invariante. (c) Ecrire un programme qui simule ce mélange de cartes. 2. Soit la procédure suivante : à chaque carte du jeu on attribue l’étiquette ξi ∼ Ber(1/2) ; on replace alors les cartes étiquetées 0 en haut du paquet (en respectant leur ordre relatif). On note (Yn , n ≥ 0) la suite de permutations de {1, ..., r} obtenue. 9 (a) Montrer que (Yn ), n ≥ 0 est une chaine de Markov. Montrer que son noyau de transition Q vérifie, pour tous σ1 , σ2 ∈ Sr , Q(σ2 , σ1 ) = P (σ1 , σ2 ). Expliquer le lien entre les chaı̂nes X et Y . (b) Ecrire un programme qui simule la chaı̂ne Y . 3. (a) Dans cette partie uniquement on ne considérera que r = 3, 4, 5. On note Pn la loi de Xn , et π la mesure invariante trouvée en 1.b. Représenter le graphe de 1 X n→ |Pn (σ) − π(σ)|. 2 σ∈S r Que remarque-t-on ? (b) Même question avec Qn , loi de Yn . 4. On admet que X σ∈Sr r 1X |Pn (σ) − π(σ)| = E(r, k) 2 k=1 2n +r−k k 2nr 1 − , r! avec E(1, 1) = 1, E(1, k) = 0 pour tout k 6= 1, E(r, k) = (r − k + 1)E(r − 1, k − 1) + kE(r − 1, k) pour tous r ≥ 2, k ≥ 1. (a) Ecrire un programme qui calcule les valeurs des E(r, k), pour r = 10, 52, 100, et k ∈ {1, ..., r}. (b) Utiliser la formule admise pour représenter le graphe de n→ 1 X |Pn (σ) − π(σ)|, 2 σ∈S 10 à nouveau pour r = 3, 4, 5 puis pour r = 10, 52 et enfin pour r = 100. Discuter. 10 VI. Marche λ-biaisée sur un arbre binaire. ? On considère un arbre binaire T de hauteur N ∈ N∗ . On pourra par exemple considérer qu’un tel arbre est constitué par • un premier noeud que l’on note ∅ et qu’on place à hauteur nulle. Ce noeud n’a pas de parent, on l’appelle donc ”racine” de l’arbre. • deux noeuds à hauteur 1, que l’on note 1 et 2, et qui sont chacun directement reliés à la racine. • A hauteur 2 on compte 4 noeuds. Les deux descendants issus du noeuds 1 seront notés 11, 12, tandis que les deux descendants de 2 seront notés 21, 22. • pour tout k ∈ {1, ..., h − 1} on compte 2k noeuds à hauteur k. Les deux descendants du noeud u de hauteur k − 1 sont notés u1, u2. • A la hauteur N , on compte 2N noeuds, mais ils n’ont pas de descendants (on parlera donc de ”feuilles” pour les noeuds situés à la hauteur h). Comme précédemment les deux noeuds descendantes d’un noeud u de hauteur h − 1 sont notées u1, u2. On notera que la hauteur d’un noeud u est tout simplement le nombre de chiffres utilisés pour écrire u. On note hauteur(u) = |u|. Un tel noeud possède un unique parent noté p(u), que l’on obtient à partir de u en effaçant le dernier chiffre. On fixe alors λ ∈ (0, 1) et on considère alors la marche aléatoire λ-biaisée (Xn , n ≥ 0) sur cet arbre, démarée en la racine de l’arbre. Cette marche est une chaı̂ne de Markov à valeurs dans T . Au temps n + 1, X saute de Xn vers l’un des plus proches voisins de Xn choisis au hasard de la façon suivante : • si Xn = ∅, alors ∅ avec probabilité λ Xn+1 = Xn+1 = 1 avec probabilité (1 − λ)/2 . Xn+1 = 2 avec probabilité (1 − λ)/2 • Si Xn = u, avec 1 ≤ |u| ≤ N − 1, alors p(Xn ) avec probabilité λ Xn+1 = Xn+1 = Xn 1 avec probabilité (1 − λ)/2 . Xn+1 = Xn 2 avec probabilité (1 − λ)/2 • Si |Xn | = N alors Xn+1 = p(Xn ). 1. (a) Montrer que (Xn , n ≥ 0) est irréductible, apériodique, et calculer sa distribution invariante en fonction de λ et N . (b) Simuler (Xk , 0 ≤ k ≤ n) et vérifier les calculs de la question précédente, pour des valeurs de N ∈ {1, ..., 10}, et pour λ = 1/5, 1/3, 2/5, 1/2, 3/5, 4/5. (c) Montrer que (Yn := |Xn |, n ≥ 0) est une chaı̂ne de Markov, calculer son noyau de transition. Montrer que cette chaı̂ne est irréductible, apériodique, et calculer sa distribution invariante en fonction de λ, N . Que vaut E0 (τ0+ ), lorsque τ0+ = inf{k ≥ 1 : Yk = 0} ? 11 (d) Simuler directement (Yn , n ≥ 0). Estimer E0 [τ0+ ]. (e) On note τj = inf{k ≥ 0 : Yk = j}, et pk := Pk (τ0 < τN ). Que valent p0 , pN ? Montrer que pour tout k ∈ {1, ..., N − 1}, pk = λpk−1 + (1 − λ)pk+1 . Ecrire alors un programme qui calcule les différentes valeurs de pk , k ∈ {0, ..., N }, et tracer le graphe correspondant pour N = 1, 2, ..., 10, 20, ..., 100, 200, ..., 1000 et pour les valeurs de λ = 1/3, 0.4, 0.5, 0.6. (f) Vérifier les calculs de la question précédente à l’aide de simulations de la chaı̂ne (Yn , 0 ≤ n ≤ min(τ0 , τn )). 2. Dans cette partie on fixe λ = 1/3 (cas de la marche simple sur l’arbre). (a) Soit τu = inf{k ≥ 0 : Xk = u}. Pour u une feuille de l’arbre, simuler la loi de τu /(2N +1 N ). (b) On s’intéresse alors au temps nécessaire pour que la marche (Xn )n≥0 soit passée au moins une fois par tous les noeuds de l’arbre : τcouv = inf{n ≥ 0 : ∀u ∈ T ∃k ≤ n : Xk = u}. On rappelle que notre marche est issue de la racine de l’arbre. Simuler pour N = 3, 4, ..., 10, 15, 20 la loi de τcouv /(2N +1 N 2 ). Que remarque-t-on ? 3. Par simulation, et pour les mêmes valeurs de N , estimer les quantités τu , τcouv définies en 2, mais cette fois pour λ = 1/5, 2/5, 1/2, 3/5, 4/5. Discuter suivant ces valeurs de λ. 12 VII. Temps d’atteinte, temps de couverture sur le tore. On considère une marche aléatoire simple symétrique X = {Xn }n=0,1,... dans TdN := {1, 2, . . . , N }d . On précise que sur le tore TdN , x, y ∈ TdN sont voisins lorsque, pour un i ∈ {1, ..., d}, • xj = yj pour tout j 6= i • |xi − yi | = 1 ou xi = 1, yi = N ou xi = N, yi = 1. On suppose que, sous Py la chaı̂ne de Markov X démarre au point y. Au temps n + 1 elle saute sur l’un des 2d sites voisins de Xn avec probabilité 1/(2d). On va s’intéresser aux temps d’atteinte et au temps de couverture : pour x ∈ TdN , τx := inf{n ≥ 0 : Xn = x}, τcouv := inf{n : pour tout x ∈ TdN il existe j ≤ n tel que Xj = x} 1. Généralités (d quelconque). Montrer que X est irréductible. Est-elle apériodique ? Quelle est la loi invariante π de X ? La loi de Xn converge-t-elle vers la loi invariante ? 2. Le cas d = 1. (a) Fixons tout d’abord x = 1. On note h(y) = Ey [τ1 ]. Que vaut h(1)? Montrer que pour tout y ∈ {2, ..., N − 1} on a 1 1 h(y) = 1 + h(y − 1) + h(y + 1). 2 2 Trouver des équations similaires reliant h(1) à h(2), h(N ) d’une part, et h(N ) à h(1), h(N − 1) d’autre part. A quoi ressemble le graphe de h ? (b) Que vaut E1 [τ1+ ] ? Comment cette quantité est-elle relié à h(2), h(N ) ? Donner une formule explicite de h en fonction de N . Que vaut max x∈{1,...,N } h(x)? Pour quelle valeur de x ce maximum est-il réalisé ? (c) Pour x ∈ {1, ..., N } quelconque, expliciter hx telle que hx (y) = Ey [τx ]. (d) Vérifier les calculs des questions précédentes par des simulations de {Ey [τx ], y ∈ {2, ..., N }, et ce pour différentes valeurs de x et de N . (e) Montrer que τcouv ≥ 2 max x∈{1,...,N } Ex [τ1 ]. (f) (*) Montrer que, E[τcouv ] ≤ 2(N 2 + N ). On pourra considérer le temps qu’il faut pour aller de 1 à N/2, et introduire une certaine variable géométrique. 13 (g) Estimer, par simulation, E[τcouv ]/N 2 . 3. Le cas d = 2 Etudier numériquement la distribution de la variable aléatoire ζN := τcouv . N 2 (log N )2 pour différentes valeurs de N . On estimera en particulier E[ζN ], Var[ζN ], par exemple pour N = 5, 10, 20, 40, . . .. Que semble-t-il se passer lorsque N croit ? 4. Le cas d = 3 Etudier numeriquement la distribution de la variable aléatoire ζN := τcouv N 3 (log N ) . On pourra choisir N = 5, 10, 20, . . .. Estimer en particulier E[ζN ], Var[ζN ]. Que semble-t-il se passer lorsque N croı̂t ? 14 VIII. Modèle d’opinion. ? On considère le modèle suivant, introduit initialement pour modéliser l’évolution d’opinions. On se place sur le graphe complet à N sommets que l’on note {1, ..., N }. Dans ce graphe, tous les noeuds sont voisins de chacun des autres noeuds. En chaque noeud se situe une personne qui possède en tous temps une certaine opinion. Pour faire simple on suppose qu’il n’y a que deux opinions, que l’on note 0 et 1. L’opinion au temps t de la personne située au noeud i est notée ξt (i). Les opinions initiales sont tirées indépendamment, avec ξ0 (i) ∼ Ber(p), pour un certain p ∈ (0, 1) fixé. Le mécanisme d’évolution est le suivant. A chaque temps discret t ∈ N∗ , on tire une personne, disons j, uniformément au hasard parmi les N . La personne j décide alors de consulter une autre personne, disons k 6= j, qu’elle choisit uniformément au hasard parmi les N − 1 personnes restantes, et adopte son opinion, quelle qu’elle soit. Les opinions des personnes autres que j restent inchangées. Autrement dit, au temps t ∈ N∗ , on a ξt (`) = ξt−1 (`) ∀` 6= j. ξt (j) = ξt−1 (k), On dit qu’il y a consensus lorsque les N personnes partagent la même opinion. On note Y Y τconsensus := inf{t ∈ N : ξt (x) = 1 ou (1 − ξt (x)) = 1} x∈{1,...,N } x∈{1,...,N } 1. Généralités (a) Montrer que ξ = (ξt (x), x ∈ {1, ..., N }, t ∈ N) est une chaı̂ne de Markov à valeurs dans {1, ..., N }{0,1} . Quel est son noyau de transition ? (b) En observant que les deux cas de consensus sont absorbants, donner deux exemples de lois invariantes pour ξ. Quelle est l’hypothèse du théorème sur l’existence d’une unique mesure invariante qui est ici mise en défaut ? 2. Opinion majoritaire, opinion gagnante (a) Simuler ξt pour différentes valeurs de N, e.g.5, 10, 30, 100, ..., et estimer empiriquement, et pour différentes valeurs de t, e.g.0, 1, 5, 10, 20, 100, 200, 500, 1000, 10000, 100000, ..., la proportion d’opinion 1. Que remarque-t-on ? (b) Simuler la chaı̂ne ξ pour différentes valeurs de N, e.g.5, 10, 30, 100, ..., au moins jusqu’au temps de consensus. Estimer alors, en fonction de p, la probabilité que l’opinion 1 ”l’emporte” (i.e. le consensus s’établit sur l’opinion 1) 15 3. Temps de consensus (a) Estimer, par simulation, E[τconsensus ] en fonction de N , puis tracer le graphe de E[τconsensus ]/N 2 en fonction de N . (b) Fixons 1 ≤ k ≤ N . Pour être capable de déterminer les opinions des personnes {1, ..., k} au temps t, montrer qu’avec probabilité k(k − 1)/N 2 , il suffit de connaı̂tre l’opinion de k − 1 d’entre elles au temps t − 1, et qu’avec la probabilité complémentaire 1 − (k(k − 1))/N 2 on est en revanche obligé de connaı̂tre l’opinion de toutes ces personnes au temps t − 1. (c) Déduire de la question précédente que E[τconsensus ] = N 2 (1 − 1 ). N Vérifier que ce résultat est en accord avec les simulations ! 16 IX. Graphe aléatoire. ? On considère le graphe aléatoire suivant. Les noeuds sont {1, ..., N }, et chaque arête {(i, j), i 6= j, i, j ∈ {1, ..., N }} est, indépendamment des autres, présente avec probabilité pN ∈ (0, 1), et absente sinon. On dit que deux noeuds i, j ∈ {1, ..., N } sont voisins ssi l’arête (i, j) est présente. On dit que deux noeuds i, j sont reliés ssi il existe un chemin reliant i à j, c’est-à-dire s’il existe i0 = i, i1 , ..., ip−1 , ip = j tels que pour tout 0 ≤ k ≤ p − 1 les noeuds ik et ik+1 sont voisins. On parle de chemin élémentaire lorsque les noeuds empruntés sont tous distincts. La distance de i à j, notée d(i, j), est l’entier p minimal tel que i0 , i1 , ..., ip réalise un chemin de i à j. Lorsqu’il n’existe pas de tel chemin on pose d(i, j) = +∞. 1. Nombre d’arêtes total, nombre de voisins d’un noeud donné On note EN le nombre d’arêtes total du graphe, tandis que pour un noeud x, on note Dx le nombre de voisins de x (i.e. le nombre d’arêtes ayant pour sommet x, on parle aussi de degré). P (a) Que vaut x∈{1,...,N } Dx − 2EN ? (b) Dans les cas pN = 0, pN = 1, que peut-on dire de EN , et des Dx , x ∈ {1, ..., N } ? (c) Pour pN quelconque, quelle est la loi de EN ? Lorsque pN ∼N →∞ λ/N avec λ > 0, donner un équivalent de la moyenne de EN lorsque N → ∞. (d) Pour pN quelconque, quelle est la loi de Dx ? Si pN ∼N →∞ λ/N , montrer qu’alors Dx converge en loi vers une variable de Poisson de paramètre λ. (e) Vérifier les résultats des questions précédentes grâce à des simulations. 2. Explorer la composante de 1. La composante de 1, notée C1 , est l’ensemble des noeuds qui se trouvent à distance finie de 1. Autrement dit, dans C1 , on trouve 1, les voisins de 1, les voisins des voisins de 1, etc... (a) Ecrire un programme qui permet de simuler la taille #(C1 ) de la composante de 1. Estimer la loi, et en particulier l’espérance de #(C1 ), pour N = 10, 100, 1000, ..., et pour pN = λ/N en essayant différentes valeurs de λ ∈ R∗+ . Pour N = 1000, tracer le graphe de E[#(C1 )]/N en fonction de λ. Que remarque-t-on ? (b) Ecrire un programme qui calcule 1 X d(1, j). dmoy (1) = #(C1 ) j∈C 1 la distance moyenne de 1 aux noeuds de sa composante. Estimer la loi de dmoy (1) (et en particulier sa moyenne), pour différentes valeurs de N et λ. Pour N = 1000, tracer le graphe de dmoy (1) en fonction de λ. Discuter. 17 (c) Ecrire un programme qui calcule dmax (1) = max d(1, j). j∈C1 Estimer la loi de dmax (1) (et en particulier sa moyenne), pour différentes valeurs de N et λ. Comparer aux résultats de la question précédente. 3. Cycles dans la composante de 1. Un cycle de longueur p, est un chemin de longueur p qui boucle sur lui-même en n’empruntant au passage que des noeuds distincts. Sans perte de généralité, on pourra toujours considérer que ce chemin est démarré au noeud minimal. Précisément un cycle est exactement un chemin élémentaire (i1 , ..., ip ) tel que i1 et ip sont voisins, et de plus i1 = min1≤k≤p ik . (a) Montrer que si C1 ne possède aucun cycle, alors X Dx = 2#(C1 ) − 2. x∈C1 (b) Montrer que si C1 possède exactement k cycles distincts, alors X Dx = 2#(C1 ) − 2k − 2. x∈C1 (c) Déduire de la question précédente l’écriture d’un programme qui permet de déterminer le nombre de cycles de C1 . On estimera la loi et l’espérance de ce nombre pour différentes valeurs de N et de λ. 18 X. Agrégation limitée par diffusion interne On considère une suite An de sous-ensembles de Zd (où d est la dimension), qui croı̂t selon la règle suivante. À l’étape n, une particule est lancée à l’origine puis se déplace suivant une marche aléatoire simple (si d = 1, les probabilités d’aller à gauche et à droite valent 1/2 ; si d = 2, les probabilités d’aller au Nord, au Sud, à l’Est et à l’Ouest valent 1/4). La particule se déplace jusqu’à ce qu’elle sorte de An en un point Xn+1 . On définit alors : An+1 = An ∪ Xn . On initialise le modèle avec A0 = ∅ ou A1 = {0}. An est appelé l’agrégat à l’étape n. 1. Dans cette question, on considère le cas d = 1. (a) Écrire un programme qui simule l’évolution de l’agrégat jusqu’à l’étape 1000. (b) Expliquer pourquoi l’ensemble des sites occupés est un intervalle d’entiers. Quelle est sa longueur ? (c) On écrit An = {Gn , · · · , Dn }, où Dn et Gn sont respectivement les points les plus à gauche et à droite de l’agrégat. On pose Zn = Dn + Gn . Comment retrouve-t-on Dn et Gn à partir de Zn ? Montrer que (Zn )n≥0 est une chaine de Markov ( attention : l’espace d’états de la chaı̂ne est N, qui n’est donc pas un espace d’états fini ). (d) En comparant la situation au problème de la ruine du joueur, montrer que n+2−i 2(n + 2) n+2+i = i − 1|Zn = i) = 2(n + 2) P(Zn+1 = i + 1|Zn = i) = P(Zn+1 Représenter l’évolution des valeurs de pn = 10000. Que remarque-t-on ? n+2−Zn 2(n+2) pour n variant de 1 à (e) On considère la chaı̂ne de Markov Zn0 régie par la transition 1 2 1 0 = i − 1|Zn = i) = 2 0 P(Zn+1 = i + 1|Zn0 = i) = 0 P(Zn+1 Quel est le comportement de Zn0 ? Quel est le comportement de G0n = Xn2−n , Dn0 = Xn2+n ? Simuler le comportement de Gn , Dn , puis comparer. (f) A l’aide d’un histogramme, représenter graphiquement une estimée de la 1000 loi de √Z1000 . Quelles sont les positions asymptotiques de Dn et Gn ? Quelles sont les fluctuations par rapport à cette position ? 19 2. On se place désormais dans le cas d = 2. (a) On rappelle que An est de volume n. Si on considère que An grossit de façon régulière, à quelle distance de l’origine (en ordre de grandeur) le n-ième point est-il ajouté ? (b) Représenter An graphiquement pour n = 10, 1000, 100000. Que remarque-t-on ? Quelle semble être la forme limite ? On pourra réaliser un film/gif animé à l’aide de la commande xs2gif (voir l’aide de scilab). (c) Que représentent les quantités : p n/π x∈An p I (n) = min ||x|| − n/π O (n) = max ||x|| − x∈A / n Simuler ces valeurs lorsque n est grand. Que peut-on dire des fluctuations par rapport à la dimension 1 ? 20 XI. Modèle d’Eden-Richardson On considère une suite En de sous ensembles de Zd . Initialement, E1 = {0}, puis à chaque instant n, chaque point ayant au moins un plus proche voisin dans En est ajouté à En avec probabilité p (indépendamment des autres points). 1. Dans cette question, on considère le cas d = 1. (a) Ecrire un programme qui simule l’évolution de En jusqu’à l’étape 100000. (b) Montrer que l’ensemble des sites occupés est un intervalle d’entiers, puis vérifier que E(#En ) = 1 + 2p(n − 1) (c) On écrit En = {Gn , · · · , Dn }. Donner la loi de Dn et expliquer pourquoi on a Dn = p. lim n→∞ n 2. On se place désormais dans le cas d = 2. (a) Réaliser une simulation dans le cas où p = 1, pour n = 100. Que remarque-t-on ? Expliquer. (b) Réaliser des simulations pour différentes valeurs de p. On pourra prendre, par exemple, p = 0.1, 0.3, 0.5, 0.7, 0.9. Que remarque-t-on ? Commenter. Pour l’un de ces p, on pourra réaliser un film/gif animé représentant la croissance de En lorsque n croı̂t (à l’aide par exemple de la commande xs2gif, voir l’aide de scilab). (c) Pour p = 0.7, réaliser une simulation qui compte le nombre de points de #E200 E100 , puis de E200 . Que vaut #E ? Expliquer pourquoi il est raisonnable 100 de penser que #En croı̂t proportionnellement à n2 . 3. On se place toujours dans le cas d = 2, et on s’intéresse à l’ensemble En = {(x, y) ∈ En , x + y = n}. (a) Pour x compris entre 0 et n, on note Zn (x) = 1 si (x, n − x) ∈ En , et Zn (x) = 0 sinon. Montrer que Zn est une chaı̂ne de Markov, dont les transitions sont données par : P(Zn (x) = 0|Zn−1 (x − 1) = Zn−1 (x) = 0) = 1 P(Zn (x) = 0|Zn−1 (x − 1) = 1 ou Zn−1 (x) = 1) = 1 − p P(Zn (x) = 1|Zn−1 (x − 1) = 1 ou Zn−1 (x) = 1) = p (b) Simuler Zn pour p = 0.1, puis pour p = 0.9. Commenter. 4. On considère un arbre généalogique T construit de la façon suivante : à la première génération, l’arbre ne comporte qu’un individu. À chaque génération, chaque individu a un enfant avec probabilité p, deux avec probabilité p2 , et aucun avec probabilité 1 − p − p2 . On note Tn le nombre d’enfants à la génération n. 21 (a) Calculer E(T2 ). Montrer que E(Tn+1 |Tn = k) = (p + 2p2 )k. En déduire que E(Tn ) = (p + 2p2 )n . (b) En utilisant l’inégalité de Markov, montrer que P(Tn > 0) ≤ (p + 2p2 )n . En déduire que si p < 1/2, la probabilité d’extinction de l’arbre vaut 1. (c) Expliquer pourquoi on peut comparer #En et Tn , et en déduire que si p < 1/2, En est vide à partir d’un certain rang. (d) Vérifier ce résultat à l’aide de simulations. Pour quelles valeurs de p semble-t-on avoir En non vide pour tout n ? 22 XII Bootstrap Percolation Le Baron de Münchhausen, embourbé dans un marécage, se serait d’après la légende tiré d’affaire en tirant sur ses propres attaches de bottes (bootstraps en anglais), ce qui l’aurait bien entendu projeté en l’air. Depuis, le terme bootstrap désigne la façon dont un système peut s’amorcer puis évoluer par lui-même à partir d’un état initial. On se place sur Zd et on considère l’état initial où chaque point est présent (valeur 1) avec probabilité p, et absent (valeur 0) avec probabilité 1 − p. On suppose de plus que tous ces évènements sont indépendants. On appelle une telle configuration une percolation de paramètre p. On considère la règle d’évolution suivante : à l’étape n, tous les points absents qui ont une majorité (au sens large) de plus proches voisins présents deviennent présents pour l’étape n + 1. On note Bn l’ensemble à l’étape n. 1. Dans cette question, on considère le cas d = 1. (a) Écrire un programme qui simule le comportement de Bn sur l’intervalle d’entiers [1, 1000]. (b) Décrire l’évolution depuis l’état initial. Que remarque-t-on ? (c) On considère les suites Hi et Hi0 définies par récurrence de la façon suivante. H1 = inf{i ≥ 0, i ∈ / B0 }, 0 Hi = sup{k ≥ Hi , ∀j ∈ {Hi , · · · , k}, j ∈ / B0 } pour i ≥ 1, et 0 0 Hi = sup{k > Hi , ∀j ∈ {Hi−1 + 1, · · · , k − 1}, j ∈ B0 } pour i > 1. Que peut-on dire de {0, · · · , H1 − 1} ? de {Hi , · · · , Hi0 } ? de {Hi0 + 1, · · · Hi+1 − 1} ? (d) On note G1 = H1 , G0i = Hi0 − Hi + 1, Gi = Hi+1 − Hi0 . Vérifier que Gi est le nombre de points absents dans chaque composante connexe de points absents (la première peut être vide), et que G0i est le nombre de points présents dans chaque composante connexe de points présents. (e) Montrer que les Gi , i > 1 suivent une loi géométrique de paramètre 1 − p. Montrer de même que les G0i , i ≥ 0 suivent une loi géométrique de paramètre p. On remarquera aussi que G1 + 1 suit une loi géométrique de paramètre 1 − p. 1 (f) En déduire que pour i 6= 1, E(Gi + G0i ) = p1 + 1−p . Soit N le plus petit 0 entier tel que HN ≥ n ou HN ≥ n. En utilisant la loi des grands nombres, montrer que n N= 1 1 + o(n). + 1−p p (g) Pour k ∈ N, donner la fonction de répartition de maxi=1..k G0i . Montrer que maxi=1..N G0i est d’ordre ln(n). 23 (h) On appelle τn le temps de remplissage complet de l’intervalle [1, n]. Montrer que τn = maxi=1..N G0i /2. Réaliser un histogramme de τn /ln(n) pour n = 10000 et commenter. 2. On se place maintenant dans le cas d = 2. (a) Simuler le comportement de Bn dans le tore [1, 1000] × [1, 1000], avec différentes valeurs de p. Commenter. Pour l’un de ces p, on pourra réaliser un film/gif animé représentant la croissance de Bn lorsque n croı̂t (à l’aide par exemple de la commande xs2gif, voir l’aide de scilab). (b) Y a-t-il des valeurs de p pour lesquelles Bn ne finit pas par recouvrir le tore tout entier ? Expliquer pourquoi on s’attend à ce que la probabilité de l’évènement ”le tore entier est recouvert en un temps fini” soit croissante. Simuler les valeurs de cette probabilité pour différentes valeurs de p. (c) Réaliser des simulations pour différentes tailles de tore. La taille du tore a-t-elle un effet sur la probabilité de la question précédente ? 3. On considère, pour d = 2, la modification suivante du modèle. L’initialisation du modèle reste la même, mais un site (x, y) devient présent si trois au moins des sites (x − 1, y), (x + 1, y), (x, y − 1), (x, y − 2), (x, y + 1), (x, y + 2) sont présents. (a) Simuler le comportement de Bn dans le tore, avec différentes valeurs de p. (b) Commenter. Quelle est la différence avec la question précedente ? 24 XIII. Marcheurs Eulériens, Modèle du Rotor-Routeur uniforme ? On considère le graphe Z2 , qu’on munit de flèches correspondant aux 4 directions possibles depuis chaque point. À l’étape initiale, on attribue à chaque site l’une des 4 flèches, indépendamment et équiprobablement. On suppose qu’on a un ordre sur les flèches (par exemple Nord-Est-Sud-Ouest). On considère ensuite un marcheur qui part de l’origine. À chaque étape, le marcheur fait un pas dans la direction de la flèche du site qu’il occupe puis modifie la valeur de la flèche (du site qu’il vient de quitter) en suivant l’ordre indiqué ci-dessus (Nord devient Est,..., Ouest devient Nord). On passe ensuite à l’étape suivante. Ce marcheur est appelé marcheur Eulérien. 1. On considère un marcheur Eulérien, et on appelle Xn sa position au temps n. (a) Écrire un programme qui simule la position de Xn et le champ des flèches sur Z2 au fil du temps. (b) Soit z ∈ Z2 . On note νn (z) = #{t ≤ n, Xt = z}. Si z1 et z2 sont deux points voisins de Z2 , montrer que l’on a : 1 (νn (z1 ) − 3) ≤ νn (z2 ) ≤ 4(νn (z1 ) + 3) 4 (c) En déduire que l’ensemble des points visités une infinité de fois par Xn est ou bien vide ou bien Z2 tout entier. √ (d) En se plaçant dans rectangle assez grand, simuler ||Xn ||/ n. Que remarque-t-on ? √ (e) En supposant que ||Xn ||/ n tend vers 0, montrer que pour tout K > 0, il existe un point visité au moins K fois. (f) On suppose de plus que νn (0) ≥ 12 maxz∈Z2 νn (z) pour n assez grand. Montrer qu’alors l’ensemble des points visités une infinité de fois par Xn est Zd . 2. On s’intéresse à Xn = {z ∈ Z2 , νn (z) > 0}. (a) Montrer que Xn est croissant et connexe. Simuler Xn en fonction de n. On pourra réaliser un film/gif animé représentant la croissance de Xn lorsque n croı̂t (à l’aide par exemple de la commande xs2gif, voir l’aide de scilab). (b) Représenter les valeurs de νn sur Z2 . Que remarque-t-on ? 3. On considère un ensemble An qui évolue de la façon suivante. À chaque étape, on lance un marcheur Eulérien de l’origine, et on le laisse évoluer jusqu’à ce qu’il sorte de An . On appelle zn le premier point visité à l’extérieur de An et on définit An+1 = An ∪ {zn }. On initialise à A1 = {0}. Attention, tous les marcheurs évoluent sur la même configuration de flèches (et la modifient pour le prochain marcheur). 25 (a) Pourquoi le point zn existe-t-il toujours ? (b) Écrire un programme qui simule An . Représenter An graphiquement et/ou cinématiquement. Quelle forme prend An ? (c) Représenter An en coloriant chaque point suivant la flèche qui l’occupe. Discuter des motifs qui apparaissent. (d) Que représentent les quantités : p n/π x∈An p I (n) = min ||x|| − n/π O (n) = max ||x|| − x∈A / n Simuler ces valeurs lorsque n est grand. Que remarque-t-on ? 4. On modifie la règle précédente : à chaque étape, on choisit uniformément un point z ∈ An qui sera le point de départ du nouveau marcheur. (a) Expliquer pourquoi la méthode du rejet est adaptée à ce choix. Comment peut-on s’assurer qu’on ne rejette pas trop de points ? (b) Écrire un programme qui simule An . Quelle forme prend-il ? Comparer avec la question précédente. 26 XIV. Marche simple ? On considère une marche aléatoire simple S sur Z : S0 = 0, la suite {Xk = Sk+1 − Sk }k=0,1,... est IID et P(X1 = 1) = P(X1 = −1) = 1/2. 1. (a) Montrer que S est une chaı̂ne de Markov d’espace d’états Z. Quel est son noyau de transition ? La chaı̂ne est-elle irréductible, apériodique ? (b) Exprimer P(S2k = 0), P(S2k+1 = 0) en fonction de k (on dénombrera l’ensemble des trajectoires qui prennent la valeur 0 au temps 2k, resp. 2k + 1). (c) En utilisant la formule de Stirling, montrer alors que √ lim πnP(S2n = 0) = 1. n→∞ (d) Vérifier numériquement le calcul de la question précédente. P 2. Pour n ∈ {1, 2, . . .} on appelle Ln = ni=0 1Si =0 la variable aléatoire qui compte le nombre des visites en zéro jusqu’au temps n. (a) Calculer E[Ln ], puis trouver ` tel que √ lim E[Ln ]/ n = `. n→∞ Vérifier numériquement. (b) Montrer que E[L2n ] = n X P(Si = 0) + 2 i=0 X P(Si = Sj = 0). 0≤i<j≤n (c) Montrer que pour 0 ≤ i < j ≤ n, P(Si = Sj = 0) = P(Si = 0)P(Sj−i = 0), et en déduire que Z r 1 1 1−x 1 X P(Si = Sj = 0) −→ dx, n→∞ π 0 n 0≤i<j≤n x Déterminer alors la limite de E h L2n n i , puis vérifier numériquement. √ (d) Etudier numériquement le comportement de Ln / n lorsque n → ∞. Essayer de déterminer la loi de la variable limite Y . Sur la base de l’observation numérique, de quel type de convergence s’agit-il ? 3. Dans cette partie on cherche à étudier le comportement de la marche sous la probabilité P(·| S2n = 0). Pn−1 On introduit la variable Tn := k=0 1{Sk +Sk+1 >0} qui donne le temps passé dans le demi-plan positif par la marche lors de ses n premiers pas. 27 (a) Tracer un histogramme de la loi de T2n sous P(·| S2n = 0), en utilisant une méthode du rejet, pour n = 50, 100, 200, ..., 1000. (b) Remarquer que lorsque S2n = 0, la marche effectue forcément n pas vers le haut et n pas vers le bas lors de ses 2n premiers pas. Il suffit donc de choisir les indices des pas effectués vers le haut pour simuler une trajectoire de la marche sous P(·| S2n = 0). Tracer alors l’histogramme de T2n sous P(·| S2n = 0) pour n = 104 , 105 , 106 . (c) En utilisant la méthode de la question précédente, représenter grpahiquement quelques dizaines de trajectoires de { √Skn , k = 1, ..., 2n} sous P(·| S2n = 0), pour n = 107 . Tenter alors d’expliquer la forme de l’histogramme de T2n sous P(·| S2n = 0). 4. On prend maintenant en considération une suite IID {ηj }j=1,2,... de variables à valeurs dans {1, 2, .P . .}, avec P(η1 = k) = c/k 3/2 . On pose τ0 = 0 et, pour N = 1, 2, . . ., τN = N j=1 ηj . Finalement on introduit Nn := max{j : τj ≤ n}. √ Etudier Nn / n pour n grand (voyez-vous un lien avec la partie 2 ?). 28 XV. Modèle de génétique, sans et avec mutations ? On considère un modèle de génétique pour une partie spécifique d’ADN mitochondrial. • Chaque génération compte exactement M individus féminins. On numérote les individus de chaque génération de 1 à M . Le i-ème individu de la g-ème génération est noté (g, i). • Chaque configuration de la partie spécifique d’ADN mitochondrial que l’on considère est appelée un allèle. On numérote les allèles distincts {1, 2, 3, · · · }. On note A(g, i) l’allèle porté par le i-ème individu de la g-ème génération. On suppose de plus qu’initialement, pour un certain K0 ∈ {0, ..., M }, les K0 premiers individus sont porteurs de l’allèle 1, et les M − K0 derniers porteurs de l’allèle 2. • Pour tout g ≥ 1, l’individu (g, i) choisit, indépendamment de tous les autres choix, et uniformément au hasard, son unique mère m(g, i) parmi les M individus de la génération g − 1. • Dans le modèle sans mutation, l’allèle porté par l’individu (g, i) est exactement celui porté par sa mère à la génération g − 1. Dans ce cas on a donc pour tout g ≥ 1, et pour tout i ∈ {1, ..., M }, A(g, i) = A(m(i)). • Dans le modèle avec mutation, on fixe p ∈ (0, 1). L’allèle porté par l’individu (g, i) est, – avec probabilité 1 − p, exactement celui porté par sa mère m(g, i). – avec probabilité p, un nouvel allèle qui n’a été jusqu’à présent porté par aucun individu. 1. Dans cette partie on considère le modèle sans mutations. On note alors N1 (g) = #{i : A(g, i) = 1}, N2 (g) = #{i : A(g, i) = 2}. Tfixation := inf{g ∈ N : max(N1 (g), N2 (g)) = M }, Afixation := 1 × 1{N1 (g)=M } + 2 × 1{N2 (g)=M } . (a) Combien d’allèles sont présents dans la population à la génération Tfixation ? Quel est l’allèle porté par le i-ème individu de la génération Tfixation ? Que se passe-t-il aux générations suivantes ? (b) Que vaut N1 (0) ? Montrer que N1 (1) ∼ Bin(M, K0 /M ). Calculer E[N1 (1)] en fonction de K0 . (c) Soit g ≥ 1, k ∈ {0, ..., M }. Sachant N1 (g − 1) = k, quelle est la loi de N1 (g) ? Calculer E[N1 (g) | N1 (g − 1) = k]. En déduire que pour tout g ≥ 1, E[N1 (g)] = E[N1 (g − 1)]. 29 (d) Soit l’événement Eg := { tous les individus de la génération g choisissent exactement la même mère à la génération g − 1}. Calculer P(Eg ). En S déduire P( N g=1 Eg ). S Expliquer pourquoi {Tfixation ≤ N } ⊂ N g=1 Eg . (e) Evaluer numériquement l’espérance, puis la loi de Tfixation /M (on tracera un histogramme). (f) Evaluer numériquement P(Afixation = 1), pour différentes valeurs de K0 , M . Que remarque-t-on ? (g) Représenter, pour M = 100, 1000, 10000 des trajectoires de 1 N1 (bM tc), t ∈ [0, Tfixation /M ] M 2. Dans cette partie on considère le modèle avec mutations. On note alors µ(g) le nombre de mutations effectuées jusqu’à (et incluant) la génération g. On note par ailleurs Gmut la première génération où une mutation a été effectuée. On note d’autre part N (g) le nombre d’allèles présents à la génération g. (a) Quelle est la loi de µ(g) en fonction de p, g, M ? (b) Quelle est la loi de Gmut ? (c) Lorsque p = λ , M2 déterminer la limite de Gmut /M lorsque M → ∞. (d) Vérifier numériquement les questions précédentes. (e) Simuler une trajectoire de N (g), pour M = 100, 200, 500, 1000, 2000, K = M/2, p = λ/M 2 , et différentes valeurs de λ. Que remarque-t-on ? 30