corrigé
Transcription
corrigé
Université de Nice Département de Mathématiques Année 2009-20010 Licence MASS 2e année Probabilité Fiche TD 19 - réponses possibles Les punaises préfèrent-elles tomber sur le dos ? Intervalle de confiance d’une estimation Lorsqu’on vide une boite de punaises sur la table, on a l’impression qu’une punaise manifeste une “préférence” p à tomber sur le dos plutôt que sur la pointe. 1. Proposer un modèle probabiliste pour décrire cette situation. Réponse possible : lorsqu’on écrit “une punaise”, on pense bien entendu à une punaise générique, pas à une punaise particulière. Le modèle auquel je pense alors, c’est celui d’une loi de probabilité. Comme on veut rendre compte qu’il y a deux états possible (sur le dos ou sur la pointe) et on pense donc à une loi à deux états, qu’il est commode de coder par des nombres (et non des lettres, par exemple) ce qui permettra aussi de calculer. Si l’on code par 0 et 1, cela permet en suite de représenter facilement l’activité de comptage. On code l’état “la punaise est sur le dos” par 1, et par 0 l’état “la punaise est sur la pointe”. Une loi de Bernoulli B(1, p), avec p chargé de représenter une (hypothétique) “préférence à tomber sur le dos”, semble alors toute désignée pour modéliser la situation envisagée. 2. On vide une boite de n punaises sur la table et on compte le nombre Dn de punaises tombées sur le dos. Donner un modèle probabiliste pour Dn . Réponse possible : On pense tout naturellement à modéliser l’état de la i-ème punaise parmi les n punaises par une v.a. Xi ; B(1, p). On imagine que les positions adoptées par les punaises sont indépendantes l’une de l’autre ; on suppose donc les Xi indépendantes et on pose Dn = X1 +. . .+Xn , qui compte le nombre de Xi codant l’état “la punaise i est tombée sur le dos”. Notons ici que si le modèle se révèlait aboutir à des résultats en contradiction avec l’expérience, il y aurait au moins deux points qui semblaient “aller de soit” : l’indépendance des Xi : si les punaises étaient fortement magnétisées, cette indépendance serait sans doute une hypothèse inefficace ; plus subtilement, ce modèle sous-entend qu’on peut individualiser les diverses punaises, puisqu’on les numérote. La physique quantique fournit des exemples où cette hypothèse en apparence anodine serait nuisible. 3. Donner un estimateur Pn (ou P̂n ) de p. Réponse possible : Par estimateur de p, nous entendons une v.a. Pn = P̂n = θ(X1 , . . . , Xn ) telle que p soit limite (dans un sens à préciser) des Pn . La loi des grands nombres (LGN) assure que p = E(Xi ) est limite en probabilité des n1 (X1 + . . . + Xn ) pour des Xi i.i.d. . Nous posons donc Pn = n1 Dn = n1 (X1 + . . . + Xn ) pour des Xi ; B(1, p) indépendantes 4. Ecrire Pn sous la forme Pn = aZn + b, où Zn est proche en loi d’une v.a. Z ; N (0, 1) ; que valent alors a et b (en fonction de p et n) ? Réponse possible : Le théorème limite central (TLC) assure que, sous les hypothèses ici vérifiées 1 (Xi i.i.d. telles que σ 2 = Var (Xi ) existe), il y a convergence en probabilité des Zn := σ√ (X1 +. . .+ n 2 Xn − nE(X1 )) vers Z ; N (0, 1). Ici E(X1 ) = p et σ = p(1 − p), et Dn = X1 + . . . + Xn = nPn . On a donc Pn = p + √σn Zn , et donc a = √σn et b = p. L’application pratique du TLC consiste donc à assimiler Zn à sa limite Z. On assimile donc Pn à P̃n = p + √σ Z n 5. On a vidé une boite de 54 punaises et on a trouvé d54 = 30 punaises sur le dos ; quelle est l’estimation p̂ de p issue de cette expérience ? 54 = 0, 555... = 55, 5..%. Réponse possible : Cela conduit à poser p̂ = p54 = d54 6. On cherche un intervalle de confiance au seuil α = 5% du type [Pn − ∆, Pn + ∆], c’est-à-dire tel que P({p ∈ / [Pn − ∆, Pn + ∆]}) ≤ α = 5%. Montrer tout d’abord que {p ∈ [Pn − ∆, Pn + ∆]} = {Pn ∈ [p − ∆, p + ∆]}. Réponse possible : On a {p ∈ [Pn −∆, Pn +∆]} = {Pn −∆ ≤ p, Pn +∆ ≥ p} = {Pn ≤ p+∆, Pn ≥ p − ∆} = {Pn ∈ [p − ∆, p + ∆]} 1 7. Trouver z− et z+ tels que {Pn ∈ [p − ∆, p + ∆]} = {Zn ∈ [z− , z+ ]}. Réponse possible : On cherche z− et z+ tels que {Zn ∈ [z−√ , z+ ]} = {aZn + b ∈ [p√− ∆, p + ∆]}. 1 La relation aZn + b ≥ p − ∆ équivaut à Zn ≥ a (p − ∆ − b) = σn (p − ∆ + p) = − √ n ∆ =: z− ; on obtiendrait de même z+ := p(1−p) √ √ n ∆. p(1−p) 8. En déduire finalement une approximation (majoration) ∆ de ∆α = ∆5% . Réponse possible : Par définition de ∆, il suffit de choisir ∆ ≥ ∆α , avec 0, 05 = 5% = α = P({p ∈ / [Pn − ∆α , Pn + ∆α ]}) = P({Zn ∈ / [z− , z+ ]}). Le TLC nous conduit à assimiler, pour n assez grand (n ≥ 30...), P({Zn ∈ / [z− , z+ ]}) à P({Z ∈ / [z− , z+ ]}). Comme z− = −z+ et que la densité de Z est paire, ceci équivaut donc à ∆α tel que F (z+ ) = P({Z ≥ z+ } = 0, 025 = F (1, √ 96 . . .)) d’après √ p(1−p) √ la table de la loi normale N (0, 1) ; d’où σn ∆α = z+ = 1, 96 . . ., et donc ∆α = 1, 96 . . . ≤ n 1 1 0 √ 1, 96 . . . =: ∆ (puisque p(1 − p) ≤ ). Comme n = 54, on obtient qu’il suffit de choisir α 4 2 n 1 0 ∆ ≥ ∆α = 2√54 1, 96 . . . = 0, 0133 . . . = 13, 3 . . . % 9. Peut-on affirmer qu’au vu de l’expérience, au seuil α = 5%, les punaises préfèrent tomber sur le dos ? Réponse possible : Non, puisque l’intervalle de confiance 55, 5%±13, 3% ne comporte pas que des nombres supérieurs à 0, 5 = 50%. Le choix d’une valeur plus élevée pour n (par exemple n = 1000) conduirait à un ∆ plus petit, et permettrait peut-être d’avoir un intervalle de confiance entièrement composé de nombres supérieurs à 50%, mais il se peut aussi que p1000 soit plus proche de 50% : cela dépendra du résultat de l’expérience ! 10. Même question si on avait n = 540 et d540 = 299. 1.96 Réponse possible : Ici on obtient ∆0α = 2√ = √110 0.0133 . . . % = 4.2 . . . % et p540 = 299 540 = 540 55.37 . . . % ; dans ces conditions on peut affirmer, au seuil de 5% (c’est-à-dire avec un “risque inférieur à 5%” d’être démenti par d’autres expériences) que “les punaises préfèrent tomber sur le dos”. Edwin Moore, inventeur, en 1900, de la punaise : 2