corrigé

Transcription

corrigé
Université de Nice
Département de Mathématiques
Année 2009-20010
Licence MASS 2e année
Probabilité
Fiche TD 19 - réponses possibles
Les punaises préfèrent-elles tomber sur le dos ?
Intervalle de confiance d’une estimation
Lorsqu’on vide une boite de punaises sur la table, on a l’impression qu’une punaise manifeste une
“préférence” p à tomber sur le dos plutôt que sur la pointe.
1. Proposer un modèle probabiliste pour décrire cette situation.
Réponse possible : lorsqu’on écrit “une punaise”, on pense bien entendu à une punaise générique,
pas à une punaise particulière. Le modèle auquel je pense alors, c’est celui d’une loi de probabilité.
Comme on veut rendre compte qu’il y a deux états possible (sur le dos ou sur la pointe) et on
pense donc à une loi à deux états, qu’il est commode de coder par des nombres (et non des lettres,
par exemple) ce qui permettra aussi de calculer. Si l’on code par 0 et 1, cela permet en suite de
représenter facilement l’activité de comptage. On code l’état “la punaise est sur le dos” par 1, et
par 0 l’état “la punaise est sur la pointe”. Une loi de Bernoulli B(1, p), avec p chargé de représenter
une (hypothétique) “préférence à tomber sur le dos”, semble alors toute désignée pour modéliser la
situation envisagée.
2. On vide une boite de n punaises sur la table et on compte le nombre Dn de punaises tombées sur
le dos. Donner un modèle probabiliste pour Dn .
Réponse possible : On pense tout naturellement à modéliser l’état de la i-ème punaise parmi les
n punaises par une v.a. Xi ; B(1, p). On imagine que les positions adoptées par les punaises sont
indépendantes l’une de l’autre ; on suppose donc les Xi indépendantes et on pose Dn = X1 +. . .+Xn ,
qui compte le nombre de Xi codant l’état “la punaise i est tombée sur le dos”.
Notons ici que si le modèle se révèlait aboutir à des résultats en contradiction avec l’expérience, il y
aurait au moins deux points qui semblaient “aller de soit” : l’indépendance des Xi : si les punaises
étaient fortement magnétisées, cette indépendance serait sans doute une hypothèse inefficace ; plus
subtilement, ce modèle sous-entend qu’on peut individualiser les diverses punaises, puisqu’on les
numérote. La physique quantique fournit des exemples où cette hypothèse en apparence anodine
serait nuisible.
3. Donner un estimateur Pn (ou P̂n ) de p.
Réponse possible : Par estimateur de p, nous entendons une v.a. Pn = P̂n = θ(X1 , . . . , Xn ) telle
que p soit limite (dans un sens à préciser) des Pn . La loi des grands nombres (LGN) assure que
p = E(Xi ) est limite en probabilité des n1 (X1 + . . . + Xn ) pour des Xi i.i.d. . Nous posons donc
Pn = n1 Dn = n1 (X1 + . . . + Xn ) pour des Xi ; B(1, p) indépendantes
4. Ecrire Pn sous la forme Pn = aZn + b, où Zn est proche en loi d’une v.a. Z ; N (0, 1) ; que valent
alors a et b (en fonction de p et n) ?
Réponse possible : Le théorème limite central (TLC) assure que, sous les hypothèses ici vérifiées
1
(Xi i.i.d. telles que σ 2 = Var (Xi ) existe), il y a convergence en probabilité des Zn := σ√
(X1 +. . .+
n
2
Xn − nE(X1 )) vers Z ; N (0, 1). Ici E(X1 ) = p et σ = p(1 − p), et Dn = X1 + . . . + Xn = nPn .
On a donc Pn = p + √σn Zn , et donc a = √σn et b = p. L’application pratique du TLC consiste donc
à assimiler Zn à sa limite Z. On assimile donc Pn à P̃n = p +
√σ Z
n
5. On a vidé une boite de 54 punaises et on a trouvé d54 = 30 punaises sur le dos ; quelle est l’estimation
p̂ de p issue de cette expérience ?
54
= 0, 555... = 55, 5..%.
Réponse possible : Cela conduit à poser p̂ = p54 = d54
6. On cherche un intervalle de confiance au seuil α = 5% du type [Pn − ∆, Pn + ∆], c’est-à-dire tel
que P({p ∈
/ [Pn − ∆, Pn + ∆]}) ≤ α = 5%. Montrer tout d’abord que
{p ∈ [Pn − ∆, Pn + ∆]} = {Pn ∈ [p − ∆, p + ∆]}.
Réponse possible : On a {p ∈ [Pn −∆, Pn +∆]} = {Pn −∆ ≤ p, Pn +∆ ≥ p} = {Pn ≤ p+∆, Pn ≥
p − ∆} = {Pn ∈ [p − ∆, p + ∆]}
1
7. Trouver z− et z+ tels que {Pn ∈ [p − ∆, p + ∆]} = {Zn ∈ [z− , z+ ]}.
Réponse possible : On cherche z− et z+ tels que {Zn ∈ [z−√
, z+ ]} = {aZn + b ∈ [p√− ∆, p + ∆]}.
1
La relation aZn + b ≥ p − ∆ équivaut à Zn ≥ a (p − ∆ − b) = σn (p − ∆ + p) = − √ n ∆ =: z− ;
on obtiendrait de même z+ :=
p(1−p)
√
√ n ∆.
p(1−p)
8. En déduire finalement une approximation (majoration) ∆ de ∆α = ∆5% .
Réponse possible : Par définition de ∆, il suffit de choisir ∆ ≥ ∆α , avec 0, 05 = 5% = α =
P({p ∈
/ [Pn − ∆α , Pn + ∆α ]}) = P({Zn ∈
/ [z− , z+ ]}). Le TLC nous conduit à assimiler, pour n assez
grand (n ≥ 30...), P({Zn ∈
/ [z− , z+ ]}) à P({Z ∈
/ [z− , z+ ]}). Comme z− = −z+ et que la densité de
Z est paire, ceci équivaut donc à ∆α tel que F (z+ ) = P({Z ≥ z+ } = 0, 025 = F (1,
√ 96 . . .)) d’après
√
p(1−p)
√
la table de la loi normale N (0, 1) ; d’où σn ∆α = z+ = 1, 96 . . ., et donc ∆α =
1, 96 . . . ≤
n
1
1
0
√ 1, 96 . . . =: ∆
(puisque
p(1
−
p)
≤
).
Comme
n
=
54,
on
obtient
qu’il
suffit
de choisir
α
4
2 n
1
0
∆ ≥ ∆α = 2√54 1, 96 . . . = 0, 0133 . . . = 13, 3 . . . %
9. Peut-on affirmer qu’au vu de l’expérience, au seuil α = 5%, les punaises préfèrent tomber sur le
dos ?
Réponse possible : Non, puisque l’intervalle de confiance 55, 5%±13, 3% ne comporte pas que des
nombres supérieurs à 0, 5 = 50%. Le choix d’une valeur plus élevée pour n (par exemple n = 1000)
conduirait à un ∆ plus petit, et permettrait peut-être d’avoir un intervalle de confiance entièrement
composé de nombres supérieurs à 50%, mais il se peut aussi que p1000 soit plus proche de 50% :
cela dépendra du résultat de l’expérience !
10. Même question si on avait n = 540 et d540 = 299.
1.96
Réponse possible : Ici on obtient ∆0α = 2√
= √110 0.0133 . . . % = 4.2 . . . % et p540 = 299
540 =
540
55.37 . . . % ; dans ces conditions on peut affirmer, au seuil de 5% (c’est-à-dire avec un “risque
inférieur à 5%” d’être démenti par d’autres expériences) que “les punaises préfèrent tomber sur le
dos”.
Edwin Moore, inventeur, en 1900, de la punaise :
2

Documents pareils