IUT de Paris Descartes, Dpt INFO

Transcription

IUT de Paris Descartes, Dpt INFO
IUT de Paris Descartes, Dpt INFO
DST de Maths du Vendredi 17 Octobre 2008: Corrigé.
1. Lois classiques:
On dispose d’une pièce biaisée produisant ”Pile” avec probabilité p et
”Face” avec probabilité (1 − p) à chaque lancer. Nommer et décrire la
loi de X si
(i) La pièce est lancée n fois et X compte le nombre de ”Pile” obtenus:
X suit une Loi Binomiale de paramètres n et p (X ֒→ B(n; p));
ses valeurs possibles sont 0, 1, . . . , n, avec
n k
p · (1 − p)n−k
∀k ∈ {0, 1, . . . , n} , P {X = k} =
k
(ii) La pièce est lancée indéfiniment et X indique l’instant de la première
apparition de ”Pile”:
X suit une Loi géométrique de paramètre p (X ֒→ G(p)); l’ensemble
de ses valeurs possibles est N∗ , avec
∀k ∈ N∗ ,
P {Y = k} = p · (1 − p)k−1
2. Approximation en Loi:
On dispose toujours d’une pièce biaisée produisant ”Pile” avec probabilité p et ”Face” avec probabilité (1 − p) à chaque lancer.
(i) A supposer que n est grand et que p vaut n1 , quelle loi discrète
utilisera-t-on afin de compter approximativement le nombre de
”Pile” obtenus à l’issue de n jets?
On utilisera une Loi de Poisson de paramètre np = 1, notée P(1).
(ii) Calculer la probabilité d’obtenir trois ”Pile” exactement selon
cette approximation, et comparer avec la valeur exacte dans le
1
cas n = 100, p = 100
.
3
Si X ֒→ P(1): P {X = 3} = e−1 · 13! = e 6 ≈ 0, 0613, tandis que
la probabilité exacte est donnée par
100 · 99 · 98
100 3
p · (1 − p)100−3 =
· (0, 01)3 · (0, 99)97 ≈ 0, 0610
3
3·2·1
−1
L’approx. Poissonienne est ici valable à 10−3 près.
3. Indépendance:
Etant donnés quatre événements A, B, C, D dans un espace de probabilité (Ω; F ; P), donner le sens mathématique des phrases
(i) “A, B, C, D sont indépendants deux à deux”:
cela signifie que
P (A ∩ B) = P(A)·P(B),
P (A ∩ C) = P(A)·P(C), . . . ,
P (C ∩ D) = P(C)·P(D)
(au total 42 = 6 identités où la probabilité d’une intersection de
deux événements coincide avec le produit de leurs probabilités).
(ii) “A, B, C, D sont indépendants dans leur ensemble”:
cela signifie que les 6 identités précédentes sont vraies, mais aussi
P (A ∩ B ∩ C) = P(A)·P(B)·P(C), . . . , P (B ∩ C ∩ D) = P(B)·P(C)·P(D),
( 43 = 4 identités supplémentaires) et
P (A ∩ B ∩ C ∩ D) = P(A) · P(B) · P(C) · P(D).
Donner aussi un exemple de situation où l’une de ces deux affirmations
est vraie tandis que l’autre est fausse:
En considérant quatre jets successifs d’un dé équilibré, si A = E1 , B =
E2 , C = E3 , D = E4 sont les événements définis par
∀i ∈ {1, 2, 3} ,
Ei := “Les jets des lancers i et (i + 1) donnent le même résultat”
et
E4 := “Les jets du quatrième et du premier lancer donnent le même résultat”,
on a pour i 6= j:
P (Ei ∩ Ej ) = P(Ei ) · P(Ej ) = 1/36
(même lorsque j = (i + 1)), tandis que
P (E1 ∩ E2 ∩ E3 ∩ E4 ) = 6×(1/6)4 = (1/6)3 6= (1/6)4 = P(E1 )·P(E2 )·P(E3 )·P(E4 ).
4. Variance, Covariance et Indépendance:
Soient X, Y : Ω −→ R deux v.a. définies sur un même espace Ω.
(i) Définir V ar(X) et Cov(X, Y ):
Cov(X, Y ) = E(X · Y ) − E(X) · E(Y ),
V ar(X) = Cov(X, X) = E(X 2 ) − E(X)2 = E [(X − E(X))2 ].
(ii) Définir Corr(X, Y ).
√)
Corr(X, Y ) = √ Cov(X,Y
V ar(X)·
V ar(Y )
.
(iii) Pourra-t-on avoir V ar(X) < 0?
Non.
(iv) Pourra-t-on avoir Cov(X, Y ) < 0?
Oui.
(v) Pourra-t-on avoir Corr(X, Y ) ≤ −1?
Oui (car Corr(X, Y ) = −1 est envisageable).
(vi) Pourra-t-on avoir Corr(X, Y ) = −2?
Non (car Corr(X, Y ) < −1 n’est pas envisageable).
(vii) On suppose enfin que X et Y sont indépendantes. Pourra-t-on
avoir Cov(X, Y ) > 0?
Non (car alors Cov(X, Y ) = 0).
5. Jeux et Espérances:
Une société organisant des jeux de hasard décide de lancer un nouveau
produit, le jeu ”BigWin”, selon les règles suivantes:
(1) L’achat d’un bulletin de jeu coûte cinq Euros.
(2) Chaque bulletin comporte une soixantaine de cases, numérotées
de 1 à 60, et le joueur doit cocher sept cases exactement.
(3) A l’issue d’un tirage public des sept nombres gagnants, tout joueur
ayant coché précisément ces sept nombres reçoit la somme de S
Euros, tandis qu’un joueur ayant coché 6 de ces 7 cases seulement
reçoit S/100 Euros, et un joueur ayant coché 5 de ces 7 cases
seulement reçoit S/1000 Euros. Tout joueur ayant coché au plus
4 des 7 cases tirées au sort ne reçoit rien en retour.
Alice décide de prendre part à ce jeu dès la semaine de lancement. Soit
X la variable aléatoire représentant le gain net d’Alice à l’issue de ce
premier pari.
(i) Quelles sont les valeurs possibles de X?
v0 = −5, v1 = S/1000 − 5, v2 = S/100 − 5, v3 = S − 5.
(ii) Pour chaque valeur possible v, calculer P {X = v} (description de
la loi de X).
Remarquons que le nombre de “cases correctes” cochées par Alice
7
). On a ainsi
suit une loi H(n = 7, N = 60, p = 60
P (X = v3 ) =
mais aussi
53 7
0
7
60
7
=
60
7
et
53 7
2
5
60
7
P (X = v1 ) =
P (X = v0 ) = 1 −
=
53 7
1
6
60
7
P (X = v2 ) =
Enfin
−1
3
X
i=1
7!53!
7 × 6 × ... × 1
=
60!
60 × 59 × . . . × 54
≈ 9, 61 · 10−7
≈ 7, 4929 · 10−5
P (X = vi ) ≈ 0, 999925
(iii) Calculer E(X) en fonction de S.
Soit Z la somme versée par la société de jeux à Alice; observons
que Z = X + 5, en sorte que
P (X = v0 ) = P (Z = 0) , . . . , P (X = v3 ) = P (Z = S) .
Donc:
E(Z) = 0 × P(Z = 0) + (S/1000) × P (Z = S/1000) + . . . + S× P (Z = S)
(53)(7)
(53)(7) (53)(7)
= S × (1/1000) × 2 60 5 + (1/100) × 1 60 6 + 0 60 7
(7)
(7)
(7)
et (linéarité de l’Espérance)
(
E(X) = E(Z)−5 = S× (1/1000) ×
53 7
2
5
60
7
+ (1/100) ×
53 7
1
6
60
7
+
53 7
0
7
60
7
A partir de quelle valeur de S0 a-t-on affaire à un jeu favorable
pour Alice?
Le jeu devient favorable pour Alice dès lors que E(X) ≥ 0, ou
encore dès lors que E(Z) ≥ 5. Ainsi:
−1
(532)(75)
(531)(76) (530)(77)
S0 = 5 × (1/1000) × 60 + (1/100) × 60 + 60
(7)
(7)
(7)
5×(60
7)
= (1/1000)× 53 7 +(1/100)× 53 7 +1
( 1 )(6)
( 2 )(5)
′
′
≈ 57 389 283
)
−5.
On prend maintenant le point de vue de la société de jeux en supposant
que, lors de la semaine de lancement, un million de bulletins de ”Bigwin” ont étés vendus, tandis que le gain maximum a été fixé à S = 107
Euros. Soit Y la variable aléatoire représentant le bénéfice net réalisé
par la société à l’issue de cette première semaine de jeu.
(iv) Quelle est la plus grande valeur possible de Y ? Et la plus petite?
En nommant wmin et wmax ces deux valeurs extrêmes, on a wmin =
5 · 106 − 106 · S = 5 · 106 − 1013 tandis que wmax = 5 · 106 .
(v) Calculer E(Y ) et V ar(Y ) (on pourra représenter Y comme somme
de v.a. i.i.d.).
Pour chacun des 106 participants, soit Yi la variable prenant la
valeur 5 si le joueur i n’a rien gagné, 5−S/1000 = 5−104 = −9′ 995
s’il a gagné S/1000 = 10′ 000 Euros, 5 − S/100 = −99′ 995 s’il a
gagné S/100 Euros et 5 − S = 9′ 999′995 Euros s’il a remporté le
gain maximum.
P 6
On a Y = 10
i=1 Yi , et pour tout i:
P {Yi = 5 − S} =
60
7
−1
, P {Yi = 5 − S/100} =
tandis que
53 7
1
6
60
7
, P {Yi = 5 − S/1000} =
P {Yi = 5} = 1−[P {Yi = 5 − S} + P {Yi = 5 − S/100} + P {Yi = 5 − S/1000}]
En introduisant les variables Zi données par Zi = 5 − Yi , on a
ensuite, pour chacun des joueurs:
(
)
53 7
53 7
53 7
E(Zi ) = S× (1/1000) ×
et
(
E(Zi2 ) = S 2 × (1/106) ×
Il vient donc
2
60
7
1
5 + (1/100) ×
53 7
2
5
60
7
+ (1/104 ) ×
60
7
6 +
53 7
1
6
60
7
+
0
7
60
7
)
53 7
0
7
60
7
≈ 0, 871
≈ 2, 76·105
E(Y ) = 106 · E(Y1 ) = 106 · (5 − E(Z1 )) ≈ 4, 129 · 106
et (puisque les variables Y1 , . . . , Y106 sont i.i.d.)
V ar(Y ) = 106 ·V ar(Y1 ) = 106 ·V ar(Z1 ) ≈ 2, 76·1011,
p
V ar(Y ) ≈ 525′ 383
53 7
2
5
60
7
,
(vi) Estimer la probabilité P {Y < 4 · 106 } à l’aide du TCL.
On obtient donc
−0, 129 · 106
−0, 129 · 106
Y − 4, 129 · 106
6
≈ P Y0 <
,
<
P Y < 4 · 10 = P
525′ 383
525′383
525′ 383
où Y0 est une variable Gaussienne standard. Il vient:
P Y < 4 · 106 ≈ FY0 (−0, 25) = 1 − FY0 (0, 25) ≈ 40, 13%
6. Technique de ”Pooling”:
De retour au pays après une longue campagne de guerre, un Million de
soldats du Bandrika sont soumis à une visite médicale comportant une
prise de sang. On estime à p = 0, 005 la proportion de soldats porteurs
d’un virus particulièrement dangereux, et les autorités publiques bandrikaises décident d’identifier ces soldats. Un test est mis au point afin
de détecter la présence du virus dans un échantillon de sang.
(i) Supposons que ce test est imparfait, produisant une réponse positive avec probabilité 0, 99 sur un échantillon de sang renfermant
le virus, et une réponse positive avec probabilité 0, 05 pour un
échantillon de sang ne renfermant pas le virus.
a) L’échantillon d’un soldat est testé, et la réponse est positive.
Quelle est la probabilité que ce soldat soit réellement porteur
du virus?
Avec des définions évidentes pour T + , T − , V + , V − , on obtient
P(V + |T + ) =
=
P(T + |V + )·P(V + )
P(T + |V + )·P(V + )+P(T + |V − )·P(V − )
0,99·0,005
≈ 9, 05%
0,99·0,005+0,05·0,995
b) Calculer, pour un soldat quelconque, la probabilité que la
réponse du test soit positive pour son échantillon de sang.
P(T + ) = P(T + |V + )·P(V + )+P(T + |V − )·P(V − ) = 0, 99·0, 005+0, 05·0, 995 = 5, 47%
c) Les échantillons de sang de tous les soldats sont testés individuellement. Soit X la variable aléatoire comptant le nombre
de réponses positives. Nommer et décrire la loi de X (valeurs
possibles et probabilités correspondantes).
X est binomiale de paramètres n = 106 et p = 5, 47%.
d) Estimer P{54′ 500 ≤ X ≤ 55′000} au moyen du TCL.
E(X) = np = 5, 47 · 104 ,
V ar(X) = np(1 − p) = 51′ 707, 91
Ainsi, si X0 est une variable Gaussienne standard:
P{54′500 ≤ X ≤ 55′ 000} =
≈
=
=
≈
4
P{−0, 88 ≤ X−5,47·10
≤ 1, 32}
227,4
P{−0, 88 ≤ X0 ≤ 1, 32}
FX0 (1, 32) − FX0 (−0, 88)
FX0 (1, 32) − (1 − FX0 (0, 88))
0, 7172
(ii) On suppose en outre que chaque utilisation du test coûte 10 Sequins (monnaie du pays) au contribuable bandrikais. Les autorités décident donc de répartir les 106 échantillons individuels
en N = 106 /M groupes G1 , G2 , . . . , GN de M échantillons, où M
est un entier divisant 106 , puis de mélanger les échantillons individuels à l’intérieur de chaque groupe et d’effectuer d’abord un test
pour chacun des N groupes. Pour ceux des groupes produisant
une réponse positive, on testera ensuite chacun des individus du
groupe; les individus issus d’un groupe produisant une réponse
négative sont renvoyés à la maison.
a) Quelle est la probabilité que le test du groupe G1 produise une
réponse négative? Une réponse positive? (Ces probabilités
dépendent bien entendu de M).
Soit A1 : ”Les individus du groupe 1 sont tous sains”. On a:
−
−
P(G−
1 ) = P(G1 |A1 ) · P(A1 ) + P(G1 |A1 ) · P(A1 )
= 0, 95 · 0, 995M + 0, 01 · (1 − 0, 995M )
= 0, 01 + 0, 94 · 0, 995M
puis
−
M
P(G+
1 ) = 1 − P(G1 ) = 0, 99 − 0, 94 · 0, 995
b) Soit Z la variable représentant le coût total de ces dépistages
(groupés, puis éventuellement individuels, pour les soldats des
groupes positifs). Calculer E(Z) en fonction de M.
−
En posant P(G+
1 ) = 1 − P(G1 ) = δM , on obtient
n
o
PN N k
N −k
E(Z) = 10 × N + M k=1 k δM (1 − δM )
·k
1
7
= 10 × {N + M(N · δM )} = 10 · ( M + δM )
Comment règlera-t-on donc la valeur de M?
Il s’agit de faire en sorte que E(Z) soit aussi petit que possible,
ce qui revient ici à minimiser la fonction f : x 7→
δx = 0, 99 − 0, 94 · 0, 995x . On a
∀x ∈]0; +∞[,
f ′ (x) = −
1
x
+ δx , avec
1
− 0, 94 · ln(0, 995) · 0, 995x ,
2
x
Remarquons que f est strictement convexe (f ′ strictement
croissante) dans ]0; +∞[, et que f ′ s’annule en l’unique x0 > 0
tel que
x20 · 0, 995x0 = −
1
≈ 212, 23
0, 94 ln(0, 995)
En tatonnant par dicchotomie, on trouve que cette unique
valeur x0 est proche de l’entier M0 = 15.
Les autorités bandrikaises auront donc avantage à effectuer
les tests par groupes de 15 soldats.
(De toute évidence, l’entier M = 15 ne divise pas 106 ; on
constituera donc 66′ 666 groupes de M0 = 15 soldats, ainsi
qu’un dernier groupe de 10 soldats).