IUT de Paris Descartes, Dpt INFO
Transcription
IUT de Paris Descartes, Dpt INFO
IUT de Paris Descartes, Dpt INFO DST de Maths du Vendredi 17 Octobre 2008: Corrigé. 1. Lois classiques: On dispose d’une pièce biaisée produisant ”Pile” avec probabilité p et ”Face” avec probabilité (1 − p) à chaque lancer. Nommer et décrire la loi de X si (i) La pièce est lancée n fois et X compte le nombre de ”Pile” obtenus: X suit une Loi Binomiale de paramètres n et p (X ֒→ B(n; p)); ses valeurs possibles sont 0, 1, . . . , n, avec n k p · (1 − p)n−k ∀k ∈ {0, 1, . . . , n} , P {X = k} = k (ii) La pièce est lancée indéfiniment et X indique l’instant de la première apparition de ”Pile”: X suit une Loi géométrique de paramètre p (X ֒→ G(p)); l’ensemble de ses valeurs possibles est N∗ , avec ∀k ∈ N∗ , P {Y = k} = p · (1 − p)k−1 2. Approximation en Loi: On dispose toujours d’une pièce biaisée produisant ”Pile” avec probabilité p et ”Face” avec probabilité (1 − p) à chaque lancer. (i) A supposer que n est grand et que p vaut n1 , quelle loi discrète utilisera-t-on afin de compter approximativement le nombre de ”Pile” obtenus à l’issue de n jets? On utilisera une Loi de Poisson de paramètre np = 1, notée P(1). (ii) Calculer la probabilité d’obtenir trois ”Pile” exactement selon cette approximation, et comparer avec la valeur exacte dans le 1 cas n = 100, p = 100 . 3 Si X ֒→ P(1): P {X = 3} = e−1 · 13! = e 6 ≈ 0, 0613, tandis que la probabilité exacte est donnée par 100 · 99 · 98 100 3 p · (1 − p)100−3 = · (0, 01)3 · (0, 99)97 ≈ 0, 0610 3 3·2·1 −1 L’approx. Poissonienne est ici valable à 10−3 près. 3. Indépendance: Etant donnés quatre événements A, B, C, D dans un espace de probabilité (Ω; F ; P), donner le sens mathématique des phrases (i) “A, B, C, D sont indépendants deux à deux”: cela signifie que P (A ∩ B) = P(A)·P(B), P (A ∩ C) = P(A)·P(C), . . . , P (C ∩ D) = P(C)·P(D) (au total 42 = 6 identités où la probabilité d’une intersection de deux événements coincide avec le produit de leurs probabilités). (ii) “A, B, C, D sont indépendants dans leur ensemble”: cela signifie que les 6 identités précédentes sont vraies, mais aussi P (A ∩ B ∩ C) = P(A)·P(B)·P(C), . . . , P (B ∩ C ∩ D) = P(B)·P(C)·P(D), ( 43 = 4 identités supplémentaires) et P (A ∩ B ∩ C ∩ D) = P(A) · P(B) · P(C) · P(D). Donner aussi un exemple de situation où l’une de ces deux affirmations est vraie tandis que l’autre est fausse: En considérant quatre jets successifs d’un dé équilibré, si A = E1 , B = E2 , C = E3 , D = E4 sont les événements définis par ∀i ∈ {1, 2, 3} , Ei := “Les jets des lancers i et (i + 1) donnent le même résultat” et E4 := “Les jets du quatrième et du premier lancer donnent le même résultat”, on a pour i 6= j: P (Ei ∩ Ej ) = P(Ei ) · P(Ej ) = 1/36 (même lorsque j = (i + 1)), tandis que P (E1 ∩ E2 ∩ E3 ∩ E4 ) = 6×(1/6)4 = (1/6)3 6= (1/6)4 = P(E1 )·P(E2 )·P(E3 )·P(E4 ). 4. Variance, Covariance et Indépendance: Soient X, Y : Ω −→ R deux v.a. définies sur un même espace Ω. (i) Définir V ar(X) et Cov(X, Y ): Cov(X, Y ) = E(X · Y ) − E(X) · E(Y ), V ar(X) = Cov(X, X) = E(X 2 ) − E(X)2 = E [(X − E(X))2 ]. (ii) Définir Corr(X, Y ). √) Corr(X, Y ) = √ Cov(X,Y V ar(X)· V ar(Y ) . (iii) Pourra-t-on avoir V ar(X) < 0? Non. (iv) Pourra-t-on avoir Cov(X, Y ) < 0? Oui. (v) Pourra-t-on avoir Corr(X, Y ) ≤ −1? Oui (car Corr(X, Y ) = −1 est envisageable). (vi) Pourra-t-on avoir Corr(X, Y ) = −2? Non (car Corr(X, Y ) < −1 n’est pas envisageable). (vii) On suppose enfin que X et Y sont indépendantes. Pourra-t-on avoir Cov(X, Y ) > 0? Non (car alors Cov(X, Y ) = 0). 5. Jeux et Espérances: Une société organisant des jeux de hasard décide de lancer un nouveau produit, le jeu ”BigWin”, selon les règles suivantes: (1) L’achat d’un bulletin de jeu coûte cinq Euros. (2) Chaque bulletin comporte une soixantaine de cases, numérotées de 1 à 60, et le joueur doit cocher sept cases exactement. (3) A l’issue d’un tirage public des sept nombres gagnants, tout joueur ayant coché précisément ces sept nombres reçoit la somme de S Euros, tandis qu’un joueur ayant coché 6 de ces 7 cases seulement reçoit S/100 Euros, et un joueur ayant coché 5 de ces 7 cases seulement reçoit S/1000 Euros. Tout joueur ayant coché au plus 4 des 7 cases tirées au sort ne reçoit rien en retour. Alice décide de prendre part à ce jeu dès la semaine de lancement. Soit X la variable aléatoire représentant le gain net d’Alice à l’issue de ce premier pari. (i) Quelles sont les valeurs possibles de X? v0 = −5, v1 = S/1000 − 5, v2 = S/100 − 5, v3 = S − 5. (ii) Pour chaque valeur possible v, calculer P {X = v} (description de la loi de X). Remarquons que le nombre de “cases correctes” cochées par Alice 7 ). On a ainsi suit une loi H(n = 7, N = 60, p = 60 P (X = v3 ) = mais aussi 53 7 0 7 60 7 = 60 7 et 53 7 2 5 60 7 P (X = v1 ) = P (X = v0 ) = 1 − = 53 7 1 6 60 7 P (X = v2 ) = Enfin −1 3 X i=1 7!53! 7 × 6 × ... × 1 = 60! 60 × 59 × . . . × 54 ≈ 9, 61 · 10−7 ≈ 7, 4929 · 10−5 P (X = vi ) ≈ 0, 999925 (iii) Calculer E(X) en fonction de S. Soit Z la somme versée par la société de jeux à Alice; observons que Z = X + 5, en sorte que P (X = v0 ) = P (Z = 0) , . . . , P (X = v3 ) = P (Z = S) . Donc: E(Z) = 0 × P(Z = 0) + (S/1000) × P (Z = S/1000) + . . . + S× P (Z = S) (53)(7) (53)(7) (53)(7) = S × (1/1000) × 2 60 5 + (1/100) × 1 60 6 + 0 60 7 (7) (7) (7) et (linéarité de l’Espérance) ( E(X) = E(Z)−5 = S× (1/1000) × 53 7 2 5 60 7 + (1/100) × 53 7 1 6 60 7 + 53 7 0 7 60 7 A partir de quelle valeur de S0 a-t-on affaire à un jeu favorable pour Alice? Le jeu devient favorable pour Alice dès lors que E(X) ≥ 0, ou encore dès lors que E(Z) ≥ 5. Ainsi: −1 (532)(75) (531)(76) (530)(77) S0 = 5 × (1/1000) × 60 + (1/100) × 60 + 60 (7) (7) (7) 5×(60 7) = (1/1000)× 53 7 +(1/100)× 53 7 +1 ( 1 )(6) ( 2 )(5) ′ ′ ≈ 57 389 283 ) −5. On prend maintenant le point de vue de la société de jeux en supposant que, lors de la semaine de lancement, un million de bulletins de ”Bigwin” ont étés vendus, tandis que le gain maximum a été fixé à S = 107 Euros. Soit Y la variable aléatoire représentant le bénéfice net réalisé par la société à l’issue de cette première semaine de jeu. (iv) Quelle est la plus grande valeur possible de Y ? Et la plus petite? En nommant wmin et wmax ces deux valeurs extrêmes, on a wmin = 5 · 106 − 106 · S = 5 · 106 − 1013 tandis que wmax = 5 · 106 . (v) Calculer E(Y ) et V ar(Y ) (on pourra représenter Y comme somme de v.a. i.i.d.). Pour chacun des 106 participants, soit Yi la variable prenant la valeur 5 si le joueur i n’a rien gagné, 5−S/1000 = 5−104 = −9′ 995 s’il a gagné S/1000 = 10′ 000 Euros, 5 − S/100 = −99′ 995 s’il a gagné S/100 Euros et 5 − S = 9′ 999′995 Euros s’il a remporté le gain maximum. P 6 On a Y = 10 i=1 Yi , et pour tout i: P {Yi = 5 − S} = 60 7 −1 , P {Yi = 5 − S/100} = tandis que 53 7 1 6 60 7 , P {Yi = 5 − S/1000} = P {Yi = 5} = 1−[P {Yi = 5 − S} + P {Yi = 5 − S/100} + P {Yi = 5 − S/1000}] En introduisant les variables Zi données par Zi = 5 − Yi , on a ensuite, pour chacun des joueurs: ( ) 53 7 53 7 53 7 E(Zi ) = S× (1/1000) × et ( E(Zi2 ) = S 2 × (1/106) × Il vient donc 2 60 7 1 5 + (1/100) × 53 7 2 5 60 7 + (1/104 ) × 60 7 6 + 53 7 1 6 60 7 + 0 7 60 7 ) 53 7 0 7 60 7 ≈ 0, 871 ≈ 2, 76·105 E(Y ) = 106 · E(Y1 ) = 106 · (5 − E(Z1 )) ≈ 4, 129 · 106 et (puisque les variables Y1 , . . . , Y106 sont i.i.d.) V ar(Y ) = 106 ·V ar(Y1 ) = 106 ·V ar(Z1 ) ≈ 2, 76·1011, p V ar(Y ) ≈ 525′ 383 53 7 2 5 60 7 , (vi) Estimer la probabilité P {Y < 4 · 106 } à l’aide du TCL. On obtient donc −0, 129 · 106 −0, 129 · 106 Y − 4, 129 · 106 6 ≈ P Y0 < , < P Y < 4 · 10 = P 525′ 383 525′383 525′ 383 où Y0 est une variable Gaussienne standard. Il vient: P Y < 4 · 106 ≈ FY0 (−0, 25) = 1 − FY0 (0, 25) ≈ 40, 13% 6. Technique de ”Pooling”: De retour au pays après une longue campagne de guerre, un Million de soldats du Bandrika sont soumis à une visite médicale comportant une prise de sang. On estime à p = 0, 005 la proportion de soldats porteurs d’un virus particulièrement dangereux, et les autorités publiques bandrikaises décident d’identifier ces soldats. Un test est mis au point afin de détecter la présence du virus dans un échantillon de sang. (i) Supposons que ce test est imparfait, produisant une réponse positive avec probabilité 0, 99 sur un échantillon de sang renfermant le virus, et une réponse positive avec probabilité 0, 05 pour un échantillon de sang ne renfermant pas le virus. a) L’échantillon d’un soldat est testé, et la réponse est positive. Quelle est la probabilité que ce soldat soit réellement porteur du virus? Avec des définions évidentes pour T + , T − , V + , V − , on obtient P(V + |T + ) = = P(T + |V + )·P(V + ) P(T + |V + )·P(V + )+P(T + |V − )·P(V − ) 0,99·0,005 ≈ 9, 05% 0,99·0,005+0,05·0,995 b) Calculer, pour un soldat quelconque, la probabilité que la réponse du test soit positive pour son échantillon de sang. P(T + ) = P(T + |V + )·P(V + )+P(T + |V − )·P(V − ) = 0, 99·0, 005+0, 05·0, 995 = 5, 47% c) Les échantillons de sang de tous les soldats sont testés individuellement. Soit X la variable aléatoire comptant le nombre de réponses positives. Nommer et décrire la loi de X (valeurs possibles et probabilités correspondantes). X est binomiale de paramètres n = 106 et p = 5, 47%. d) Estimer P{54′ 500 ≤ X ≤ 55′000} au moyen du TCL. E(X) = np = 5, 47 · 104 , V ar(X) = np(1 − p) = 51′ 707, 91 Ainsi, si X0 est une variable Gaussienne standard: P{54′500 ≤ X ≤ 55′ 000} = ≈ = = ≈ 4 P{−0, 88 ≤ X−5,47·10 ≤ 1, 32} 227,4 P{−0, 88 ≤ X0 ≤ 1, 32} FX0 (1, 32) − FX0 (−0, 88) FX0 (1, 32) − (1 − FX0 (0, 88)) 0, 7172 (ii) On suppose en outre que chaque utilisation du test coûte 10 Sequins (monnaie du pays) au contribuable bandrikais. Les autorités décident donc de répartir les 106 échantillons individuels en N = 106 /M groupes G1 , G2 , . . . , GN de M échantillons, où M est un entier divisant 106 , puis de mélanger les échantillons individuels à l’intérieur de chaque groupe et d’effectuer d’abord un test pour chacun des N groupes. Pour ceux des groupes produisant une réponse positive, on testera ensuite chacun des individus du groupe; les individus issus d’un groupe produisant une réponse négative sont renvoyés à la maison. a) Quelle est la probabilité que le test du groupe G1 produise une réponse négative? Une réponse positive? (Ces probabilités dépendent bien entendu de M). Soit A1 : ”Les individus du groupe 1 sont tous sains”. On a: − − P(G− 1 ) = P(G1 |A1 ) · P(A1 ) + P(G1 |A1 ) · P(A1 ) = 0, 95 · 0, 995M + 0, 01 · (1 − 0, 995M ) = 0, 01 + 0, 94 · 0, 995M puis − M P(G+ 1 ) = 1 − P(G1 ) = 0, 99 − 0, 94 · 0, 995 b) Soit Z la variable représentant le coût total de ces dépistages (groupés, puis éventuellement individuels, pour les soldats des groupes positifs). Calculer E(Z) en fonction de M. − En posant P(G+ 1 ) = 1 − P(G1 ) = δM , on obtient n o PN N k N −k E(Z) = 10 × N + M k=1 k δM (1 − δM ) ·k 1 7 = 10 × {N + M(N · δM )} = 10 · ( M + δM ) Comment règlera-t-on donc la valeur de M? Il s’agit de faire en sorte que E(Z) soit aussi petit que possible, ce qui revient ici à minimiser la fonction f : x 7→ δx = 0, 99 − 0, 94 · 0, 995x . On a ∀x ∈]0; +∞[, f ′ (x) = − 1 x + δx , avec 1 − 0, 94 · ln(0, 995) · 0, 995x , 2 x Remarquons que f est strictement convexe (f ′ strictement croissante) dans ]0; +∞[, et que f ′ s’annule en l’unique x0 > 0 tel que x20 · 0, 995x0 = − 1 ≈ 212, 23 0, 94 ln(0, 995) En tatonnant par dicchotomie, on trouve que cette unique valeur x0 est proche de l’entier M0 = 15. Les autorités bandrikaises auront donc avantage à effectuer les tests par groupes de 15 soldats. (De toute évidence, l’entier M = 15 ne divise pas 106 ; on constituera donc 66′ 666 groupes de M0 = 15 soldats, ainsi qu’un dernier groupe de 10 soldats).