Statistiques - Devoir Surveillé no 2 - Alexandre Lourme
Transcription
Statistiques - Devoir Surveillé no 2 - Alexandre Lourme
L2 S4 Eco - Gestion Université Bordeaux - Montesquieu 10/04/14 Statistiques - Devoir Surveillé no 2 Durée : une heure. Les calculatrices sont autorisées ; tout autre matériel électronique (comme le téléphone portable) est interdit. Exercice 1. (8 pts) La masse d’une pêche choisie au hasard dans la production de M. Liu est distribuée selon une loi normale de moyenne µ = 90 et de variance σ 2 = 100. On note Sn la masse d’un échantillon aléatoire de n pêche et X̄n = Sn /n la masse moyenne des pêches de l’échantillon. La masse d’un échantillon aléatoire de n pêches est Sn = Pn i=1 Xi où Xi désigne la masse de la pêche i. On suppose que les variables Xi (i = 1, . . . , n) sont indépendantes et que chacune d’elles est distribuée selon N (90, 100). 1. (a) Selon quelle loi S10 est-elle distribuée ? P10 i=1 Xi est la somme de dix variables aléatoires gaussiennes indépendantes Xi (i = 1, . . . , 10) ; elle est P10 P10 donc gaussienne. Sa moyenne est : E(S10 ) = E = i=1 E (Xi ) = 10 × 90 = 900 ; sa variance est : i=1 Xi ind P10 P10 V (S10 ) = V X = V (X ) = 10 × 100 = 1000. i i i=1 i=1 S10 = (b) Déterminez ǫ de sorte que : S10 − ǫ ≤ E(S10 ) ≤ S10 + ǫ avec 95% de chances. On cherche ǫ de sorte que : 0, 95 = P (S10 − ǫ ≤ E(S10 ) ≤ S10 + ǫ) = P (−ǫ ≤ E(S10 ) − S10 ≤ ǫ) = P (−ǫ ≤ S10 − E(S10 ) ≤ ǫ) √ √ √ = P −ǫ/ 1000 ≤ (S10 − E(S10 )) / 1000 ≤ ǫ/ 1000 √ √ = 2Φ ǫ/ 1000 − 1 car (S10 − E(S10 )) / 1000 ∼ N (0, 1) √ 0, 975 = Φ ǫ/ 1000 √ 1, 96 = ǫ/ 1000 √ ǫ = 1, 96 × 1000 ǫ ≈ 62 L’intervalle aléatoire S10 ± 62 contient E(S10 ) = 900 dans 95 cas sur 100. 2. (a) Selon quelle loi X̄n est-elle distribuée ? Pn Sn = aléatoires gaussiennes indépendantes Xi (i = 1, . . . , n) ; elle est donc i=1 Xi est la somme de n variables P Pn n gaussienne, sa moyenne est : E(Sn ) = E = i=1 E (Xi ) = n × 90 et sa variance est : V (Sn ) = i=1 Xi ind Pn Pn V = V (X ) = n × 100. X i i i=1 i=1 X̄n = Sn /n ; ainsi X̄n est gaussienne, sa moyenne est : E(X̄n ) = E(Sn /n) = E(Sn )/n = n × 90/n = 90 = µ et sa variance est : V (X̄n ) = V (Sn /n) = V (Sn )/n2 = n × 100/n2 = 100/n. (b) Déterminez n sachant que µ est entre X̄n ± 2, 35 dans 90% des cas. On cherche n de sorte que : 0, 90 = P X̄n − 2, 35 ≤ µ ≤ X̄n + 2, 35 = P −2, 35 ≤ µ − X̄n ≤ 2, 35 = P −2, 35 ≤ X̄n − µ ≤ 2, 35 q q q = P −2, 35/ 100/n ≤ X̄n − µ / 100/n ≤ 2, 35/ 100/n = 2Φ 0, 95 = Φ q 2, 35/ 100/n − 1 car 2, 35/ q 100/n q X̄n − µ / 100/n ∼ N (0, 1) q 1, 645 = 2, 35/ 100/n n = 100 × (1, 645/2, 35)2 n = 49 Il faut cueillir quarante-neuf pêches pour que la masse moyenne de l’échantillon soit dans l’intervalle µ ± 2, 35 avec neuf chances sur dix. A. Lourme, Faculté d’économie, gestion & AES, Université Bordeaux - Montesquieu. http://alexandrelourme. free.fr 1 Exercice 2. (8 pts) La masse d’un canard mâle (resp. femelle) choisi au hasard dans l’élevage de M. Zhu est distribuée selon une loi normale de moyenne 2, 2kg (resp. 2, 1kg) et d’écart-type 0, 2kg (resp. 0, 21kg). On considère un échantillon aléatoire de n canards mâles et un autre échantillon de m femelles. Xi (i ∈ {1, . . . , n}) désigne la masse du canard i dans l’échantillon de mâles. On suppose que les variables aléatoires Xi (i = 1, . . . , n) sont indépendantes et que chacune d’elles est gaussienne de moyenne 2, 2 et de variance 0, 22 . Pn La statistique Sn = i=1 Xi représente la masse totale de l’échantillon de canards mâles ; elle est gaussienne de moyenne : ind Pn Pn Pn Pn 2 E(Sn ) = E = i=1 E (Xi ) = n × 2, 2 et de variance : V (Sn ) = V i=1 V (Xi ) = n × 0, 2 . i=1 Xi = i=1 Xi La variable aléatoire X̄n = Sn /n représente la masse moyenne de l’échantillon de mâles ; elle est gaussienne de moyenne : E(X̄n ) = E (Sn /n) = E (Sn ) /n = n × 2, 2/n = 2, 2 et de variance : V (X̄n ) = V (Sn /n) = V (Sn )/n2 = n × 0, 22 /n2 = 0, 22 /n. Yj (j ∈ {1, . . . , m}) désigne la masse du canard j dans l’échantillon de femelles. On suppose que les variables aléatoires Yj (j = 1, . . . , m) sont indépendantes et que chacune d’elles est gaussienne de moyenne 2, 1 et de variance 0, 212 . Pm La statistique Tm = femelles ; elle est gaussienne de moyenne : i=1 Yj représente la masse totale de l’échantillon de canards P P Pm ind Pm m m 2 E(Tm ) = E = = j=1 Yj j=1 E (Yj ) = m × 2, 1 et de variance : V (Tm ) = V j=1 Yj j=1 V (Yj ) = m × 0, 21 . La variable aléatoire Ȳm = Tn /n représente la masse moyenne de l’échantillon de femelles ; elle est gaussienne de moyenne : E(Ȳm ) = E (Tm /m) = E (Tm ) /m = m × 2, 1/m = 2, 1 et de variance : V (Ȳm ) = V (Tm /m) = V (Tm )/m2 = m × 0, 212 /m2 = 0, 212 /m. ∆n,m = X̄n − Ȳm est la différence entre la masse moyenne de l’échantillon de n mâles et celle de l’échantillon de m femelles. Si X̄n et Ȳm sont indépendantes, ∆n,m est gaussienne de moyenne : E(∆n,m ) = E(X̄n − Ȳm ) = E(X̄n ) − E(Ȳm ) = 2, 2 − 2, 1 = 0, 1 ind et de variance : V (∆n,m ) = V (X̄n − Ȳm ) = V (X̄n ) + V (Ȳm ) = 0, 22 /n + 0, 212 /m. 1. On choisit 20 mâles et 30 femelles ; avec quelle probabilité les mâles ont-ils une masse moyenne inférieure à celle des femelles ? La variable ∆20,30 est gaussienne de moyenne 0, 1 et de variance 0, 22 /20 + 0, 212 /30 = 0, 00347. Ainsi : P(∆20,30 ≤ 0) = √ √ √ √ P (∆ − 0, 1)/ 0, 00347 ≤ −0, 1/ 0, 00347 = Φ(−0, 1/ 0, 00347) = 1 − Φ(0, 1/ 0, 00347) ≈ 1 − Φ(1, 6976) ≈ 0, 0448. Il y a 4, 5% de chances environ pour que la masse moyenne de vingt mâles soit inférieure à celle de trente femelles. 2. On choisit 30 femelles ; combien faut-il choisir de mâles pour que leur masse moyenne soit inférieure à celle des femelles avec deux chances sur cent au plus ? On cherche n de sorte que : P (∆n,30 ≤ 0) ≤ 2/100. Or : p p p P (∆n,30 ≤ 0) = P (∆n,30 − 0, 1)/ 0, 22 /n + 0, 212 /30 ≤ −0, 1/ 0, 22 /n + 0, 212 /30 = Φ −0, 1/ 0, 22 /n + 0, 212 /30 = p p 1−Φ 0, 1/ 0, 22 /n + 0, 212 /30 . Résoudre : 1−Φ 0, 1/ 0, 22 /n + 0, 212 /30 ≤ 2/100 amène : n ≥ 44, 4. Il faut prélever au moins quarante cinq mâles pour que l’écart entre la masse moyenne des mâles soit inférieure à celle des trente femelles dans deux cas sur cent au plus. Exercice 3. (4 pts) Lors des dernières élections présidentielles monsieur So Crazy a recueilli 52% des suffrages masculins et 53% des suffrages féminins. Vous invitez 40 hommes et 50 femmes à votre mariage ; avec quelle probabilité l’écart entre la proportion de ses partisans et de ses partisanes (après le repas) sera-t-il supérieur à 2 × 10−3 ? Xi (i ∈ {1, . . . , 40}) vaut 1/0 si le ie homme invité est favorable/défavorable à M. So Crazy. Les variables aléatoires Xi (i = 1, . . . , 40) sont supposées indépendantes ; chacune est distribuée selon une loi de Bernoulli de paramètre 0, 52 ; elles ont la même espérance : E(X1 ) = · · · = E(X40 ) = 0, 52 et la même variance : V (X1 ) = · · · = V (X40 ) = 0, 52 × 0, 48. P40 La statistique FX = i=1 Xi /40 représente la proportion de partisans de M. So Crazy parmi les quarante hommes invités. D’après le TCL, FX est approximativement distribuée selon une loi normale de moyenne 0, 52 et de variance 0, 52 × 0, 48/40. Yi (i ∈ {1, . . . , 50}) vaut 1/0 si la j e femme invitée est favorable/défavorable à M. So Crazy. Les variables aléatoires Yj (j = 1, . . . , 50) sont supposées indépendantes ; chacune est distribuée selon une loi de Bernoulli de paramètre 0, 53 ; elles ont la même espérance : E(Y1 ) = · · · = E(Y50 ) = 0, 53 et la même variance : V (Y1 ) = · · · = V (Y50 ) = 0, 53 × 0, 47. P50 La statistique FY = i=1 Yj /50 représente la proportion de partisans de M. So Crazy parmi les cinquante femmes invitées. D’après le TCL, FY est approximativement distribuée selon une loi normale de moyenne 0, 53 et de variance 0, 53 × 0, 47/50. ∆ = FX − FY représente la différence entre la proportion de partisans de M. So Crazy parmi les quarante hommes et parmi les cinquante femmes invités. Si FX et FY sont indépendantes, ∆ est gaussienne de moyenne : E(∆) = E(FX − FY ) = ind E(FX ) − E(FY ) = 0, 52 − 0, 53 = −0, 01 et de variance : V (∆) = V (FX − FY ) = V (FX ) + V (FY ) = 0, 52 × 0, 48/40 + 0, 53 × 0, 47/50 = 0, 011222. On en déduit : P |∆| > 2 × 10−3 = 1 − P |∆| ≤ 2 × 10−3 = 1 − P −2 × 10−3 ≤ ∆ ≤ 2 × 10−3 = 1 − √ √ √ √ P (−0, 002 − (−0, 01))/ 0, 011222 ≤ (∆ − (−0, 01))/ 0, 011222 ≤ (0, 002 − (−0, 01))/ 0, 011222 = 1 − P(0, 008/ 0, 011222 ≤ √ √ √ √ ≈ 0, 985. Il y a 98, 5% de (∆ + 0, 01)/ 0, 011222 ≤ 0, 012/ 0, 011222) = 1 − Φ 0, 012/ 0, 011222 − Φ 0, 008/ 0, 011222 chances que l’écart entre la proportion de partisans de M. So Crazy parmi les quarante hommes et parmi les cinquante femmes invités soit supérieur à 2 × 10−3 . 2