DS2 - Université Lille 1
Transcription
DS2 - Université Lille 1
Université de Lille 1 U.F.R. de Mathématiques L2 Informatique Année 2015–2016 Examen de probabilités et Statistiques 12 mai 2016 — Ce sujet comporte 3 pages et trois exercices indépendants. — Documents autorisés : tables statistiques, cours, TD et TP. — Calculatrices autorisées. Ex 1. Vache folle Au début des années 2001, la commission européenne a mis en place une campagne massive de tests sur les bovins, pour déterminer la contamination par la forme transmissible de l’Encephalopathie Spongiforme Bovine (ESB) (ou « maladie de la vache folle » . Comme un test n’est pas fible à 100%, la plupart des tests peuvent conduire à deux erreurs : — Faux positif : le test détecte une contamination alors qu’en réalité la vache est saine, — Faux négatif : le test ne détecte pas la maladie alors que la vache est contaminée. Une étude est faite pour déterminer l’efficacité d’un test donné (en le testant sur des vaches que l’on sait être infectées et d’autres saines) et les résultats de cette étude amènent à conclure que 70% des vaches infectées se révèlent positives au test et seulement 10% des vaches saines. On suppose qu’il y a 2% du cheptel bovin qui est atteint par la maladie. Dans la suite, on pourra considérer les événements : — T=« le test est positif », — B=« la vache est malade ». 1) Calculer la probabilité qu’une vache au hasard ait un test positif. 2) Sachant qu’une vache présente un test positif, quelle est la probabilité que celle-ci soit réellement malade ? Ex 2. Fonction de répartition Soit X une variable aléatoire sur un espace probabilisé (Ω, F, P) dont la loi est donnée par la fonction de répartition suivante : si x < 0, 0 2 x si x ∈ [0, 1[, F (x) = 1 si x ≥ 1. 1) — — — — 2) Donner les probabilités suivantes : P(X ≤ 0), P(X ∈]0, 1]), P(X = 0), P(X = 12 ), P(X ≤ 12 ). Expliquer pourquoi la variable aléatoire X est à densité et exprimer sa densité. Université Lille 1 U.F.R. de Maths. 3) Calculer l’espérance et la variance de X. 4) On cherche à simuler un échantillon de n variables aléatoires de même loi que X. a) Expliquer soigneusement en quoi le programme sous R suivant fait l’affaire : n<-20 U<-runif(n) X<-sqrt(U) Et on obtient le vecteur X suivant : > X [1] 0.58488232 0.72493622 0.64198263 0.80455214 0.82218804 0.99970857 [7] 0.95080585 0.79397125 0.09033733 0.63835727 0.54870325 0.22432684 [13] 0.43712607 0.41011151 0.85109670 0.82994725 0.33266039 0.88753946 [19] 0.16867157 0.89957830 b) Commenter la suite du programme : e<-sum(X)/n v<-sum(X^2)/n-e^2 Y<-c(X<1/2) p<-sum(Y)/n et les résultats : > e [1] 0.6320741 > v [1] 0.07110657 > p [1] 0.3 c) Puis commenter la figure fournie par le programme suivant : s<-seq(0,1,by=0.01) t<-s^2 plot(s,t,type=’l’) plot(ecdf(X),do.points = FALSE,add=TRUE) Figure 1 – Deux fonctions à définir d) On veut étudier l’évolution des variables e, v et p en fonction de n. Pour cela, on effectue le programme suivant : n<-1000 U<-runif(n) page 2/3 L2 Informatique Probabilités-Statistiques 2015–16 X<-sqrt(U) e<-cumsum(X)/(1:n) plot(e,type=’l’) v<-cumsum(X^2)/(1:n)-e*e plot(v,type=’l’) Y<-c(X<1/2) p<-cumsum(Y)/(1:n) plot(p,type=’l’) Et on obtient les 3 figures suivantes : Commenter les figures obtenues. Figure 2 – Les variables e, v, et p Ex 3. Tablettes de chocolat Une tablette de chocolat sera qualifiée de qualité supérieure si elle contient une teneur en cacao supérieure à 430 grammes par kilogramme. On effectue un contrôle de qualité sur un échantillon de 10 tablettes de chocolat. On obtient les teneurs suivantes (exprimées en grammes par kilogramme) : 505, 1 423, 5 462, 0 391, 9 412, 1 487, 2 439, 0 434, 1 441, 1 474, 2. On admet que la teneur en cacao d’une tablette de chocolat est modélisée par une variable aléatoire X qui suit une loi normale N(m, σ 2 ). Et on dispose ainsi de la réalisation d’un 10échantillon X1 , . . . , X10 de même loi que X. 1) On suppose que σ 2 est connu et que σ 2 = 242 . Donner un intervalle de confiance pour m de niveau de confiance 95%. 2) De manière plus réaliste, on suppose que σ 2 est inconnu. Donner un intervalle de confiance pour m de niveau de confiance 95%. page 3/3