DS2 - Université Lille 1

Transcription

DS2 - Université Lille 1
Université de Lille 1
U.F.R. de Mathématiques
L2 Informatique
Année 2015–2016
Examen de probabilités et Statistiques
12 mai 2016
— Ce sujet comporte 3 pages et trois exercices indépendants.
— Documents autorisés : tables statistiques, cours, TD et TP.
— Calculatrices autorisées.
Ex 1. Vache folle
Au début des années 2001, la commission européenne a mis en place une campagne massive
de tests sur les bovins, pour déterminer la contamination par la forme transmissible de
l’Encephalopathie Spongiforme Bovine (ESB) (ou « maladie de la vache folle » . Comme un
test n’est pas fible à 100%, la plupart des tests peuvent conduire à deux erreurs :
— Faux positif : le test détecte une contamination alors qu’en réalité la vache est saine,
— Faux négatif : le test ne détecte pas la maladie alors que la vache est contaminée.
Une étude est faite pour déterminer l’efficacité d’un test donné (en le testant sur des vaches
que l’on sait être infectées et d’autres saines) et les résultats de cette étude amènent à
conclure que 70% des vaches infectées se révèlent positives au test et seulement 10% des
vaches saines. On suppose qu’il y a 2% du cheptel bovin qui est atteint par la maladie.
Dans la suite, on pourra considérer les événements :
— T=« le test est positif »,
— B=« la vache est malade ».
1) Calculer la probabilité qu’une vache au hasard ait un test positif.
2) Sachant qu’une vache présente un test positif, quelle est la probabilité que celle-ci
soit réellement malade ?
Ex 2. Fonction de répartition
Soit X une variable aléatoire sur un espace probabilisé (Ω, F, P) dont la loi est donnée par
la fonction de répartition suivante :

si x < 0,
 0
2
x
si x ∈ [0, 1[,
F (x) =

1
si x ≥ 1.
1)
—
—
—
—
2)
Donner les probabilités suivantes :
P(X ≤ 0),
P(X ∈]0, 1]),
P(X = 0), P(X = 12 ),
P(X ≤ 12 ).
Expliquer pourquoi la variable aléatoire X est à densité et exprimer sa densité.
Université Lille 1
U.F.R. de Maths.
3) Calculer l’espérance et la variance de X.
4) On cherche à simuler un échantillon de n variables aléatoires de même loi que X.
a) Expliquer soigneusement en quoi le programme sous R suivant fait l’affaire :
n<-20
U<-runif(n)
X<-sqrt(U)
Et on obtient le vecteur X suivant :
> X
[1] 0.58488232 0.72493622 0.64198263 0.80455214 0.82218804 0.99970857
[7] 0.95080585 0.79397125 0.09033733 0.63835727 0.54870325 0.22432684
[13] 0.43712607 0.41011151 0.85109670 0.82994725 0.33266039 0.88753946
[19] 0.16867157 0.89957830
b) Commenter la suite du programme :
e<-sum(X)/n
v<-sum(X^2)/n-e^2
Y<-c(X<1/2)
p<-sum(Y)/n
et les résultats :
> e
[1] 0.6320741
> v
[1] 0.07110657
> p
[1] 0.3
c) Puis commenter la figure fournie par le programme suivant :
s<-seq(0,1,by=0.01)
t<-s^2
plot(s,t,type=’l’)
plot(ecdf(X),do.points = FALSE,add=TRUE)
Figure 1 – Deux fonctions à définir
d) On veut étudier l’évolution des variables e, v et p en fonction de n. Pour cela, on
effectue le programme suivant :
n<-1000
U<-runif(n)
page 2/3
L2 Informatique
Probabilités-Statistiques 2015–16
X<-sqrt(U)
e<-cumsum(X)/(1:n)
plot(e,type=’l’)
v<-cumsum(X^2)/(1:n)-e*e
plot(v,type=’l’)
Y<-c(X<1/2)
p<-cumsum(Y)/(1:n)
plot(p,type=’l’)
Et on obtient les 3 figures suivantes :
Commenter les figures obtenues.
Figure 2 – Les variables e, v, et p
Ex 3. Tablettes de chocolat
Une tablette de chocolat sera qualifiée de qualité supérieure si elle contient une teneur en
cacao supérieure à 430 grammes par kilogramme. On effectue un contrôle de qualité sur
un échantillon de 10 tablettes de chocolat. On obtient les teneurs suivantes (exprimées en
grammes par kilogramme) :
505, 1 423, 5 462, 0 391, 9 412, 1 487, 2 439, 0 434, 1 441, 1 474, 2.
On admet que la teneur en cacao d’une tablette de chocolat est modélisée par une variable
aléatoire X qui suit une loi normale N(m, σ 2 ). Et on dispose ainsi de la réalisation d’un 10échantillon X1 , . . . , X10 de même loi que X.
1) On suppose que σ 2 est connu et que σ 2 = 242 . Donner un intervalle de confiance
pour m de niveau de confiance 95%.
2) De manière plus réaliste, on suppose que σ 2 est inconnu. Donner un intervalle de
confiance pour m de niveau de confiance 95%.
page 3/3