Solutionnaire

Transcription

Solutionnaire
MAT 3777
Test de mi-session (Solutionnaire)
Date: 12 février 2009
Durée: 80 minutes
Professeur: G. Lamothe
# d’étudiant:
Nom:
Prénom:
Ceci est un examen à livre ouvert.
Seules les calculatrices non-programmables et
non-graphiques sont permises.
Total = 18 points
Il y a 12 pages.
1
Partie I - Questions à choix multiples
Question 1 (1 point) Version française. Une usine a vingt chaı̂nes de
montage produisant un jouet populaire. Pour vérifier un échantillon représentatif
de 100 jouets, le personnel du contrôle de la qualité ont cueilli au hasard 5
jouets de chaque chaı̂ne. Ont-ils utilisé un plan d’échantillonage aléatoire
simple?
A) Oui, parce que les jouets ont été sélectionnés au hasard.
B) Oui, parce que chaque jouet produits avait une chance égale d’être sélectionné.
C) Non, parce que pas toutes les combinaisons de 100 jouets pourrait être
choisi.
D) Oui, parce qu’un échantillon stratifié est un type d’échantillon aléatoire
simple.
English Version. A factory has 20 assembly lines producing a popular toy.
To inspect a representative sample of 100 toys, quality control staff randomly
selected 5 toys from each lines output. Did they use a simple random sample
design?
A) Yes, because the toys were selected at random.
B) Yes, because each toy produced had an equal chance to be selected.
C) No, because not all combinations of 100 toys could have been chosen.
D) Yes, because a stratified sample is a type of simple random sample.
Réponse :
C
2
Question 2 (1 point) Version française. Le sondage Gallup a décidé d’accroı̂tre
la taille de son échantillon aléatoire des électeurs canadiens d’environ 1500
personnes à environ 4000 personnes. L’effet de cette augmentation est de:
(A) réduire le biais de l’estimation.
(B) augmenter l’erreur type de l’estimation.
(C) réduire la variabilité de l’estimation.
(D) augmenter la longueur de l’intervalle de confiance pour le paramètre.
(E) n’a aucun effet parce que la taille de la population est la même.
English Version. The Gallup Poll has decided to increase the size of its
random sample of Canadian voters from about 1500 people to about 4000
people. The effect of this increase is to:
(A) reduce the bias of the estimate.
(B) increase the standard error of the estimate.
(C) reduce the variability of the estimate.
(D) increase the confidence interval width for the parameter.
(E) have no effect because the population size is the same.
Réponse :
C
3
Question 3 (1 point) Version française. Une vérificatrice est donnée une
mission de choisir et de vérifier 26 entreprises. Elle énumère toutes les sociétés
dont le nom commence par A, assigne à chacun un numéro, et utilise une table de nombres aléatoires pour choisir un de ces nombres et ainsi une société.
Elle utilise la même procédure pour chaque lettre de l’alphabet et ensuite
combine les 26 résultats dans un groupe pour la vérification. Lequel(s) des
énoncés suivants sont des vrais déclarations?
I. Elle utilise un plan d’échantillonage probabiliste.
II. Son procédé a comme conséquence un échantillon aléatoire simple.
III. Chaque compagnie a une probabilité égale de sélection.
A) I et II B) I et III C) II et III D) I, II et III
E) Aucune de ce qui précède ne donne l’ensemble complet des vraies déclarations.
English version. An auditor is given an assignment to choose and audit
26 companies. She lists all companies whose name begins with A, assigns
each a number, and uses a random number table to pick one of these number
and thus one company. She proceeds to use the same procedure for each
letter of the alphabet and then combines the 26 results into a group for auditing. Which of the following are true statements?
I. She is using a probability sampling design.
II. Her procedure results in a simple random sample.
III. Each company has an equal probability of being selected.
A) I and II B) I and III C) II and III D) I, II and III
E) None of the above gives the complete set of true responses.
E
Réponse:
C’est un plan stratifié (probabiliste). La probabilité d’inclusion est 1/Nh ,
où Nh est le nombre de compagnie dans la strate h (c’est-à-dire le nom de
la compagnie débute avec la même lettre). Puisqu’il est fort probable que
les compagnies ne sont pas distribuées uniformément parmi les différentes
lettres, alors les probabilités d’inclusion ne sont pas égales.
4
Question 4 (1 point) Version française. Considérons une population de
N = 100 unités dont 15 sont non-conformes. Si on cueille un échantillon
aléatoire simple avec remplacement de taille n = 10, quelle est la probabilité
qu’il y ait au moins 2 observations non-conformes?
English Version. Consider a population of N = 100 units such that 15 are
non-conforming. If we select a simple random sample with remplacement of
size n = 10, what is the probability that there are at least 2 non-conforming
observations?
A) 0.5442
B) 0.4625
C) 0.3511
D) 0.5375
E) 0.4557
E
Réponse :
Soit X le nombre d’unités non-conformes dans l’échantillon. Puisque c’est
une sélection avec remplacement alors, X suit une loi binomiale avec n = 10
et p = 15/100. On veut
P (X ≥ 2) = 1 − [P (X = 0) + P (X = 1)]
"
!
10
= 1−
(0.15)0 (1 − 0.15)10 +
0
= 0.4557
5
10
1
!
#
1
9
(0.15) (1 − 0.15)
Question 5 (1 point) Version française. Considérons une population de
N = 100 unités dont 15 sont non-conformes. Si on cueille un échantillon
aléatoire simple sans remplacement de taille n = 10, quelle est la probabilité
qu’il y ait au moins 2 observations non-conformes?
English Version. Consider a population of N = 100 units such that 15 are
non-conforming. If we select a simple random sample without remplacement
of size n = 10, what is the probability that there are at least 2 non-conforming
observations?
A) 0.5442
B) 0.4625
C) 0.3511
D) 0.5375
Réponse :
On veut
P (X ≥ 2) = 1 − [P (X = 0) + P (X = 1)]
!
!
!
!

10
85
10
85

0
10
1
9 




!
!
= 1−
+

100
100


10
10
= 0.4625
6
E) 0.4557
Question 6 (1 point) Version Française. Le directeur d’une banque qui
a 1000 déposants dans une petite ville veut déterminer la proportion de ses
déposants avec plus d’un compte à la banque. Le directeur d’agence veut
être 95 % confiants que l’erreur dans l’estimation de la vraie proportion de la
population des déposants qui ont plus d’un compte à la banque sera moins
de 0.05. Quelle taille d’échantillon est requis si le prélèvement est fait sans
remplacement ?
Version Anglaise. The manager of a bank that has 1,000 depositors in a
small city wants to determine the proportion of its depositors with more
than one account at the bank. A bank manager wants to be 95% confident
that the error in the estimation of the true population proportion of depositors who have more than one account at the bank will be less than 0.05.
What sample size is needed if sampling is done without replacement?
A) 385
B) 278
C) 975
D) 1125
B
Réponse :
Pour la sélection avec remplacement, la taille requise est
(1.96)2
(1.96)2
=
= 384.16 ≈ 385.
n0 =
4e2
4(0.05)2
L’ajustement pour la sélection sans remplacement est
n=
n0
385
=
≈ 278.
1 + n0 /N
1 + 385/1000
7
E) 411
Partie II - Questions à réponses
Question 7 (4 points) Considérons une population de taille N = 5 et supposons qu’on connait
y1 = 5, y2 = 25, y3 = 7, y4 = 5, y5 = 30.
(a) Calculer la moyenne et la variance de la population.
(b) Considérons le plan d’échantillonage suivant.
S
{1, 5}
{2, 3}
{2, 5}
P (S)
1/4
1/4
1/2
Si y est la moyenne de l’échantillon. Calculer E[y], V [y], biais[y], EQM [y].
(c) Compare le plan d’échantillonage en (b) au plan d’échantillonage simple
(avec remplacement). Lequel préfères-tu? (Pourquoi?)
English Version. Consider a population of size N = 5 et suppose that
we know
y1 = 5, y2 = 25, y3 = 7, y4 = 5, y5 = 30.
(a) Calculate the mean and the variance of the population.
(b) Consider the following sampling design
S
{1, 5}
{2, 3}
{2, 5}
P (S)
1/4
1/4
1/2
If y is the sample mean. Calculate E[y], V [y], bias[y], M SE[y].
(c) Compare the sampling design from (b) to a simple random sample design
(without remplacement). Which do you prefer? Why?
8
Solution:
(a) La moyenne de la population est
PN
yU =
i=1
yi
N
=
5 + 25 + 7 + 5 + 30
72
=
= 14.4
5
5
La variance de la population est
2
S =
PN
i=1
2
yi2 − ( N
(52 + . . . + 302 ) − (72)2 /5
i=1 yi ) /N
=
= 146.8.
N −1
5−1
P
b)
S
{1, 5}
{2, 3}
{2, 5}
E[y] =
P (S)
y
1/4 35/2=17.5
1/4
32/2=16
1/2 55/2=27.5
X
yP (S) = 22.125
S
V [y] =
X
S
y 2 P (S) − (
X
yP (S))2 = 29.171875
S
biais[y] = E[y] − y U = 7.725
EQM [y] = V [y] + (biais[y])2 = 88.8475
c) Pour l’échantillonage aléatoire simple (sans remplacement) de taille
n = 2,
S2
n
1−
= 44.04.
EQM [y] = V [y] =
n
N
Pour l’échantillonage aléatoire simple (avec remplacement) de taille n = 2,
l’erreur quadratique moyenne est un peu plus grande: (référence au devoir
2)
!
2
1
1
S
b =
N (N − 1)
= 58.72.
EQM [y] = V (y) = 2 V (t)
N
N2
n
Puisque l’erreur quadratique moyenne pour l’échantillonage simple est
plus petite que pour le plan en (b), alors on préfère le plan simple.
9
Question 8 (4 points) Les directeurs de Wildland veulent estimer le nombre de caribou dans la harde de Nelchina dans l’Alaska central du sud. La
densité de caribou diffère pour les différents types d’habitat. Une enquête
par photographies aériennes préliminaire a identifié le secteur employé par
le troupeau, et le secteur fut divisé en quatres strates basées sur le type
d’habitat. L’organisateur a décidé de diviser le secteur en sous-domaines
appelés des quadrats, chaque d’une superficie de 4 km2 . Le sondage principal sera mené en choisissant un échantillon aléatoire simple de quadrats
dans chaque strate; le nombre du caribou, y, dans les quadrats sera compté
d’une photographie aérienne. Les estimations des moyennes et des écarts
type des mesures, y, dans chaque strate basée sur un échantillon stratifié de
151 quadrats sont dans le tableau ci-dessous.
Strate (h) Nh
1
400
2
40
3
100
4
40
Total
580
yh
sh
Nh s h
nh
98 24.1 74.7 29880
10 25.6 63.7 2548
37 267.6 589.5 58950
6 179.0 151.0 6040
151
97418
(a) Basé sur ce plan stratifié estimer le nombre total de caribou dans la harde
et calculer l’erreur type de l’estimation.
(b) Supposons que nous allons cueillir un total de n = 200 quadrats. Pour
une allocation (i) proportionnelle et (ii) Neyman, donner les allocations nh
pour h = 1, . . . , 4.
English Version. Wildland managers want to estimate the total number
of caribou in the Nelchina herd located in south central Alaska. The density
of caribou differs dramatically in different types of habitat. A preliminary
aerial survey has identified the area used by the herd, and divided it into
four strata based on habitat type. The organiser has decided to divide the
area into sub-areas called quadrats, each 4km2 . The main survey will be conducted by selecting a simple random sample of quadrats from each stratum;
the number of caribou, y, in the quadrats will be counted from an aerial
photograph. Estimates of the means and standard deviations of the measurements, y, in each stratum based on a stratified sample of 151 quadrats
are above in the French version.
10
(a) Based on this stratified design estimate the total number of caribou
in the herd and give the standard error of the estimate.
(b) Suppose that we will collect a total of n = 200 quadrats. For the (i)
proportional allocation and the (ii) Neyman allocation, give the allocations
nh pour h = 1, . . . , 4.
Solution:
(a) On veut estimer le nombre total de caribou dans la harde, c’est-à-dire
P h
P
t = 4h=1 th , où th = N
j=1 yjh . L’estimation du total basé sur ce plan stratifié
est
tbstr =
4
X
tbh =
h=1
4
X
Nh y h = 44584
h=1
La variance de l’estimation est
V (tbstr ) =
4
X
V (tbh ) =
h=1
4
X
Nh2
V (y h ) =
h=1
4
X
h=1
Nh2
Sh2
nh
(1 −
).
nh
Nh
Alors l’erreur type (estimée) de l’estimation est
v
u 4
uX
s2
nh
b
ET [tstr ] = t Nh2 h (1 −
) = 8467.829
h=1
nh
Nh
(b) (i) Pour l’allocation proportionnelle, on utilise nh =
Nh
N
n. Alors
n1 = 0.690 n = 138, n2 = 0.069 n = 14, n3 = 0.172 n = 34, n4 = 0.069 n = 14
(ii) Pour l’allocation Neyman, on utilise
nh =
Nh S h
P4
l=1 Nl Sl
!
n=
Alors
n1 = 0.307 n = 61, n2 = 0.026 n = 5, n3 = 0.605 n = 121, n4 = 0.062 n = 12
11
Question 9 (4 points) Considérons la population de la Question 7. Proposer une stratification de la population tel que V (y str ) < VSRS (y).
English Version. Consider the population from Question 7. Propose a
stratification of the population such that V (y str ) < VSRS (y).
Solution: On devrait construire les strates avec des petites variances intrastrates. Considérons la stratification suivante:
U1 = {2, 5} , U2 = {1, 3, 4}
La variance de la population pour la strate 1 est
S12 =
(252 + 302 ) − (25 + 30)2 /2
= 12.5
2−1
et la variance de la population pour la strate 2
S22 =
(52 + 72 + 52 ) − (5 + 7 + 5)2 /3
= 1.3333.
3−1
Si on cueille une observation de chaque population afin d’avoir un échantillon
de taille n = n1 + n2 = 2, alors
V (y str ) =
H
X
Nh2 Sh2
h=1
N 2 nh
(1 −
nh
22 12.5
1
32 1.3333
1
)= 2·
(1 − ) + 2 ·
(1 − ) = 1.984.
Nh
5
1
5
5
1
5
Alors, V (y str ) < 44.04 = VSRS (y)
12