Test de fichier QCM AcroteX

Transcription

Test de fichier QCM AcroteX
1
PLPSTA31 – Statistiques 2
Tests d’hypothèses statistiques
Test d’hypothèses sur une proportion
Mode d’emploi des questionnaires à choix multiples
Pour démarrer un exercice, il faut cliquer sur Début . Pour afficher le score obtenu au questionnaire
et les réponses correctes, il faut cliquer sur Fin , puis sur le bouton Réponse :
– le signe 4 indique que la réponse donnée est correcte ;
– le signe 8 indique que la réponse donnée est incorrecte ; les réponses correctes manquantes sont
marquées par l.
Pour certaines questions, les réponses sont détaillées : cliquer sur un des symboles verts 4 ou l
pour accéder aux compléments de réponse.
Il peut y avoir plusieurs propositions correctes dans une liste. Il faut toutes les cocher pour que la
réponse à la question soit considérée comme exacte.
2
Exercice 1
1. On se demande si, lors de la dernière élection présidentielle, dans la majorité des couples mariés les deux époux ont voté
pour le même candidat.
(a) La population étudiée est composée :
des couples mariés ayant voté pour le même candidat lors de la dernière élection présidentielle
des couples mariés ayant voté lors de la dernière élection présidentielle
(b) La proportion p de couples mariés ayant voté pour le même candidat est :
inconnue
égale à 50%
H1 : p > 51%
H1 : p > 50%
(c) Pour le test sur la proportion p, cocher les hypothèses à tester :
H0 : p 0 = 50%
H0 : p = 51%
H0 : p = 50%
H1 : p < 51%
2. En 1975 (source INSEE) 21, 8% des françaises de 15 ans ou plus étaient célibataires. On se demande si pour les françaises
de 15 ans ou plus, le taux p de célibataires en 2010 est supérieur au niveau de 1975.
(a) La population étudiée est composée :
des françaises de 15 ans ou plus, en 1975
des françaises de 15 ans ou plus, en 2010
des françaises de 15 ans ou plus célibataires, en 1975
des françaises de 15 ans ou plus célibataires, en 2010
(b) Le test sur la proportion porte :
sur la proportion p de françaises de 15 ans ou plus, en 2010
sur la proportion p de françaises de 15 ans ou plus célibataires, en 2010
sur la proportion p de françaises de 15 ans ou plus célibataires, en 1975
H1 : p 6= 0, 218
(c) Cocher l’hypothèse alternative H1 à tester :
H1 : p < 0, 218
H1 : p > 0, 218
(d) Cocher le graphique qui montre l’intervalle d’acceptation et la région critique (RC) associés à α :
α
α 2
0,218
RC
Intervalle d'acceptation
f
f
0,218
RC
α
α 2
Intervalle d'acceptation
RC
f
0,218
Intervalle d'acceptation
Cliquer sur 4 ou l pour accéder aux compléments de réponse.
RC
3
Exercice 2
La publicité d’une société qui commercialise un produit de beauté affirme que 90% des utilisateurs sont satisfaits du produit.
Dans un échantillon de 150 utilisateurs, 126 ( soit 84%) se déclarent satisfaits du produit.
A l’aide d’un test sur une proportion, on veut tester l’hypothèse que le pourcentage annoncé dans la publicité est exagéré.
1. La population étudiée est :
la population des utilisateurs du produit de beauté
la population des utilisateurs satisfaits du produit
inconnue
2. La proportion p des utilisateurs satisfaits du produit est :
égale à 90%
3. Pour le test de proportion à réaliser, cocher les hypothèses à tester :
H0 : p 0 = 0, 90
H0 : p = 0, 90
H0 : f = 0, 90
H0 : f = 0, 84
H1 : p > 0, 90
H1 : f < 0, 90
H1 : f < 0, 84
H1 : p 6= 0, 90
4. La statistique de test centrée réduite Z n est donnée par la formule :
F n − 0, 90
F n − 0, 90
X̄ n − 0, 90
r
∗
∗
Sn
Sn
0, 90 × 0, 10
p
p
150
150
150
5. Sous H0 , la statistique Z n :
suit la loi normale N (0 ; 1)
suit approximativement la loi
normale N (0 ; 1)
égale à 84%
H1 : p 1 < 0, 90
H1 : p < 0, 90
F n − 0, 84
r
0, 84 × 0, 16
150
suit approximativement la loi
normale N (0 ; 1) sous certaines
conditions
6. On effectue le test au niveau α = 5%. La borne de la région critique pour la statistique de test est 0,86.
(a) L’intervalle d’acceptation (IA) pour la statistique de test associé au niveau α = 5% est :
I A = ]−∞ ; 0, 86]
I A = [0 ; 0, 86]
I A = [0, 86 ; +∞[
I A = [0, 86 ; 1]
(b) Pour la décision du test, on conclut que :
le taux de satisfaits annoncé est exagéré
(c) Le risque d’erreur associé à la décision est :
(d) la p-valeur αobs du test est :
< 5%
le taux de satisfaits annoncé n’est pas exagéré
égal à 5%
inconnu
≥ 5%
Cliquer sur 4 ou l pour accéder aux compléments de réponse.
4
Les réponses aux questionnaires
Réponse :
On étudie les couples mariés ayant voté lors de la dernière élection présidentielle.
Cette population est divisée en deux catégories :
– la catégorie « Votes identiques », composée des couples dont les deux époux ont voté pour le même candidat ;
– la catégorie « Votes différents », composée des couples dont les deux époux ont voté pour des candidats différents.
On s’interroge sur la proportion p de la catégorie « Votes identiques ».
Pour revenir au cadre formel du test (population, variable), on peut voir ces deux catégories comme les deux modalités d’une
variable qualitative dichotomique appelée par exemple Votes des deux époux.
Retour au questionnaire.
Les réponses aux questionnaires
5
Réponse :
La proportion p de couples mariés ayant voté pour le même candidat lors de la dernière élection présidentielle est inconnue.
La proportion théorique testée est 50% (voir la réponse à la question suivante pour plus de détails).
Retour au questionnaire.
Les réponses aux questionnaires
6
Réponse :
L’hypothèse H1 est l’hypothèse pour laquelle dans la majorité des couples ayant voté, les deux époux ont voté pour le même
candidat. Pour cette hypothèse, la proportion p est supérieure à 50%, ce que l’on écrit H1 : p > 50%.
L’hypothèse nulle est H0 : p = 50%.
La notation p 0 désigne la proportion théorique testée, ici 50%.
Retour au questionnaire.
Les réponses aux questionnaires
7
Réponse :
La population étudiée est celle des françaises de 15 ans ou plus, en 2010.
Dans cette population, on s’intéresse à la catégorie des femmes célibataires.
La population des femmes de 15 ans ou plus en 1975 constitue la population de référence.
Retour au questionnaire.
Les réponses aux questionnaires
8
Réponse :
Le test porte sur la proportion p inconnue de célibataires chez les françaises de 15 ans ou plus en 2010.
Retour au questionnaire.
Les réponses aux questionnaires
9
Réponse :
La proportion de célibataires de 1975 (21, 8%) sert de valeur de référence pour la proportion de célibataires p de 2010.
L’hypothèse H1 dit que le taux de 2010 est supérieur à celui de 1975, soit H1 : p > 0, 218.
Retour au questionnaire.
Les réponses aux questionnaires
10
Réponse :
La statistique du test est la fréquence empirique de célibataires en 2010, notée F n .
Le test étant unilatéral droit, la région critique est située à l’extrémité droite du domaine de F n et sa borne est fixée par le
risque α choisi.
Retour au questionnaire.
Les réponses aux questionnaires
11
Réponse :
La population étudiée est celle des utilisateurs du produit de beauté. Les utilisateurs satisfaits constituent une catégorie
de la population. C’est sur la proportion d’utilisateurs appartenant à cette catégorie que porte le test d’hypothèses.
Retour au questionnaire.
Les réponses aux questionnaires
12
Réponse :
Le test porte sur la proportion p des utilisateurs satisfaits du produit. Cette proportion est inconnue.
La publicité affirme qu’elle vaut 90%. Ce taux de 90% constitue la valeur de référence (ou théorique) pour p.
Sur l’échantillon, ils sont 84% de satisfaits. Il s’agit de la fréquence de satisfaits observée sur l’échantillon. On la note f obs .
La décision du test est basée sur cette fréquence observée.
Retour au questionnaire.
Les réponses aux questionnaires
13
Réponse :
Les hypothèses portent sur la proportion p.
On teste H0 : p = 0, 90 contre H1 : p < 0, 90. L’hypothèse alternative stipule que le taux de satisfaits avancé par la publicité
est exagéré, c’est-à-dire que moins de 90% des utilisateurs sont satisfaits du produit.
On utilise la notation p 0 pour représenter dans les formules générales la valeur théorique tester (ici 90%).
La notation f , ou plus précisément f obs , est utilisée pour représenter la fréquence de satisfaits observée sur l’échantillon
(ici 84%).
La notation p 1 n’est jamais utilisée pour ce test.
Retour au questionnaire.
Les réponses aux questionnaires
14
Réponse :
La statistique du test est la fréquence empirique de satisfaits, notée F n .
La formule définit la statistique de test centrée réduite Z n obtenue par transformation de la statistique F n .
Cette formule fait intervenir la moyenne et l’écart-type de F n établis sous H0 :
r
µr
¶
0, 90 × 0, 10
p 0 (1 − p 0 )
.
moyenne égale à 0,90 ( p 0 ) et écart-type égal à
150
n
La valeur observée de F n sur l’échantillon tiré au sort est 0,84.
La valeur observée de Z n est calculée à partir de la fréquence observée 0,84 :
0, 84 − 0, 90
= −2, 45.
zobs = r
0, 90 × 0, 10
150
Retour au questionnaire.
Les réponses aux questionnaires
15
Réponse :
Pour la loi de F n sous H0 , on a le résultat suivant :
Si n ≥ 30 et si les deux effectifs théoriques n p 0 et n (1 − p 0 ) sont ≥ 5, alors la loi de F n est approximativement normale :


s
p
(1
−
p
)
0
0 
.
Fn ∼ N  p0 ;
approx.
n
Sous ces même conditions, la statistique centrée réduite Z n suit approximativement la loi normale N (0 ; 1).
Les conditions sur n et les effectifs théoriques sont satisfaites :
n = 150 ≥ 30
n p 0 = 150 × 0, 90 = 135 ≥ 5 et n (1 − p 0 ) = 150 × 0, 10 = 15 ≥ 5.
Retour au questionnaire.
Les réponses aux questionnaires
16
Réponse :
Le test étant unilatéral gauche, la région critique est située à l’extrémité gauche du domaine de F n .
Le graphique représente la région critique (RC) et l’intervalle d’acceptation (IA) pour F n associés au risque α = 5%.
α
0,86
RC
0,90
f
Intervalle d'acceptation
La statistique F n prenant des valeurs entre 0 et 1, on a :
I A = [0, 86 ; 1]
et
RC = [0 ; 0, 86[.
Retour au questionnaire.
Les réponses aux questionnaires
17
Réponse :
La fréquence observée de satisfaits est égale à 0, 84. Elle appartient à la région critique. On rejette donc H0 et on accepte
H1 avec un risque d’erreur α = 5%.
Avec un risque d’erreur de 5%, on peut donc conclure que le taux de satisfaits annoncé par la publicité est exagéré.
Retour au questionnaire.
Les réponses aux questionnaires
18
Réponse : La fréqence observée de satisfaits est égale à 0, 84. Elle appartient à la région critique. On rejette donc H0 et on
accepte H1 avec un risque d’erreur α = 5%.
Avec un risque d’erreur de 5%, on peut donc conclure que le taux de satisfaits annoncé par la publicité est exagéré.
Retour au questionnaire.
Les réponses aux questionnaires
19
αobs < 5%
Réponse :
p-valeur αobs : aire de la surface en bleu, délimitée par la fréquence observée 0,84.
Le test étant unilatéral gauche, la p-valeur est définie par
αobs
αobs = P H0 (F n ≤ 0, 84).
0,84
0,90
f
5%
Risque α = 5% : aire de la surface en rouge, fixe la région critique. La borne de la région critique est 0,86.
0,86
RC
0,90
f
Intervalle d'acceptation
Pour le calcul de la p-valeur, on a :
αobs = P H0 (F n ≤ 0, 84) = P ( Z n ≤ −2, 45) = F (−2, 45) = 1 − F (2, 45) = 0, 71%.
La p-valeur est très petite (moins d’1%), le résultat du test est très significatif.
Retour au questionnaire.