Le cours

Transcription

Le cours
Échantillonnage
Objectifs : ­ Notion d’échantillon.
­ Intervalle de fluctuation au seuil de 95%
­ Intervalle de confiance au seuil de 95%
Introduction : Alain, Thomas, Jade, Marie et Joey ont lancé 10 fois un dé cubique, voici les résultats qu'ils ont obtenus:
Alain
Thomas
Jade
Marie
Joey
3/5/1/4/6/2/6/2/3/5
1/4/3/2/5/3/3/5/2/5
2/2/2/4/4/1/1/3/4/1
3/1/6/4/5/5/5/4/6/2
3/1/5/5/3/4/2/5/2/4
1. Quelle proportion p de face 2 devrait il obtenir ?
2. Compléter :
Élève
Alain
Thomas
Jade
Marie
Joey
Nombre de face 2
Fréquence de face 2
3. Compléter :
fréquence
1
0,75
0,5
0,25
0
Alain
Thomas
Jade
Marie
élève
Joey
1) Fluctuation d’échantillonnage
Définition :
Un échantillon de taille n est la série statistique formée des n résultats obtenus lorsqu’on répète n fois, de manière indépendante, une expérience dans les mêmes conditions.
Exemple : Quand on lance plusieurs fois un dé ont obtient une série statistique formé des numéros de face obtenue.
Alain, Thomas, Jade, Marie et Joey ont lancé 10 fois un dé cubique :
Ils ont obtenu des échantillons de taille 10 de cette série statistique
Définition :
la distribution des fréquences associées à un échantillon est la liste des fréquences f des issues de l’échantillon.
Exemple : Les distributions des fréquences de la face 2 pour chaque élèves
Élève
Alain
Thomas
Jade
Marie
Joey
Fréquence de face 2
Propriété : ­ Les fréquences observées f ne sont pas exactement les proportions prévues ou connues p.
­ Les distributions de fréquences varient d’un échantillon à l’autre pour une même expérience.
­ Les distributions de fréquences varient avec la longueur de l’échantillon pour une même expérience.
Ce phénomène est appelé Fluctuation d’échantillonnage.
Remarque :
Lorsque la taille n de l’échantillon augmente, l’ampleur des fluctuations des distributions de fréquence calculées sur ces échantillons de taille n diminue et les fréquences f tendent à se stabiliser vers une proportion p.
Pour obtenir des résultats les plus fiables possibles, il faut simuler un tr ès grand nombre de fois l'expérience.
2) Étude de la fluctuation d’échantillonnage
1) Intervalle de fluctuation d’une fréquence au seuil de 95 %
Propriété :
Soit un caractère dont la proportion connue ou prévue dans la population est p.
Lorsque n  25 et 0,2  p  0,8 , 95% des échantillons de taille n de cette population ont une fréquence f de ce caractère telle que :
1
1
f  p− ; p+
√n
√n
Cet intervalle s’appelle intervalle de fluctuation au seuil de 95 %, ou au risque de 5%.
[
]
Exercice 1:
1. Calculer l'intervalle de fluctuation au seuil de 95 % pour 10 lancers d'obtenir la face 2
2. Calculer l'intervalle de fluctuation au seuil de 95 % pour 100 lancers d'obtenir la face 2 ou la face 4.
•
•
2) Application 1: Prise de décision à partir d’un échantillon.
1
1
Si f  p− ; p+
, alors on peut rejeter l’hypothèse que l’échantillon soit compatible avec le modèle.
√n
√n
1
1
Si f  p− ; p+
, alors on ne peut pas rejeter l’hypothèse que l’échantillon soit compatible avec le modèle.
√n
√n
[
[
]
]
 Quelle que soit la décision prise, il y a toujours le risque que ce ne soit pas la bonne décision dans 5% des cas  Exercice 2 :
26% des français se déclarent allergiques aux pollens de fleurs. On étudie la fréquence f des personnes allergiques dans un échantillon de 400 personnes : on trouve 120 personnes allergiques.
a) Au seuil de confiance de 95 %, entre quelles valeurs varie f ?
b) Le nombre d’allergiques dans cet échantillon est­il anormal ?
3) Application 2: Estimer une proportion inconnue à partir d’échantillon.
À partir d’une fréquence observée f dans un échantillon de grande taille n, on peut estimer la valeur d’une proportion p inconnue dans la 1
1
population à l’aide de l’intervalle de confiance au seuil de 95 % p  f − ; f +
√n
√n
[
]
 Quelle que soit la décision prise, il y a toujours le risque que ce ne soit pas la bonne décision dans 5% des cas  Démonstration :
1
1
1
1
1
1
1
1
1
1
f  p− ; p+
 p ­  f  p +  ­  f ­ p   ­  p ­ f   f­  p  f+ √n
√n
√n
√n
√n
√n
√n
√n
√n
√n
1
1
d’où p  f − ; f +
√n
√n
[
]
[
]
Exercice 3 Lors d’une élection, un sondage portant sur 1000 personnes donne 400 votants pour le candidat A. Avec un risque d’erreur : de 5% ; quelles informations peut­on obtenir sur la proportion de votants pour ce candidat dans la population ?
Exercice 4 :
Un agriculteur désire connaître l’effectif de la population de cerfs sur son exploitation. Il ne sait pas trop comment procéder…
Il fait appel à un statisticien, celui­ci lui propose la démarche suivante :
Pendant un week­end, inviter vos amis à chasser mais avec des paintballs et surtout compter bien les cerfs colorés.
L’agriculteur appelle le statisticien quelque temps plus tard et lui annonce un total de 800 tirs réussis.
Le statisticien lui demande maintenant de se promener chez lui et de compter les cerfs qu’il voit et surtout de noter le nombre de cerfs colorés. La réponse arrive bientôt : 250 cerfs colorés sur 1000 vus.
Quelle est la population de cerfs sur la propriété ?