Calcul de l`erreur-type Rappel : La distribution d`échantillonnage, c

Transcription

Calcul de l`erreur-type Rappel : La distribution d`échantillonnage, c
Calcul de l’erreur-type
Rappel : La distribution d’échantillonnage, c’est la distribution formée par les statistiques de tous les échantillons
de taille n d’une population. Exemple : si on travaille sur la moyenne. La population a une moyenne, et tous les
échantillon ont un une moyenne différente de la moyenne de la population (c’est ce que l’on appelle l’erreur
d’échantillonnage). Ceci dit, les différentes moyennes ont une distribution normale, et la moyenne des moyennes
d’échantillon est égale à la moyenne de la population. Cette distribution d’échantillonnage des moyennes a un
écart-type. L’écart-type des moyennes d’échantillon par rapport à la population représente l’erreur standard des
moyennes d’échantillon par rapport à la population, c’est pourquoi on l’appelle « l’erreur-type ».
Sans connaître tous les échantillons possible, on peut calculer la valeur de cette erreur type à partir : soit des
données relatives à la population, soit des données relatives à l’échantillon
Information disponible
Taille échantillon/ formule
légende
Taille population
-Moyenne de la population, n/N < 1/20
= σ / √n
= erreur type
-écart-type de la population,
=
-taille de l’échantillon
σ = écart-type de la population
n/N > 1/20
n = taille de l’échantillon
= σ / √n * √ (N-n) N= taille de la population
(N-1) s= écart-type de l’échantillon.
√ = racine
-Moyenne de l’échantillon,
n/N < 1/20
=
s
/
√n
-écart-type de l’échantillon,
=
rappel : il y a une différence de
-taille de l’échantillon
calcul entre la moyenne d’un
n/N > 1/20
= s / √n * √ (N-n) échantillon et la moyenne d’une
population.
(N-1)
σ
σ
σ
σ
σ
Intervalle (ou niveau)
0.9 (90 %)
de confiance
Cote
+/- 1.64
Distribution normale
exemple : intervalle de confiance de 95 %
0.95 (95 %)
0.99 (99 %)
+/- 1.96
+/- 2.58
L’aire contenue entre les deux
bornes est égale à 95 % des cas
possible
47,5 %
-1.96
T de student
47,5 %
+1.96
Voir la table des valeurs de t pour des seuils de signification POUR VÉRIFICATION
UNILATÉRALE de 0,1 (=90 %) ; 0,05 (95 %) et 0,01 (99 %)
Rappel : le dl signifie de degré de liberté. Pour choisir la bonne ligne, dites vous que le
degré de liberté est toujours égal à l’échantillon moins 1 (=n-1).
Exemple : pour un échantillon de 25 : dl=n-1=25-1=24
Si pour cette échantillon de 25 vous cherchez à avoir un niveau de confiance de 95 %,
alors votre t sera égal à 1,711
Estimation d’une moyenne de population à partir de données relatives à un échantillon
Échantillon/
population (n/N)
n/N<1/20
n/N>1/20
légende
=
Taille de
l’échantillon
= moyenne de la population
= xi +/- t*
= xi +/- t*
xi = moyenne de l’échantillon
n < 30
+/- plus ou moins
avec
= s / √n
=
t = t de student
= s / √n * √ (N-n)
avec
(N-1)
= erreur type
σ
σ
σ
σ
σ
= xi +/- Z*
n > 30
avec
σ
σ
= xi +/- Z*
= s / √n
σ
σ
s = écart-type de l’échantillon
n = taille de l’échantillon
N= taille de la population
√= racine
= s / √n * √ (N-n)
(N-1)
Pour utiliser le plus ou moins, il suffit, en deux temps d’additionner et de soustraire le produit de votre cote (t ou
Z) et de votre erreur type.
avec
Exemple n= 1 000 ; N=7 000 000 => n/N=0,00014 < 1/20 donc on choisi la colonne 1 car n/N < 1/20. Par ailleurs
ou choisi la ligne 2 puisque n > 30.
σ
Ensuite on a xi = 20 et s = 6 =>
= s / √n = 6/√1000=0,19
Si on nous demande un intervalle de confiance de 95 % : Z=1,96
σ
Donc : = xi +/- Z*
=20 +/- 1.96 * 0.19= 20 +/- 0,37
Comme : 20-0,37 = 19,63 et 20+0,37=20,37
Nous pouvons affirmer avec un niveau de confiance de 95 % que la moyenne de la population se trouve dans
l’intervalle [19,63 ; 20,37]