Calcul de l`erreur-type Rappel : La distribution d`échantillonnage, c
Transcription
Calcul de l`erreur-type Rappel : La distribution d`échantillonnage, c
Calcul de l’erreur-type Rappel : La distribution d’échantillonnage, c’est la distribution formée par les statistiques de tous les échantillons de taille n d’une population. Exemple : si on travaille sur la moyenne. La population a une moyenne, et tous les échantillon ont un une moyenne différente de la moyenne de la population (c’est ce que l’on appelle l’erreur d’échantillonnage). Ceci dit, les différentes moyennes ont une distribution normale, et la moyenne des moyennes d’échantillon est égale à la moyenne de la population. Cette distribution d’échantillonnage des moyennes a un écart-type. L’écart-type des moyennes d’échantillon par rapport à la population représente l’erreur standard des moyennes d’échantillon par rapport à la population, c’est pourquoi on l’appelle « l’erreur-type ». Sans connaître tous les échantillons possible, on peut calculer la valeur de cette erreur type à partir : soit des données relatives à la population, soit des données relatives à l’échantillon Information disponible Taille échantillon/ formule légende Taille population -Moyenne de la population, n/N < 1/20 = σ / √n = erreur type -écart-type de la population, = -taille de l’échantillon σ = écart-type de la population n/N > 1/20 n = taille de l’échantillon = σ / √n * √ (N-n) N= taille de la population (N-1) s= écart-type de l’échantillon. √ = racine -Moyenne de l’échantillon, n/N < 1/20 = s / √n -écart-type de l’échantillon, = rappel : il y a une différence de -taille de l’échantillon calcul entre la moyenne d’un n/N > 1/20 = s / √n * √ (N-n) échantillon et la moyenne d’une population. (N-1) σ σ σ σ σ Intervalle (ou niveau) 0.9 (90 %) de confiance Cote +/- 1.64 Distribution normale exemple : intervalle de confiance de 95 % 0.95 (95 %) 0.99 (99 %) +/- 1.96 +/- 2.58 L’aire contenue entre les deux bornes est égale à 95 % des cas possible 47,5 % -1.96 T de student 47,5 % +1.96 Voir la table des valeurs de t pour des seuils de signification POUR VÉRIFICATION UNILATÉRALE de 0,1 (=90 %) ; 0,05 (95 %) et 0,01 (99 %) Rappel : le dl signifie de degré de liberté. Pour choisir la bonne ligne, dites vous que le degré de liberté est toujours égal à l’échantillon moins 1 (=n-1). Exemple : pour un échantillon de 25 : dl=n-1=25-1=24 Si pour cette échantillon de 25 vous cherchez à avoir un niveau de confiance de 95 %, alors votre t sera égal à 1,711 Estimation d’une moyenne de population à partir de données relatives à un échantillon Échantillon/ population (n/N) n/N<1/20 n/N>1/20 légende = Taille de l’échantillon = moyenne de la population = xi +/- t* = xi +/- t* xi = moyenne de l’échantillon n < 30 +/- plus ou moins avec = s / √n = t = t de student = s / √n * √ (N-n) avec (N-1) = erreur type σ σ σ σ σ = xi +/- Z* n > 30 avec σ σ = xi +/- Z* = s / √n σ σ s = écart-type de l’échantillon n = taille de l’échantillon N= taille de la population √= racine = s / √n * √ (N-n) (N-1) Pour utiliser le plus ou moins, il suffit, en deux temps d’additionner et de soustraire le produit de votre cote (t ou Z) et de votre erreur type. avec Exemple n= 1 000 ; N=7 000 000 => n/N=0,00014 < 1/20 donc on choisi la colonne 1 car n/N < 1/20. Par ailleurs ou choisi la ligne 2 puisque n > 30. σ Ensuite on a xi = 20 et s = 6 => = s / √n = 6/√1000=0,19 Si on nous demande un intervalle de confiance de 95 % : Z=1,96 σ Donc : = xi +/- Z* =20 +/- 1.96 * 0.19= 20 +/- 0,37 Comme : 20-0,37 = 19,63 et 20+0,37=20,37 Nous pouvons affirmer avec un niveau de confiance de 95 % que la moyenne de la population se trouve dans l’intervalle [19,63 ; 20,37]