1. Quel est l`utilité de l`intervalle de confiance

Transcription

1. Quel est l`utilité de l`intervalle de confiance
Biostatistique_-_les_intervalles_de_confiance
1. Quel est l'utilité de l'intervalle de confiance ?
Lorsqu?on travaille avec un échantillon, les résultats que l?on obtient dépendent de cet échantillon. Voici, par
exemple, deux échantillons différents choisis parmi la population des 600 éperlans vivants dans la Baie des
chaleurs au cours de l?hiver 2009.
No
1
2
3
4
5
6
7
8
9
10
11
12
Moyenne
Longueur
134
153
148
198
148
134
148
181
149
132
140
146
150,9
No
1
51
101
151
201
251
301
351
401
451
501
551
Moyenne
Longueur
134
148
164
136
132
164
168
213
201
159
163
169
162,6
On remarque que les deux moyennes sont assez différentes : dans l?échantillon 1, la moyenne de la longueur des
éperlans est de 150.9 'cm'alors que, dans l?échantillon 2, elle est plutôt de 162.6 cm.
On peut donc en déduire que la longueur moyenne dépend de l?échantillon que l?on a choisit. Notons que l'on
pourrait même pousser l?exemple un peu plus loin en choisissant délibérément les 12 plus grands éperlans ou les
12 plus petits.
Ajoutons que plus la taille de l'échantillon sera grande, plus la moyenne de cet échantillon sera plus proche de la
moyenne de la population statistique des 600 éperlans. Par exemple, si on calculait la moyenne des 100 premiers
éperlans, des 200 premiers éperlans ou des 300 premiers éperlans de la population, on obtiendrait respectivement
une longueur moyenne de 151 cm, 153.71 cm et 153.94 cm. On se rapproche donc de la moyenne des 600 éperlans
est de 154,98667 cm.
Pour généraliser les résultats obtenus dans l?échantillon à la population, on va construire un intervalle (dit de
confiance) autour de la moyenne de l?échantillon. Cet intervalle de confiance dépendra de la taille de
l?échantillon, de l?écart type de l?échantillon et de la probabilité d?erreur. Le probabilité d?erreur est une
convention. En biologie on accepte habituellement 5% de probabilité d?erreur.
1. Quel est l'utilité de l'intervalle de confiance ?
1
Biostatistique_-_les_intervalles_de_confiance
2. Calcul de l'intervalle de confiance avec Excel
On utilise Excel pour construire l?intervalle de confiance. Reprenons l?échantillon #2. La moyenne de
l?échantillon est 162.6 cm, l?écart type est 24.82 cm (on utilise la fonction Excel =ecartype()), la taille est 12 et la
probabilité d'erreur (alpha) acceptée est de 5% ou 0.05.
La fonction Excel =intervalle.confiance(0,05; 24,82; 12) donne la valeur 14.04 cm. Cette valeur s?appelle la
marge d?erreur; on l?utilise pour construire l?intervalle de confiance autour de la moyenne de l?échantillon.
De façon plus générale, la fonction Excel est la suivante :
=intervalle.confiance(Pourcentage de se tromper en décimale[alpha]; l?écart type de l?échantillon; la taille de
l?échantillon).
3. Interprétation de l'intervalle de confiance
L'intervalle de confiance nous dit que, considérant la taille de l'échantillon et la dispersion des données (écart type),
la longueur moyenne de la population statistique des 600 éperlans possède 95% de probabilité de se situer entre
162.6 cm ? 14.04 cm et 162.6 cm + 14.04 cm, donc entre 148.56 cm et 176.64 cm. Autrement dit, on a 5% de
chance de se tromper en affirmant que la moyenne de la population se trouve dans l?intervalle 148.56 cm et 176.64
cm.
J'aimerais bien essayer !
(Utilisez la population dans ce fichier pour calculer une moyenne d'un échantillon et son intervalle de confiance).
J'ai une question...
4. Présentation de l'intervalle de confiance
Si vous présentez vos données sous forme de tableau, vous pouvez présenter les moyennes avec leur intervalle de
confiance en-dessous entre parenthèse.
Exemple : une étude faisant resortir les différences de longueur et de masse entre les mâles et les femelles
d'une population d'animaux
Longueur et masse moyennes des individus selon le sexe (intervalles de confiance entre parenthèse)
Mesure/Sexe
Femelle Mâle
62,9
84,3
Longueur (cm)
(± 5,8)
2032,5
Masse (g)
(± 397,4)
(± 4,7)
3588,1
(±
385,2)
2. Calcul de l'intervalle de confiance avec Excel
2
Biostatistique_-_les_intervalles_de_confiance
Ces mêmes résultats peuvent être présentés sous forme de figure. Dans ce cas, on présentera deux graphiques,
puisque les échèles des deux variables sont très différentes. Voici l'allure que peut prendre l'un de ces graphiques :
Cette présentation des données permet de visualiser les intervalles de confiance et de rapidement voir si il y a
chevauchement ou non des deux moyennes comparées. Pour la démarche afin de tracer un diagramme en bâton,
consultez la section Présentation des données 2 - les types de graphiques. Pour ajouter les barres d'erreur,
suivez la démarche suivante :
1. Organisez vos données selon un tableau comme celui-ci :
2. Sélectionnez les 6 cellules du haut pour tracer le graphiques
3. Une fois le graphique tracé, cliquez sur les barres avec le bouton de droite et choisissez Format de la série
de données
4. Dans cet onglet, choisissez Barres d'erreur
5. Dans les options choisissez Les deux
6. Sélectionnez la case Personnalisées
7. Sélectionnez les cellules correspondant à vos intervalles de confiance (B3 et C3 dans l'exemple) pour
définir la braquette supérieure (+) (voir la figure ci-dessous).
8. Sélectionnez les mêmes cellules pour définir la braquette inférieure
Autres capsules
Retour à Biostatistiques
La moyenne, etc.
L'écart-type, etc.
4. Présentation de l'intervalle de confiance
3