1. Quel est l`utilité de l`intervalle de confiance
Transcription
1. Quel est l`utilité de l`intervalle de confiance
Biostatistique_-_les_intervalles_de_confiance 1. Quel est l'utilité de l'intervalle de confiance ? Lorsqu?on travaille avec un échantillon, les résultats que l?on obtient dépendent de cet échantillon. Voici, par exemple, deux échantillons différents choisis parmi la population des 600 éperlans vivants dans la Baie des chaleurs au cours de l?hiver 2009. No 1 2 3 4 5 6 7 8 9 10 11 12 Moyenne Longueur 134 153 148 198 148 134 148 181 149 132 140 146 150,9 No 1 51 101 151 201 251 301 351 401 451 501 551 Moyenne Longueur 134 148 164 136 132 164 168 213 201 159 163 169 162,6 On remarque que les deux moyennes sont assez différentes : dans l?échantillon 1, la moyenne de la longueur des éperlans est de 150.9 'cm'alors que, dans l?échantillon 2, elle est plutôt de 162.6 cm. On peut donc en déduire que la longueur moyenne dépend de l?échantillon que l?on a choisit. Notons que l'on pourrait même pousser l?exemple un peu plus loin en choisissant délibérément les 12 plus grands éperlans ou les 12 plus petits. Ajoutons que plus la taille de l'échantillon sera grande, plus la moyenne de cet échantillon sera plus proche de la moyenne de la population statistique des 600 éperlans. Par exemple, si on calculait la moyenne des 100 premiers éperlans, des 200 premiers éperlans ou des 300 premiers éperlans de la population, on obtiendrait respectivement une longueur moyenne de 151 cm, 153.71 cm et 153.94 cm. On se rapproche donc de la moyenne des 600 éperlans est de 154,98667 cm. Pour généraliser les résultats obtenus dans l?échantillon à la population, on va construire un intervalle (dit de confiance) autour de la moyenne de l?échantillon. Cet intervalle de confiance dépendra de la taille de l?échantillon, de l?écart type de l?échantillon et de la probabilité d?erreur. Le probabilité d?erreur est une convention. En biologie on accepte habituellement 5% de probabilité d?erreur. 1. Quel est l'utilité de l'intervalle de confiance ? 1 Biostatistique_-_les_intervalles_de_confiance 2. Calcul de l'intervalle de confiance avec Excel On utilise Excel pour construire l?intervalle de confiance. Reprenons l?échantillon #2. La moyenne de l?échantillon est 162.6 cm, l?écart type est 24.82 cm (on utilise la fonction Excel =ecartype()), la taille est 12 et la probabilité d'erreur (alpha) acceptée est de 5% ou 0.05. La fonction Excel =intervalle.confiance(0,05; 24,82; 12) donne la valeur 14.04 cm. Cette valeur s?appelle la marge d?erreur; on l?utilise pour construire l?intervalle de confiance autour de la moyenne de l?échantillon. De façon plus générale, la fonction Excel est la suivante : =intervalle.confiance(Pourcentage de se tromper en décimale[alpha]; l?écart type de l?échantillon; la taille de l?échantillon). 3. Interprétation de l'intervalle de confiance L'intervalle de confiance nous dit que, considérant la taille de l'échantillon et la dispersion des données (écart type), la longueur moyenne de la population statistique des 600 éperlans possède 95% de probabilité de se situer entre 162.6 cm ? 14.04 cm et 162.6 cm + 14.04 cm, donc entre 148.56 cm et 176.64 cm. Autrement dit, on a 5% de chance de se tromper en affirmant que la moyenne de la population se trouve dans l?intervalle 148.56 cm et 176.64 cm. J'aimerais bien essayer ! (Utilisez la population dans ce fichier pour calculer une moyenne d'un échantillon et son intervalle de confiance). J'ai une question... 4. Présentation de l'intervalle de confiance Si vous présentez vos données sous forme de tableau, vous pouvez présenter les moyennes avec leur intervalle de confiance en-dessous entre parenthèse. Exemple : une étude faisant resortir les différences de longueur et de masse entre les mâles et les femelles d'une population d'animaux Longueur et masse moyennes des individus selon le sexe (intervalles de confiance entre parenthèse) Mesure/Sexe Femelle Mâle 62,9 84,3 Longueur (cm) (± 5,8) 2032,5 Masse (g) (± 397,4) (± 4,7) 3588,1 (± 385,2) 2. Calcul de l'intervalle de confiance avec Excel 2 Biostatistique_-_les_intervalles_de_confiance Ces mêmes résultats peuvent être présentés sous forme de figure. Dans ce cas, on présentera deux graphiques, puisque les échèles des deux variables sont très différentes. Voici l'allure que peut prendre l'un de ces graphiques : Cette présentation des données permet de visualiser les intervalles de confiance et de rapidement voir si il y a chevauchement ou non des deux moyennes comparées. Pour la démarche afin de tracer un diagramme en bâton, consultez la section Présentation des données 2 - les types de graphiques. Pour ajouter les barres d'erreur, suivez la démarche suivante : 1. Organisez vos données selon un tableau comme celui-ci : 2. Sélectionnez les 6 cellules du haut pour tracer le graphiques 3. Une fois le graphique tracé, cliquez sur les barres avec le bouton de droite et choisissez Format de la série de données 4. Dans cet onglet, choisissez Barres d'erreur 5. Dans les options choisissez Les deux 6. Sélectionnez la case Personnalisées 7. Sélectionnez les cellules correspondant à vos intervalles de confiance (B3 et C3 dans l'exemple) pour définir la braquette supérieure (+) (voir la figure ci-dessous). 8. Sélectionnez les mêmes cellules pour définir la braquette inférieure Autres capsules Retour à Biostatistiques La moyenne, etc. L'écart-type, etc. 4. Présentation de l'intervalle de confiance 3