2.1 Question Réponse 2.2 Question Réponse
Transcription
2.1 Question Réponse 2.2 Question Réponse
Questions et réponses Chapitre 2 • L’approche statistique de la réalité 1 Expliquer la notion de variable et définir les différents types de variables Décrire les échelles de classification et transformer les données pour passer d’une échelle à une autre Interpréter un tableau de fréquences Interpréter les représentations graphiques des distributions de fréquences Calculer et interpréter les mesures de tendance centrale Calculer et interpréter les mesures de dispersion Décrire les principes de l’échantillonnage et les principales méthodes utilisées Énoncer les principes qui permettent de déterminer la taille d’un échantillon 2.1 Question Classez les variables suivantes selon qu’elles sont qualitatives ou quantitatives, discrètes ou continues : religion, langue maternelle, nombre d’enfants par famille, durée du mariage, sexe, âge. Réponse Religion : qualitative. Langue maternelle : qualitative. Nombre d’enfants par famille : quantitative discrète. Durée du mariage : quantitative continue. Sexe : qualitative. Âge : quantitative continue. 2.2 Question Pour chacune des variables ci-dessous, les classes qui en constituent l’échelle de classification sont-elles mutuellement exclusives et collectivement exhaustives ? Expliquez brièvement. a) État civil : célibataire sans enfant, marié sans enfant, marié, veuf. b) Poids : ≤ 40 kg, 40-50 kg, 50-60 kg, 60-70 kg. c) Groupe sanguin : A, B, O. d) Nombre de lits dans un hôpital : 50-70, 71-90, 91-100, 101-120. e) Nombre d’élèves dans une classe : 0-10, 11-20, 21-30, 31-40, > 40. Réponse a) Les classes constituant cette échelle ne sont pas mutuellement exclusives puisqu’une même personne peut être classée dans deux catégories : mariée et mariée sans enfant. Elles ne sont pas exhaustives puisque l’échelle ne comprend ni les personnes divorcées ni les célibataires avec enfant. b) Ces classes ne sont pas exclusives, car « 40 kg », « 50 kg » et « 60 kg » sont contenus dans deux classes. De plus, elles ne sont pas exhaustives puisque les gens de plus de 70 kg ne peuvent être classés. e Épidémiologie appliquée, 2 édition © 2008 Les Éditions de la Chenelière inc. Questions et réponses Chapitre 2 • L’approche statistique de la réalité 2 c) Ces classes ne sont pas exhaustives puisque l’échelle ne comprend pas les classes « AB » et « Inconnu » (au cas où l’information ne serait pas disponible). d) Ces classes ne sont pas exhaustives puisque l’échelle ne comprend pas les classes « < 50 » et « > 120 ». e) Les classes qui constituent cette échelle sont bien mutuellement exclusives et collectivement exhaustives. 2.3 Question Voici quelques échelles de classification : a) Niveau d’instruction : primaire, secondaire, collégial, universitaire. b) Évolution d’un cancer : stade I, stade II, stade III, stade IV. c) Diagnostic : malaria, schistosomiase, diarrhée, rougeole. d) Nombre de patients admis dans un hôpital tous les jours : < 20, 20-39, 40-59, 60-79, >79. Établissez de quel type d’échelles il s’agit, en choisissant une réponse parmi les suivantes. A. « a » est ordinale, « b » est ordinale, « c » est nominale, « d » est par intervalle. B. « a » est nominale, « b » est ordinale, « c » est nominale, « d » est par intervalle. C. « a » est ordinale, « b » est ordinale, « c » est nominale, « d » est continue. D. « a » est par intervalle, « b » est par intervalle, « c » est nominale, « d » est discrète. E. « a » est nominale, « b » est nominale, « c » est nominale, « d » est par intervalle. Réponse La réponse est A.. En effet, les classes des variables niveau d’instruction et évolution du cancer sont ordonnées. Les classes de la variable diagnostic sont simplement nommées. Le nombre de patients est classé par intervalle de 20 personnes. 2.4 Question Dans un groupe de 80 personnes suivies périodiquement dans le cadre de la lutte contre les infections transmissibles sexuellement et par le sang (ITSS), les données brutes de tension artérielle systolique (TAS) sont les suivantes (en mm Hg) : 120 130 122 127 140 142 135 120 145 160 150 140 125 143 125 170 165 137 128 124 143 125 132 135 142 138 128 155 145 138 132 124 137 155 158 132 175 124 157 141 133 148 152 154 134 148 123 122 129 138 144 132 127 121 132 125 180 162 145 138 125 131 123 130 120 121 142 124 134 120 130 121 123 131 126 125 132 127 163 121 a) Formez quelques classes pour la présentation des données, d’abord sur une échelle par intervalle. b) Présentez les données sous forme de tableau de distribution de fréquences. c) Présentez graphiquement les données. d) Quelles sont la valeur minimale, la valeur maximale et l’étendue de la tension artérielle systolique ? e Épidémiologie appliquée, 2 édition © 2008 Les Éditions de la Chenelière inc. Questions et réponses Chapitre 2 • L’approche statistique de la réalité 3 e) Quels sont le mode, la médiane et la moyenne ? f) Quels sont la variance, l’écart type et le coefficient de variation ? Réponse a) et b) Classes ≤ 129 130-139 140-149 150-159 ≥ 160 Total c) Effectif 30 22 14 7 7 80 Fréquence relative cumulée (%) 38 65 83 91 100 Fréquence relative (%) 38 28 18 9 9 100 Tension systolique : suivi dans le cadre de la lutte contre les ITSS Nombre de personnes 30 25 20 15 10 5 0 ≤ 129 130-139 140-149 150-159 ≥ 160 mm Hg d) Valeur minimale : 120 mm Hg. Valeur maximale : 180 mm Hg. Étendue : 60 mm Hg. e) Mode : 125 et 132 mm Hg. Médiane : 132 mm Hg. Moyenne : 136,50 mm Hg. f) Variance : 195,4 mm Hg2 Écart type : 13,98 mm Hg. Coefficient de variation : 10,24 %. 2.5 Question Dix chiffres de tension artérielle parmi les précédents ont été tirés au hasard : 124, 125, 132, 135, 124, 158, 154, 148, 145 et 125. Si vous calculez leur moyenne, sera-t-elle égale à celle que vous avez calculée à l’exercice précédent ? Qu’en concluez-vous ? Réponse Non. La moyenne de l’échantillon présenté ici est de 137 mm Hg. En choisissant au hasard quelques données, on se trouve à former un échantillon. En général, la moyenne d’un échantillon estime la moyenne de la population mais elle en est différente. e Épidémiologie appliquée, 2 édition © 2008 Les Éditions de la Chenelière inc. Questions et réponses 2.6 Chapitre 2 • L’approche statistique de la réalité 4 Question Le tableau suivant, présentant la distribution de fréquences de la variable tension artérielle systolique dans un groupe de pêcheurs ivoiriens, vous semble-t-il adéquat ? Tension artérielle systolique (mm Hg) 120-130 130-140 140-150 150-160 160-170 180-190 190-200 Total Fréquence relative (%) 1,7 13,2 33,9 36,3 11,5 1,7 1,7 100,0 Effectif 2 16 41 44 14 2 2 121 Réponse Non. Ce tableau présente des classes qui ne sont pas mutuellement exclusives puisqu’elles se recoupent. En outre, elles ne sont pas exhaustives puisque les personnes dont la tension artérielle se situerait entre 171 et 179 mm Hg ne pourraient être incluses, non plus que celles chez qui elle serait inférieure à 120 mm Hg ou supérieure à 200 mm Hg. De plus, ce tableau ne comporte pas de titre et n’indique pas la source des données. 2.7 Question La tante de Yako vient de déménager dans votre quartier. Elle vous présente son fils, Gouloum, âgé de trois ans. Il est manifestement enjoué et en bonne santé. Elle vous montre son carnet de santé et sa fiche de suivi staturo-pondéral (voir les figures présentées ci-dessous). Parmi les cinq conduites décrites ci-dessous, laquelle devrait être la vôtre ? Justifiez votre réponse. a) Vous la félicitez pour le suivi attentif de son fils et lui suggérez de revenir vous voir dans un an. b) Vous la félicitez pour le suivi attentif de son fils et lui suggérez de revenir vous voir dans un an. Vous recueillez cependant les renseignements concernant la santé de l’enfant (anamnèse) et le soumettez à un examen complet puisque c’est la première fois que vous le voyez. c) Vous trouvez Gouloum un peu gras, mais en bonne santé. La tante de Yako vous explique qu’on lui avait dit qu’il était un peu maigre à sa naissance mais qu’il a rattrapé le temps perdu. Cela vous satisfait et vous lui recommandez de revenir l’an prochain. d) En vous fiant aux courbes de croissance, vous constatez que Gouloum était à la naissance un enfant assez grand et un peu maigre. À l’âge de huit mois, il avait le poids idéal pour sa taille. Cependant, depuis l’âge d’un an, son poids augmente beaucoup plus rapidement que sa taille. Vous interrogez la tante de Yako sur les habitudes alimentaires de sa famille, procédez à l’anamnèse et à l’examen physique de son fils, lui proposez de rencontrer un nutritionniste et suggérez une rencontre dans trois mois. e) Vous rassurez la tante de Yako sur le poids de Gouloum en lui expliquant que, pour assurer un bon développement cérébral, il est préférable qu’un enfant soit un peu gras dans sa petite enfance. Vous lui offrez tout de même de rencontrer un nutritionniste si elle le désire. e Épidémiologie appliquée, 2 édition © 2008 Les Éditions de la Chenelière inc. Questions et réponses Chapitre 2 • L’approche statistique de la réalité 5 Fiche de suivi staturo-pondéral de Gouloum : courbes de la croissance de la naissance à 36 mois e Épidémiologie appliquée, 2 édition © 2008 Les Éditions de la Chenelière inc. Questions et réponses Chapitre 2 • L’approche statistique de la réalité 6 Fiche de suivi staturo-pondéral de Gouloum : courbes de la croissance de la naissance à 36 mois (suite) Date d’examen : Taille : Poids : 24/6/05 52,5 cm 3 220 g 22/8/05 59 cm 4 982 g 14/2/06 73,5 cm 9 922 g 27/4/06 75,5 cm 11 092 g 16/12/06 84,8 cm 13 500 g 29/8/07 91,8 cm 15 640 g 23/4/08 98 cm 17 375 g Réponse La réponse est D. En effet, à sa naissance, Gouloum était entre le 70e et le 90e percentile quant à la taille. Depuis, il a toujours évolué entre ces limites pour ce qui est de la taille. Par contre, il était entre le 25e et le 50e percentile quant au poids à la naissance. Par la suite, son poids est passé au même percentile que sa taille, a par après grimpé au 90e, puis au-delà du 97e percentile. Aujourd’hui, Gouloum est manifestement obèse et sa courbe de croissance du poids est inquiétante. Il est essentiel de prendre la chose au sérieux, de faire un bilan de base et de s’assurer de la collaboration du nutritionniste. Il est vraisemblable qu’il faudra entreprendre une démarche d’éducation de la famille à l’égard de ce problème. 2.8 Question En vous référant aux courbes de croissance présentées dans la figure de l’exercice précédent, déterminez : a) Quel est le poids médian des garçons de 30 mois ? b) Quel devrait être le poids d’un garçon de 26 mois qui mesure 85 cm ? e Épidémiologie appliquée, 2 édition © 2008 Les Éditions de la Chenelière inc. Questions et réponses Chapitre 2 • L’approche statistique de la réalité 7 Réponse a) Le poids médian des garçons de 30 mois est d’environ 13,4 kg. En effet, le poids médian correspond au 50e percentile. b) Puisque le garçon de 26 mois est au 10e percentile quant à la taille, il devrait aussi être au 10e percentile quant au poids et par conséquent peser environ 11 kg. 2.9 Question Marie-Louise est pharmacienne à la polyclinique Milo. Elle veut comparer la consommation de médicaments de plusieurs centres d’accueil de la région. Lors d’une première enquête dans un premier établissement, elle obtient les résultats suivants : Médicament Acétaminophène Aspirine Diazépam Consommation Écart moyenne/jour type 600 mg 60 mg 450 mg 30 mg 20 mg 5 mg Elle pourrait comparer la consommation de tous ces produits, mais elle préférerait en choisir un. Quel médicament lui conseilleriez-vous de mesurer pour comparer les centres entre eux ? Réponse Il serait indiqué de choisir le médicament dont la variabilité est la moins grande parmi les consommateurs des centres d’accueil. Les coefficients de variation des trois médicaments sont dans l’ordre : 10 %, 7 % et 25 %. L’aspirine constituerait donc le meilleur choix. 2.10 Question Voici trois formules : a) n ∑ xi i =1 n b) n ∑ (x − x ) 2 i i =1 n −1 c) n ∑ ( x − μ) i 2 i =1 n Indiquez, pour chacune de ces équations, les mesures qu’elles représentent et donnez un exemple de leur utilisation. Réponse La formule a) représente la somme des observations divisée par le nombre d’observations. Il s’agit donc de la moyenne arithmétique dans une population ou dans un échantillon. Par exemple, si l’on s’intéresse à la moyenne de l’âge des résidants d’un centre d’accueil, chaque xi représente l’âge d’une personne et n correspond au nombre de personnes habitant le centre. On utilise la même formule si, au lieu de cumuler l’âge de tous les résidants, on en choisit un certain nombre au hasard. La moyenne de l’échantillon ainsi calculée estimera la moyenne de la population du centre. La formule b) est la formule de la variance dans un échantillon. On utiliserait cette formule pour mesurer la dispersion des âges des résidants du centre d’accueil choisis au hasard. Chaque xi représente l’âge d’une personne, x, la moyenne de l’âge dans l’échantillon et n, e Épidémiologie appliquée, 2 édition © 2008 Les Éditions de la Chenelière inc. Questions et réponses Chapitre 2 • L’approche statistique de la réalité 8 le nombre de personnes qui constituent l’échantillon. La formule c) est la formule de la variance dans une population. C’est la mesure de la dispersion des âges de toutes les personnes habitant le centre. Ici, µ représente la moyenne de l’âge de cette population et n est le nombre de personnes qui constituent cette population. 2.11 Question La moyenne de concentration de l’hémoglobine d’un échantillon de 3 patients est de 13 g/dl. L’écart type est de 1 g/dl. (Ce sont de vieilles unités de mesure : aujourd’hui, on utilise les g/l, mais pour les besoins de l’exercice, on peut revivre dans le passé quelques instants.) Quelle pourrait être la concentration de l’hémoglobine de chacun des trois patients ? (Pour vous simplifier la tâche, supposez que l’une des valeurs coïncide avec la moyenne.) Réponse Posons que les trois valeurs cherchées sont a, b et c. Nous savons que la moyenne est : a+b+c = 13. 3 Nous savons aussi que la variance est : (a − 13) 2 + (b − 13) 2 + (c − 13) 2 = 1. 2 Il y a plusieurs solutions à ce problème, puisque nous disposons de deux équations pour trouver trois inconnues. Pour nous simplifier la tâche, supposons que l’une des valeurs coïncide avec la moyenne. Posons : a = 13. Il est possible d’en déduire que : 13 + b + c = 13 3 b = 26 − c et donc que : (13 − 13) 2 + [13 − (26 − c) ] + (13 − c) 2 =1 2 (−13 + c) 2 + (13 − c) 2 =1 2 2(169 − 26c + c 2 ) = 2 2 c 2 − 26c + 168 = 0 (c − 12)(c − 14) = 0. Une solution est donc que c = 12 ; et alors b = 14. Nos 3 patients pourraient donc avoir des concentrations d’hémoglobine de 12 g/dl, 13 g/dl et 14 g/dl. Cela satisfait aux conditions du problème. 2.12 Question Le personnel de la polyclinique Milo est constitué de 20 femmes et de 10 hommes. Dans les 2 autres polycliniques de la ville, on compte respectivement 10 femmes et 4 hommes, et 12 femmes et 8 hommes. Quelle est la proportion de femmes dans chaque clinique ? Quelle est la proportion moyenne de femmes dans l’ensemble des cliniques ? e Épidémiologie appliquée, 2 édition © 2008 Les Éditions de la Chenelière inc. Questions et réponses Chapitre 2 • L’approche statistique de la réalité 9 Réponse La proportion de femmes dans chacune des cliniques est respectivement d’environ 66 %, 71 % et 60 %. Le nombre moyen de femmes dans l’ensemble des cliniques est de (20 + 10 + 12)/3, soit 14 femmes. Le nombre moyen de personnes dans les cliniques est de (30 + 14 + 20)/3, soit environ 21,3 personnes. La proportion moyenne de femmes dans l’ensemble des cliniques est donc d’environ 66 %. 2.13 Question Dans le contexte d’une étude comparative dans laquelle on cherche à estimer une différence entre deux ou plusieurs groupes, quels sont les quatre critères qui détermineront la taille de l’échantillon ? Réponse Les quatre critères qui détermineront la taille de l’échantillon sont les suivants : 1. la plus petite différence que l’on veut détecter ; 2. la précision désirée ; 3. la puissance désirée ; 4. la variabilité dans les données. 2.14 Question Quelle est la méthode d’échantillonnage qui offre la meilleure assurance que les individus qui composent l’échantillon seront « représentatifs » de la population à l’étude ? Réponse L’échantillonnage aléatoire. 2.15 Question Dans le cadre d’une étude sur le tabagisme, les chercheurs doivent s’assurer que la proportion de fumeurs et de non-fumeurs dans leur étude sera parfaitement identique à la proportion des fumeurs et des non-fumeurs dans la population d’où est tiré l’échantillon. Quelle stratégie d’échantillonnage devront-ils utiliser ? Réponse L’échantillonnage aléatoire stratifié. 2.16 Question Imaginez une stratégie d’échantillonnage systématique que vous pourriez réaliser à partir du bottin téléphonique. Réponse Différentes options s’offrent à vous : sélectionner le premier nom ou le dernier nom de chaque page ou colonne de noms. Selon le nombre d’individus souhaité dans l’échantillon et le nombre de pages du bottin, vous pourriez répéter cette opération à chaque page, en sautant de façon systématique une ou plusieurs pages. 2.17 Question Vous avez obtenu un stage à la polyclinique Milo. D’emblée, on vous confie la responsabilité de réfléchir à la taille de l’échantillon nécessaire à la réalisation d’une étude portant sur les effets d’un programme de détente sur la tension artérielle diastolique. Deux jours plus tard, vous présentez votre projet pendant la réunion de l’équipe. Pour ce qui est de la taille de l’échantillon nécessaire, vous proposez qu’elle soit de plus de 3 000 personnes. Contrairement à vos attentes, l’enthousiasme ne gagne pas e Épidémiologie appliquée, 2 édition © 2008 Les Éditions de la Chenelière inc. Questions et réponses Chapitre 2 • L’approche statistique de la réalité 10 l’auditoire. Vous expliquez que vous êtes arrivé à ce chiffre en tenant compte de tous les critères voulus. Joël est le premier à rompre le silence pour demander : « En ce qui concerne la plus petite différence détectable, quel critère a été retenu ? » « 1 mm Hg », répondez-vous. Au même moment, vous vous rendez compte que ce n’est peut-être pas réaliste. Pourquoi ? Quelle est la conséquence de cette erreur ? Réponse La détection d’une différence d’environ 1 mm Hg est irréalisable compte tenu des limites des appareils habituels, eu égard à la précision. En outre, cette valeur est cliniquement peu significative. En revanche, une diminution de 4 mm Hg serait intéressante et justifierait que l’on fasse la promotion du programme. Par ailleurs, en diminuant l’exigence de détection, on réduirait la taille de l’échantillon (le nombre de sujets nécessaire). En effet, on passerait de plus de 3 000 à environ 380 personnes, uniquement en changeant le critère de la plus petite différence détectable de 1 mm Hg à 4 mm Hg. 2.18 Question Pendant votre stage à la polyclinique Milo, on vous confie une seconde mission. Cette fois, il s’agit de mener une enquête parmi les sans-abri des villes de Montréal et de Québec. Quelle méthode d’échantillonnage allez-vous privilégier et pourquoi ? Réponse Comme aucun recensement des sans-abri n’existe, on ne peut envisager un échantillonnage aléatoire simple. Une façon de faire pourrait être de trouver les endroits où se regroupent les sans-abri (certaines rues, les refuges, les soupes populaires, etc.). Ces lieux de rencontre constituent des grappes. On pourrait tirer au sort les quelques grappes qui seraient retenues pour l’enquête. Dans chaque grappe, on interrogerait un nombre prédéterminé de personnes. Pour les choisir, on pourrait procéder par échantillonnage systématique en interrogeant la première personne rencontrée, puis la quatrième, puis la septième, etc. 2.19 Question Quelle est la première règle à suivre pour augmenter la puissance statistique d’une étude et la précision des mesures réalisées? Réponse Augmenter la taille de l’échantillon étudié. 2.20 Question Quels sont les quatre éléments à considérer pour établir la taille requise d’un échantillon? Réponse • • • • La plus petite différence que l’on veut détecter La précision souhaitée La puissance souhaitée La variabilité des données e Épidémiologie appliquée, 2 édition © 2008 Les Éditions de la Chenelière inc.