2.1 Question Réponse 2.2 Question Réponse

Transcription

2.1 Question Réponse 2.2 Question Réponse
Questions et réponses
Chapitre 2 • L’approche statistique de la réalité
1
Expliquer la notion de variable et définir les différents types de variables
Décrire les échelles de classification et transformer les données pour passer d’une échelle
à une autre
Interpréter un tableau de fréquences
Interpréter les représentations graphiques des distributions de fréquences
Calculer et interpréter les mesures de tendance centrale
Calculer et interpréter les mesures de dispersion
Décrire les principes de l’échantillonnage et les principales méthodes utilisées
Énoncer les principes qui permettent de déterminer la taille d’un échantillon
2.1
Question
Classez les variables suivantes selon qu’elles sont qualitatives ou quantitatives, discrètes
ou continues : religion, langue maternelle, nombre d’enfants par famille, durée du mariage,
sexe, âge.
Réponse
Religion : qualitative.
Langue maternelle : qualitative.
Nombre d’enfants par famille : quantitative discrète.
Durée du mariage : quantitative continue.
Sexe : qualitative.
Âge : quantitative continue.
2.2
Question
Pour chacune des variables ci-dessous, les classes qui en constituent l’échelle de
classification sont-elles mutuellement exclusives et collectivement exhaustives ? Expliquez
brièvement.
a) État civil : célibataire sans enfant, marié sans enfant, marié, veuf.
b) Poids : ≤ 40 kg, 40-50 kg, 50-60 kg, 60-70 kg.
c) Groupe sanguin : A, B, O.
d) Nombre de lits dans un hôpital : 50-70, 71-90, 91-100, 101-120.
e) Nombre d’élèves dans une classe : 0-10, 11-20, 21-30, 31-40, > 40.
Réponse
a) Les classes constituant cette échelle ne sont pas mutuellement exclusives puisqu’une
même personne peut être classée dans deux catégories : mariée et mariée sans
enfant. Elles ne sont pas exhaustives puisque l’échelle ne comprend ni les personnes
divorcées ni les célibataires avec enfant.
b) Ces classes ne sont pas exclusives, car « 40 kg », « 50 kg » et « 60 kg » sont contenus
dans deux classes. De plus, elles ne sont pas exhaustives puisque les gens de plus de
70 kg ne peuvent être classés.
e
Épidémiologie appliquée, 2 édition © 2008 Les Éditions de la Chenelière inc.
Questions et réponses
Chapitre 2 • L’approche statistique de la réalité
2
c) Ces classes ne sont pas exhaustives puisque l’échelle ne comprend pas les classes
« AB » et « Inconnu » (au cas où l’information ne serait pas disponible).
d) Ces classes ne sont pas exhaustives puisque l’échelle ne comprend pas les classes
« < 50 » et « > 120 ».
e) Les classes qui constituent cette échelle sont bien mutuellement exclusives et
collectivement exhaustives.
2.3
Question
Voici quelques échelles de classification :
a) Niveau d’instruction : primaire, secondaire, collégial, universitaire.
b) Évolution d’un cancer : stade I, stade II, stade III, stade IV.
c) Diagnostic : malaria, schistosomiase, diarrhée, rougeole.
d) Nombre de patients admis dans un hôpital tous les jours : < 20, 20-39, 40-59, 60-79,
>79.
Établissez de quel type d’échelles il s’agit, en choisissant une réponse parmi les suivantes.
A. « a » est ordinale, « b » est ordinale, « c » est nominale, « d » est par intervalle.
B. « a » est nominale, « b » est ordinale, « c » est nominale, « d » est par intervalle.
C. « a » est ordinale, « b » est ordinale, « c » est nominale, « d » est continue.
D. « a » est par intervalle, « b » est par intervalle, « c » est nominale, « d » est discrète.
E. « a » est nominale, « b » est nominale, « c » est nominale, « d » est par intervalle.
Réponse
La réponse est A.. En effet, les classes des variables niveau d’instruction et évolution du
cancer sont ordonnées. Les classes de la variable diagnostic sont simplement nommées.
Le nombre de patients est classé par intervalle de 20 personnes.
2.4
Question
Dans un groupe de 80 personnes suivies périodiquement dans le cadre de la lutte contre
les infections transmissibles sexuellement et par le sang (ITSS), les données brutes de
tension artérielle systolique (TAS) sont les suivantes (en mm Hg) :
120
130
122
127
140
142
135
120
145
160
150
140
125
143
125
170
165
137
128
124
143
125
132
135
142
138
128
155
145
138
132
124
137
155
158
132
175
124
157
141
133
148
152
154
134
148
123
122
129
138
144
132
127
121
132
125
180
162
145
138
125
131
123
130
120
121
142
124
134
120
130
121
123
131
126
125
132
127
163
121
a) Formez quelques classes pour la présentation des données, d’abord sur une échelle
par intervalle.
b) Présentez les données sous forme de tableau de distribution de fréquences.
c) Présentez graphiquement les données.
d) Quelles sont la valeur minimale, la valeur maximale et l’étendue de la tension artérielle systolique ?
e
Épidémiologie appliquée, 2 édition © 2008 Les Éditions de la Chenelière inc.
Questions et réponses
Chapitre 2 • L’approche statistique de la réalité
3
e) Quels sont le mode, la médiane et la moyenne ?
f) Quels sont la variance, l’écart type et le coefficient de variation ?
Réponse
a) et b)
Classes
≤ 129
130-139
140-149
150-159
≥ 160
Total
c)
Effectif
30
22
14
7
7
80
Fréquence
relative
cumulée (%)
38
65
83
91
100
Fréquence
relative (%)
38
28
18
9
9
100
Tension systolique : suivi dans le cadre de la lutte contre les ITSS
Nombre de personnes
30
25
20
15
10
5
0
≤ 129 130-139 140-149 150-159 ≥ 160
mm Hg
d) Valeur minimale : 120 mm Hg.
Valeur maximale : 180 mm Hg.
Étendue : 60 mm Hg.
e) Mode : 125 et 132 mm Hg.
Médiane : 132 mm Hg.
Moyenne : 136,50 mm Hg.
f) Variance : 195,4 mm Hg2
Écart type : 13,98 mm Hg.
Coefficient de variation : 10,24 %.
2.5
Question
Dix chiffres de tension artérielle parmi les précédents ont été tirés au hasard : 124, 125,
132, 135, 124, 158, 154, 148, 145 et 125. Si vous calculez leur moyenne, sera-t-elle égale
à celle que vous avez calculée à l’exercice précédent ? Qu’en concluez-vous ?
Réponse
Non. La moyenne de l’échantillon présenté ici est de 137 mm Hg. En choisissant au
hasard quelques données, on se trouve à former un échantillon. En général, la moyenne
d’un échantillon estime la moyenne de la population mais elle en est différente.
e
Épidémiologie appliquée, 2 édition © 2008 Les Éditions de la Chenelière inc.
Questions et réponses
2.6
Chapitre 2 • L’approche statistique de la réalité
4
Question
Le tableau suivant, présentant la distribution de fréquences de la variable tension artérielle
systolique dans un groupe de pêcheurs ivoiriens, vous semble-t-il adéquat ?
Tension artérielle
systolique (mm Hg)
120-130
130-140
140-150
150-160
160-170
180-190
190-200
Total
Fréquence
relative (%)
1,7
13,2
33,9
36,3
11,5
1,7
1,7
100,0
Effectif
2
16
41
44
14
2
2
121
Réponse
Non. Ce tableau présente des classes qui ne sont pas mutuellement exclusives
puisqu’elles se recoupent. En outre, elles ne sont pas exhaustives puisque les personnes
dont la tension artérielle se situerait entre 171 et 179 mm Hg ne pourraient être incluses,
non plus que celles chez qui elle serait inférieure à 120 mm Hg ou supérieure à 200 mm
Hg. De plus, ce tableau ne comporte pas de titre et n’indique pas la source des données.
2.7
Question
La tante de Yako vient de déménager dans votre quartier. Elle vous présente son fils,
Gouloum, âgé de trois ans. Il est manifestement enjoué et en bonne santé. Elle vous
montre son carnet de santé et sa fiche de suivi staturo-pondéral (voir les figures
présentées ci-dessous).
Parmi les cinq conduites décrites ci-dessous, laquelle devrait être la vôtre ? Justifiez votre
réponse.
a) Vous la félicitez pour le suivi attentif de son fils et lui suggérez de revenir vous voir
dans un an.
b) Vous la félicitez pour le suivi attentif de son fils et lui suggérez de revenir vous voir
dans un an. Vous recueillez cependant les renseignements concernant la santé de
l’enfant (anamnèse) et le soumettez à un examen complet puisque c’est la première
fois que vous le voyez.
c) Vous trouvez Gouloum un peu gras, mais en bonne santé. La tante de Yako vous
explique qu’on lui avait dit qu’il était un peu maigre à sa naissance mais qu’il a rattrapé
le temps perdu. Cela vous satisfait et vous lui recommandez de revenir l’an prochain.
d) En vous fiant aux courbes de croissance, vous constatez que Gouloum était à la
naissance un enfant assez grand et un peu maigre. À l’âge de huit mois, il avait le
poids idéal pour sa taille. Cependant, depuis l’âge d’un an, son poids augmente
beaucoup plus rapidement que sa taille. Vous interrogez la tante de Yako sur les
habitudes alimentaires de sa famille, procédez à l’anamnèse et à l’examen physique de
son fils, lui proposez de rencontrer un nutritionniste et suggérez une rencontre dans
trois mois.
e) Vous rassurez la tante de Yako sur le poids de Gouloum en lui expliquant que, pour
assurer un bon développement cérébral, il est préférable qu’un enfant soit un peu
gras dans sa petite enfance. Vous lui offrez tout de même de rencontrer un
nutritionniste si elle le désire.
e
Épidémiologie appliquée, 2 édition © 2008 Les Éditions de la Chenelière inc.
Questions et réponses
Chapitre 2 • L’approche statistique de la réalité
5
Fiche de suivi staturo-pondéral de Gouloum : courbes de la croissance de la
naissance à 36 mois
e
Épidémiologie appliquée, 2 édition © 2008 Les Éditions de la Chenelière inc.
Questions et réponses
Chapitre 2 • L’approche statistique de la réalité
6
Fiche de suivi staturo-pondéral de Gouloum : courbes de la croissance de la
naissance à 36 mois (suite)
Date
d’examen :
Taille :
Poids :
24/6/05
52,5 cm
3 220 g
22/8/05
59 cm
4 982 g
14/2/06
73,5 cm
9 922 g
27/4/06
75,5 cm
11 092 g
16/12/06
84,8 cm
13 500 g
29/8/07
91,8 cm
15 640 g
23/4/08
98 cm
17 375 g
Réponse
La réponse est D. En effet, à sa naissance, Gouloum était entre le 70e et le 90e percentile
quant à la taille. Depuis, il a toujours évolué entre ces limites pour ce qui est de la taille.
Par contre, il était entre le 25e et le 50e percentile quant au poids à la naissance. Par la
suite, son poids est passé au même percentile que sa taille, a par après grimpé au 90e,
puis au-delà du 97e percentile. Aujourd’hui, Gouloum est manifestement obèse et sa
courbe de croissance du poids est inquiétante. Il est essentiel de prendre la chose au
sérieux, de faire un bilan de base et de s’assurer de la collaboration du nutritionniste. Il est
vraisemblable qu’il faudra entreprendre une démarche d’éducation de la famille à l’égard
de ce problème.
2.8
Question
En vous référant aux courbes de croissance présentées dans la figure de l’exercice
précédent, déterminez :
a) Quel est le poids médian des garçons de 30 mois ?
b) Quel devrait être le poids d’un garçon de 26 mois qui mesure 85 cm ?
e
Épidémiologie appliquée, 2 édition © 2008 Les Éditions de la Chenelière inc.
Questions et réponses
Chapitre 2 • L’approche statistique de la réalité
7
Réponse
a) Le poids médian des garçons de 30 mois est d’environ 13,4 kg. En effet, le poids
médian correspond au 50e percentile.
b) Puisque le garçon de 26 mois est au 10e percentile quant à la taille, il devrait aussi
être au 10e percentile quant au poids et par conséquent peser environ 11 kg.
2.9
Question
Marie-Louise est pharmacienne à la polyclinique Milo. Elle veut comparer la
consommation de médicaments de plusieurs centres d’accueil de la région. Lors d’une
première enquête dans un premier établissement, elle obtient les résultats suivants :
Médicament
Acétaminophène
Aspirine
Diazépam
Consommation Écart
moyenne/jour
type
600 mg
60 mg
450 mg
30 mg
20 mg
5 mg
Elle pourrait comparer la consommation de tous ces produits, mais elle préférerait en
choisir un. Quel médicament lui conseilleriez-vous de mesurer pour comparer les centres
entre eux ?
Réponse
Il serait indiqué de choisir le médicament dont la variabilité est la moins grande parmi les
consommateurs des centres d’accueil. Les coefficients de variation des trois médicaments
sont dans l’ordre : 10 %, 7 % et 25 %. L’aspirine constituerait donc le meilleur choix.
2.10 Question
Voici trois formules :
a) n
∑ xi
i =1
n
b)
n
∑ (x − x )
2
i
i =1
n −1
c)
n
∑ ( x − μ)
i
2
i =1
n
Indiquez, pour chacune de ces équations, les mesures qu’elles représentent et donnez un
exemple de leur utilisation.
Réponse
La formule a) représente la somme des observations divisée par le nombre
d’observations. Il s’agit donc de la moyenne arithmétique dans une population ou dans un
échantillon. Par exemple, si l’on s’intéresse à la moyenne de l’âge des résidants d’un
centre d’accueil, chaque xi représente l’âge d’une personne et n correspond au nombre de
personnes habitant le centre. On utilise la même formule si, au lieu de cumuler l’âge de
tous les résidants, on en choisit un certain nombre au hasard. La moyenne de l’échantillon
ainsi calculée estimera la moyenne de la population du centre.
La formule b) est la formule de la variance dans un échantillon. On utiliserait cette formule
pour mesurer la dispersion des âges des résidants du centre d’accueil choisis au hasard.
Chaque xi représente l’âge d’une personne, x, la moyenne de l’âge dans l’échantillon et n,
e
Épidémiologie appliquée, 2 édition © 2008 Les Éditions de la Chenelière inc.
Questions et réponses
Chapitre 2 • L’approche statistique de la réalité
8
le nombre de personnes qui constituent l’échantillon.
La formule c) est la formule de la variance dans une population. C’est la mesure de la
dispersion des âges de toutes les personnes habitant le centre. Ici, µ représente la
moyenne de l’âge de cette population et n est le nombre de personnes qui constituent
cette population.
2.11 Question
La moyenne de concentration de l’hémoglobine d’un échantillon de 3 patients est de 13
g/dl. L’écart type est de 1 g/dl. (Ce sont de vieilles unités de mesure : aujourd’hui, on
utilise les g/l, mais pour les besoins de l’exercice, on peut revivre dans le passé quelques
instants.) Quelle pourrait être la concentration de l’hémoglobine de chacun des trois
patients ? (Pour vous simplifier la tâche, supposez que l’une des valeurs coïncide avec la
moyenne.)
Réponse
Posons que les trois valeurs cherchées sont a, b et c. Nous savons que la moyenne est :
a+b+c
= 13.
3
Nous savons aussi que la variance est :
(a − 13) 2 + (b − 13) 2 + (c − 13) 2
= 1.
2
Il y a plusieurs solutions à ce problème, puisque nous disposons de deux équations pour
trouver trois inconnues. Pour nous simplifier la tâche, supposons que l’une des valeurs
coïncide avec la moyenne.
Posons : a = 13.
Il est possible d’en déduire que :
13 + b + c
= 13
3
b = 26 − c
et donc que :
(13 − 13) 2 + [13 − (26 − c) ] + (13 − c) 2
=1
2
(−13 + c) 2 + (13 − c) 2
=1
2
2(169 − 26c + c 2 ) = 2
2
c 2 − 26c + 168 = 0
(c − 12)(c − 14) = 0.
Une solution est donc que c = 12 ; et alors b = 14. Nos 3 patients pourraient donc avoir
des concentrations d’hémoglobine de 12 g/dl, 13 g/dl et 14 g/dl. Cela satisfait aux
conditions du problème.
2.12 Question
Le personnel de la polyclinique Milo est constitué de 20 femmes et de 10 hommes. Dans
les 2 autres polycliniques de la ville, on compte respectivement 10 femmes et 4 hommes,
et 12 femmes et 8 hommes. Quelle est la proportion de femmes dans chaque clinique ?
Quelle est la proportion moyenne de femmes dans l’ensemble des cliniques ?
e
Épidémiologie appliquée, 2 édition © 2008 Les Éditions de la Chenelière inc.
Questions et réponses
Chapitre 2 • L’approche statistique de la réalité
9
Réponse
La proportion de femmes dans chacune des cliniques est respectivement d’environ 66 %,
71 % et 60 %. Le nombre moyen de femmes dans l’ensemble des cliniques est de (20 +
10 + 12)/3, soit 14 femmes. Le nombre moyen de personnes dans les cliniques est de (30
+ 14 + 20)/3, soit environ 21,3 personnes. La proportion moyenne de femmes dans
l’ensemble des cliniques est donc d’environ 66 %.
2.13 Question
Dans le contexte d’une étude comparative dans laquelle on cherche à estimer une
différence entre deux ou plusieurs groupes, quels sont les quatre critères qui
détermineront la taille de l’échantillon ?
Réponse
Les quatre critères qui détermineront la taille de l’échantillon sont les suivants :
1. la plus petite différence que l’on veut détecter ;
2. la précision désirée ;
3. la puissance désirée ;
4. la variabilité dans les données.
2.14 Question
Quelle est la méthode d’échantillonnage qui offre la meilleure assurance que les individus
qui composent l’échantillon seront « représentatifs » de la population à l’étude ?
Réponse
L’échantillonnage aléatoire.
2.15 Question
Dans le cadre d’une étude sur le tabagisme, les chercheurs doivent s’assurer que la
proportion de fumeurs et de non-fumeurs dans leur étude sera parfaitement identique à la
proportion des fumeurs et des non-fumeurs dans la population d’où est tiré l’échantillon.
Quelle stratégie d’échantillonnage devront-ils utiliser ?
Réponse
L’échantillonnage aléatoire stratifié.
2.16 Question
Imaginez une stratégie d’échantillonnage systématique que vous pourriez réaliser à partir
du bottin téléphonique.
Réponse
Différentes options s’offrent à vous : sélectionner le premier nom ou le dernier nom de
chaque page ou colonne de noms. Selon le nombre d’individus souhaité dans l’échantillon
et le nombre de pages du bottin, vous pourriez répéter cette opération à chaque page, en
sautant de façon systématique une ou plusieurs pages.
2.17 Question
Vous avez obtenu un stage à la polyclinique Milo. D’emblée, on vous confie la
responsabilité de réfléchir à la taille de l’échantillon nécessaire à la réalisation d’une étude
portant sur les effets d’un programme de détente sur la tension artérielle diastolique. Deux
jours plus tard, vous présentez votre projet pendant la réunion de l’équipe.
Pour ce qui est de la taille de l’échantillon nécessaire, vous proposez qu’elle soit de plus
de 3 000 personnes. Contrairement à vos attentes, l’enthousiasme ne gagne pas
e
Épidémiologie appliquée, 2 édition © 2008 Les Éditions de la Chenelière inc.
Questions et réponses
Chapitre 2 • L’approche statistique de la réalité
10
l’auditoire. Vous expliquez que vous êtes arrivé à ce chiffre en tenant compte de tous les
critères voulus. Joël est le premier à rompre le silence pour demander : « En ce qui
concerne la plus petite différence détectable, quel critère a été retenu ? »
« 1 mm Hg », répondez-vous. Au même moment, vous vous rendez compte que ce n’est
peut-être pas réaliste. Pourquoi ? Quelle est la conséquence de cette erreur ?
Réponse
La détection d’une différence d’environ 1 mm Hg est irréalisable compte tenu des limites
des appareils habituels, eu égard à la précision. En outre, cette valeur est cliniquement
peu significative.
En revanche, une diminution de 4 mm Hg serait intéressante et justifierait que l’on fasse la
promotion du programme. Par ailleurs, en diminuant l’exigence de détection, on réduirait la
taille de l’échantillon (le nombre de sujets nécessaire). En effet, on passerait de plus de
3 000 à environ 380 personnes, uniquement en changeant le critère de la plus petite
différence détectable de 1 mm Hg à 4 mm Hg.
2.18 Question
Pendant votre stage à la polyclinique Milo, on vous confie une seconde mission. Cette fois,
il s’agit de mener une enquête parmi les sans-abri des villes de Montréal et de Québec.
Quelle méthode d’échantillonnage allez-vous privilégier et pourquoi ?
Réponse
Comme aucun recensement des sans-abri n’existe, on ne peut envisager un
échantillonnage aléatoire simple. Une façon de faire pourrait être de trouver les endroits
où se regroupent les sans-abri (certaines rues, les refuges, les soupes populaires, etc.).
Ces lieux de rencontre constituent des grappes. On pourrait tirer au sort les quelques
grappes qui seraient retenues pour l’enquête. Dans chaque grappe, on interrogerait un
nombre prédéterminé de personnes. Pour les choisir, on pourrait procéder par
échantillonnage systématique en interrogeant la première personne rencontrée, puis la
quatrième, puis la septième, etc.
2.19 Question
Quelle est la première règle à suivre pour augmenter la puissance statistique d’une étude
et la précision des mesures réalisées?
Réponse
Augmenter la taille de l’échantillon étudié.
2.20 Question
Quels sont les quatre éléments à considérer pour établir la taille requise d’un échantillon?
Réponse
•
•
•
•
La plus petite différence que l’on veut détecter
La précision souhaitée
La puissance souhaitée
La variabilité des données
e
Épidémiologie appliquée, 2 édition © 2008 Les Éditions de la Chenelière inc.