Chapitre 3 - L`enquête descriptive simple

Transcription

Chapitre 3 - L`enquête descriptive simple
Chapitre 3 L'enquête
descriptive simple
Version 1.2
AUTEURS
: NELLY AGRINIER - CÉDRIC BAUMANN
- ISABELLE FOURNEL
: FRANCIS GUILLEMIN - GUY HÉDELIN
PRINCIPAUX
CO-AUTEURS
Septembre 2010
Table des matières
Objectifs
5
I - Les principes des méthodes de sondage
7
A. Comment réaliser un sondage ?..........................................................7
1.
2.
3.
4.
Sondage aléatoire................................................................................8
Autres méthodes de sondage...............................................................11
Méthode des quotas (parfois appelée sondage pseudo-aléatoire)..............11
QCM sur les différents types de sondage...............................................11
B. En pratique.....................................................................................13
1. Effectif de personnes requis pour un échantillon.....................................13
2. Comment tirer au sort........................................................................13
3. Exploitation des résultats fournis par le sondage....................................14
C. Interprétation des résultats..............................................................17
1. Taux de participation et non réponses..................................................17
2. Interprétation des résultats.................................................................18
II - La rédaction du protocole d'une investigation en santé
publique
19
A. Les différentes parties du protocole d'une investigation en santé publique
..........................................................................................................19
1. La page de titre.................................................................................19
2. Le plan du protocole, la liste des abréviations........................................20
3. Le résumé du protocole......................................................................20
4. La justification de l'étude....................................................................20
5. L‘hypothèse et l'objectif de l'étude.......................................................21
6. Le schéma général de l'étude/ Plan expérimental...................................21
7. La population et échantillon.................................................................21
8. L'investigation, les explorations étudiées...............................................22
9. La description des données collectées et des méthodes de mesure...........23
10. L'analyse statistique, l'analyse de contenu...........................................23
11. Le déroulement de l'étude, les aspects logistiques................................23
12. Les aspects médico-légaux (éthiques et réglementaires).......................25
13. Les références bibliographiques.........................................................25
14. Les annexes....................................................................................26
III - Le calcul du nombre de sujets nécessaire dans une étude
épidémiologique descriptive transversale
27
A. Justification de l'échantillonnage.......................................................28
B. Précision de la mesure.....................................................................28
1. Fluctuations d'échantillonnage.............................................................28
2. Intervalle de fluctuation......................................................................29
3. Intervalle de confiance.......................................................................31
Reproduction et diffusion interdite sans accord des auteurs.
3
C. Éléments du calcul du nombre de sujets nécessaire.............................34
1. Facteurs liés à la taille de l'échantillon..................................................34
2. Formules pour calculer la taille d'un échantillon aléatoire simple...............34
D. Considérations pratiques..................................................................35
E. Conclusion......................................................................................36
IV - Les méthodes et techniques de base du recueil de
données dans une enquête épidémiologique
37
A. Introduction....................................................................................37
B. Le recueil des informations...............................................................37
1.
2.
3.
4.
Objectifs et contraintes.......................................................................37
Exercice avec corrigé - Le recueil des informations.................................38
Critères de qualité propres à la mesure.................................................38
Type de données...............................................................................39
C. Le bordereau de recueil....................................................................39
1.
2.
3.
4.
5.
6.
7.
Construction d'un bordereau...............................................................39
Organisation et présentation du bordereau (mode de passation)..............44
Modes de passation............................................................................45
Quelques remarques sur la forme........................................................46
Qualité du recueil de l'information........................................................47
Test (ou pré-test) et validation............................................................48
Conclusion........................................................................................48
Solution des exercices de TD
49
Solution des Quiz
51
4
Reproduction et diffusion interdite sans accord des auteurs.
Objectifs
Objectif général :
Être capable de concevoir et d'interpréter de façon critique une enquête descriptive
simple
Objectifs spécifiques :
Connaître les principes des méthodes de sondage et savoir estimer la précision d'un
sondage simple / Savoir discuter la représentativité d'un échantillon
Savoir rédiger le protocole d'une investigation en santé publique
Savoir calculer un nombre de sujets nécessaire dans une étude épidémiologique
descriptive
Utiliser les méthodes et techniques de base du recueil de données
Reproduction et diffusion interdite sans accord des auteurs.
5
Les principes des
méthodes de
sondage
I-
I
Comment réaliser un sondage ?
7
En pratique...
13
Interprétation des résultats
18
Lorsqu'on souhaite mesurer la fréquence d'un phénomène observé dans une
population (prévalence voir cours sur les indicateurs chapitre 1), il n'est le plus
souvent pas possible de mesurer ce phénomène sur l'ensemble des individus
constituant cette population (population = ensemble d'unités statistiques ayant un
caractère commun et sur lesquelles une caractéristique peut être mesurée). En
pratique, lorsqu'on souhaite mesurer la prévalence d'une pathologie ou d'un
phénomène, on travaillera sur un sous ensemble de la population = échantillon, et
c'est sur cet échantillon qu'on mesurera le phénomène qui nous intéresse. Ce
procédé est appelé sondage. La population étudiée, de laquelle on extrait
l'échantillon est appelée population source, et la population à laquelle on souhaite
généraliser les résultats est la population cible.
L'objectif du sondage est donc de pouvoir estimer le phénomène mesuré au niveau
de l'ensemble de la population cible à partir des données qui auront été recueillies
sur l'échantillon (inférence). Le choix de cet échantillon est donc fondamental, et
pour pouvoir interpréter correctement le résultat, cet échantillon doit être
représentatif de la population cible (ie tous les individus de la population dont il
est issu ont la même probabilité non nulle de faire partie de l'échantillon) (voir
cours sur les biais chapitre 5).
La qualité d'une estimation repose sur sa précision (voir cours sur précision d'une
mesure chapitre 2) et sur l'absence de biais (voir cours sur les biais chapitre 5).
A. Comment réaliser un sondage ?
Il est nécessaire de définir au préalable la population à laquelle on s'intéresse.
Il peut s'agir d'unités individuelles (ex : individus) ou d'unités collectives (ex :
hôpitaux). Comme il n'est pas possible le plus souvent d'étudier l'ensemble de cette
population cible, on va choisir une population source. Ce chapitre abordera les
différents moyens de constituer un échantillon à partir de cette population source.
Reproduction et diffusion interdite sans accord des auteurs.
7
Les principes des méthodes de sondage
1. Sondage aléatoire
Le sondage aléatoire est la seule méthode permettant d'échapper complètement au
choix humain, et de limiter les biais de sélection (Voir cours sur les biais chapitre
5). Il s'agit donc de la méthode à privilégier. Il repose sur le tirage au sort.
On tire au sort les unités statistiques parmi l'ensemble de la population. Pour cela,
il faut disposer d'une liste où sont répertoriés tous les individus de la population :
c'est la base de sondage. La base de sondage correspond à la liste de l'ensemble
des individus (ou d'unités collectives) appartenant au champ de l'enquête. Elle doit
être à jour, exhaustive, sans doublon, et doit permettre de contacter les individus.
On peut tirer au sort directement des individus. La base de sondage peut être
constituée par exemple des listes électorales (dans ce cas là, les mineurs et les
personnes non inscrites sur les listes électorales ne seront jamais tirées au sort),
des abonnés téléphoniques (problème des jeunes n'ayant qu'un téléphone portable,
ainsi que des abonnés sur listes rouges)...Il est parfois plus pratique de disposer
non pas d'une liste d'individus, mais d'une liste d'unités collective (ex : liste des
établissements scolaires d'une région) : on parlera alors de sondage en grappe.
a) Sondage aléatoire simple (ou sondage élémentaire) : tirage
direct dans la base de sondage
Principe :
On tire au sort les individus directement dans l'ensemble de la liste (base de
sondage).
Avantage :
*simple
*analyse statistique classique
Inconvénients :
*Cette technique suppose de disposer de la liste exhaustive de tous les individus de
la population source, sinon, il y aura un biais de sélection (voir cours sur les biais
chapitre 5).
Tous les sujets ont la même probabilité d'être sélectionné, qui correspond à la
fraction de sondage f=n/N
Avec n : effectif de l'échantillon
N : effectif de la population
Précision de l'estimation
²
Elle dépend de la variance de l'estimateur, laquelle est de la forme  /n . La
fluctuation d'échantillonnage (défaut de précision) est d'autant plus forte que les
valeurs de la variable étudiée sont plus dispersées dans la population (variance  ²
élevée). En revanche, la précision est d'autant meilleure que l'effectif de
l'échantillon (n) est plus élevé.
Exemple
On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004.
La base peut être constituée par la liste des femmes ayant accouché dans les
différentes maternités de Côte d'Or. Le sondage élémentaire consiste à tirer au sort
les femmes sur cette liste.
Si on ne tirait au sort que dans la liste des femmes ayant accouché dans la seule
maternité accueillant des grossesses à haut risque, l'échantillon ne serait pas
représentatif de l'ensemble des accouchements du département : la prévalence de
8
Reproduction et diffusion interdite sans accord des auteurs.
Les principes des méthodes de sondage
l'accouchement prématuré serait sur-estimée.
b) Sondage stratifié
Principe :
La base de sondage est divisée en groupes homogènes (strates) selon un critère lié
à la variable à estimer (exemple tranche d'âge, sexe, habitat urbain-rural etc..).
Puis un tirage au sort est réalisé dans chaque strate. En pratique, on répartit
d'abord les individus en sous-groupes homogènes pour le caractère étudié (strates)
puis on tire au sort à l'intérieur de chacune de ces strates. L'estimateur pour
l'ensemble de l'échantillon est calculé à partir des estimateurs obtenus dans chaque
strate.
Exemple
Exemple : d'après Rumeau-Rouquette
On cherche à estimer la taille des 12- 18 ans dans
une population. Or, on sait que la taille est liée à
l'âge. Si on isole dans cette population les individus
d'une même classe d'âge, on peut alors segmenter la population en autant de
parties qu'il y a de classe d'âge.
Dans un sondage non stratifié, on va tirer au sort les
individus sans tenir compte de leur strate
d'appartenance (ici, sans tenir compte de la classe
d'âge). Par exemple, si on tire on tire au sort 16
individus, il se peut que ces individus soient tirés au
sort dans la strate de la population comportant le plus grand nombre d'individus.
Par exemple, s'il y a 1 000 individus au total dans une population, et que 900
d'entre eux ont plus de 15 ans, alors il y a une plus forte probabilité que le tirage
au sort concerne des plus de 15 ans, et que les individus appartenant aux autres
strates, beaucoup moins représentées dans la population, ne soient pas tirés au
sort.
Dans un sondage stratifié, on va tirer au sort les
individus non plus directement dans l'ensemble de la
population, mais dans leur strate d'appartenance (ici
selon la classe d'âge). Ceci permet de garantir d'avoir
des individus dans chacune des strates constituant la
population. Par exemple, sur les 16 individus, on va
en tirer au sort 2 dans chaque strate.
Intérêt :
La stratification vise à réduire la variance des estimateurs, en améliorant la
répartition de l'échantillon entre les différentes strates.
Avantage :
Le sondage stratifié permet d'être certain d'avoir des individus dans chaque strate.
Le gain de précision dû à la stratification est d'autant plus grand qu'il existe une
liaison plus forte entre le critère de stratification et la variable étudiée.
Il permet aussi de sur-représenter les strates ayant de faibles effectifs. Dans ce
cas, la fraction de sondage variera entre les différentes strates.
Exemple : si 99% des lycéens habitent en zone urbaine et 1% des lycéens en zone
Reproduction et diffusion interdite sans accord des auteurs.
9
Les principes des méthodes de sondage
rurale, si on tire au sort les lycéens sans stratifier sur la zone, on risque de n'avoir
que des lycéens appartenant aux lycées urbains.
On peut aussi choisir pour l'échantillon de respecter les proportions observées dans
la population (allocation proportionnelle).
Par exemple, si dans une région comportant 200 lycées, il y a 60% de lycéens
vivant en zone urbaine et 40% en zone rurale, et si on décide de tirer au sort 100
lycéens, alors on tirera au sort 60 lycéens dans les zones urbaines et 40 lycéens en
zone rurale.
Exemple : On veut mesurer la prévalence du tabagisme chez les jeunes scolarisés
en Bourgogne. On sait que la consommation de tabac varie selon l'âge et donc
selon le type d'établissement scolaire fréquenté. On fait 2 strates : une strate «
collégiens » et une strate « lycéens » et on tire au sort les individus au sein de
chaque strate.
c) Sondage en grappes
Principe :
Le sondage en grappe consiste à tirer au sort non pas directement un individu,
mais des unités collectives (par exemple : services hospitaliers, établissements
scolaires...). L'ensemble des individus de l'unité collective sont inclus dans
l'enquête. Ce type de sondage est utilisé lorsqu'on n'a pas de liste des individus,
mais qu'on dispose d'une liste de grappes réunissant plusieurs individus.
Avantage :
Il permet de faciliter la réalisation de l'enquête et de réduire son coût, en limitant le
nombre de lieux à étudier pour accéder aux individus mais entraîne fréquemment
une perte de précision des estimateurs.
Le sondage en grappe est d'autant plus efficace (conduit à une meilleure précision
que le sondage élémentaire) que :
- les grappes sont plus hétérogènes en leur sein pour la variable étudiée (variance
intra-grappe élevée)
- les grappes sont plus semblables entre elles (variance inter-grappe faible)
Si le groupement des unités statistiques en grappe conduit à des grappes plus
hétérogènes que ne le voudrait le hasard, le sondage en grappe est plus précis que
le sondage élémentaire. En revanche, si les grappes sont plus homogènes que ne le
voudrait le hasard, le sondage en grappe est moins précis qu'un sondage
élémentaire.
Le calcul des estimateurs produits par ce type de sondage est complexe et ne sera
pas détaillé dans ce cours.
Par exemple, dans l'exemple précédent, comme on ne dispose généralement pas
facilement de la liste de tous les élèves de Bourgogne on se procurera la liste de
tous les établissements scolaires de la région. Les établissements scolaires sont les
grappes, et constituent les unités de sondage. Ce sont eux qu'on va tirer au sort. Et
on étudie ensuite tous les élèves des établissements tirés au sort.
N.B. : Il est possible de combiner sondage élémentaire et sondage en grappe :
dans l'exemple précédent, on tire au sort les établissements (sondage en grappe)
puis on tire au sort les élèves : sondage à 2 degrés.
Power-point visible en ligne
2. Autres méthodes de sondage
En l'absence de base de sondage utilisable, d'autres méthodes d'échantillonnage,
10
Reproduction et diffusion interdite sans accord des auteurs.
Les principes des méthodes de sondage
dites « empiriques » peuvent être utilisées.
a) Sondage systématique
Lorsqu'on ne dispose pas d'une base de sondage, on décide de prendre les
personnes se trouvant dans une situation donnée au regard d'un critère qui n'est
pas aléatoire, mais qui est supposé indépendant du phénomène à étudier.
Exemple : méthode des itinéraires. Des règles précises sont définies pour inclure
les individus dans l'échantillon :
Exemple : un immeuble sur trois, un étage sur deux, appartement correspondant
à la porte de gauche sur le palier etc...
Limites : On ne connaît pas la probabilité d'inclusion des individus de la
population, la représentativité de l'échantillon n'est nullement garantie, les
différences avec la population source sont difficiles à établir.
3. Méthode des quotas (parfois appelée sondage pseudoaléatoire)
Principe :
La méthode des quotas a pour objectif la constitution d'un échantillon ayant les
mêmes caractéristiques que la population cible. Pour atteindre toutes les catégories
de la population à couvrir par l'enquête, on impose des quotas = nombre de sujets
de chaque catégorie sur lequel portera l'enquête.
Exemple : on veut que l'échantillon contienne 15 femmes de 25 ans habitant en
zone rurale, 10 femmes de 25 ans habitant en zone urbaine, 5 femmes de plus de
25 ans habitant en zone rurale, 10 femmes de plus de 25 ans habitant en zone
urbaine...
N.B. Cette méthode est utilisée habituellement par les Instituts de sondage.
Limites :
On ne connaît pas la probabilité d'inclusion des individus de la population, et donc,
l'inférence des résultats obtenus à la population doit être faite avec plus de
précaution que dans les méthodes aléatoires. La représentativité de l'échantillon
ainsi constitué peut être sujette à caution.
4. QCM sur les différents types de sondage
On souhaite connaître la conformité de l'hygiène des mains des professionnels de
santé aux recommandations officielles. Pour cela, une étude d'observation des
pratiques est réalisée et consiste à observer la technique d'hygiène des mains par
les professionnels de santé.
Indiquez de quel type de sondage il s'agit dans les situations suivantes (une ou
plusieurs réponses possibles) :
Exercice 1
[Solution n°1 p 51]
1. Pour un service de chirurgie, vous disposez de la liste de l'ensemble des
professionnels de santé. Vous décidez de tirer au sort les professionnels que vous
allez observer. Indiquez de quel type de sondage il s'agit (une ou plusieurs
réponses possibles) :
Reproduction et diffusion interdite sans accord des auteurs.
11
Les principes des méthodes de sondage
A. Sondage aléatoire simple
B. Sondage stratifié
C. Sondage en grappe
D. Sondage systématique
E. Méthode des quotas
Exercice 2
[Solution n°2 p 51]
2. Dans un hôpital, vous souhaitez observer les pratiques dans différents services.
Vous tirez au sort les différents services, puis vous observez les pratiques de tous
les professionnels. Indiquez de quel type de sondage il s'agit (une ou plusieurs
réponses possibles) :
A. Sondage aléatoire simple
B. Sondage stratifié
C. Sondage en grappe
D. Sondage systématique
E. Méthode des quotas
F. Sondage à 2 degrés
Exercice 3
[Solution n°3 p 51]
3. Dans un hôpital, vous souhaitez observer les pratiques dans différents services.
Vous tirez au sort les différents services, puis vous tirez au sort les professionnels
de santé que vous allez observer. Indiquez de quel type de sondage il s'agit (une
ou plusieurs réponses possibles) :
A. Sondage stratifié
B. Sondage en grappe
C. Sondage aléatoire simple
D. Sondage à 2 degrés
E. Sondage à 3 degrés
Exercice 4
[Solution n°4 p 52]
4. Vous décidez d'observer, pour un hôpital, les pratiques chez les médecins, chez
les infirmières et chez les aides-soignantes. Vous tirez au sort 10 médecins parmi
les 100 médecins présents, 50 infirmières parmi les 300 infirmières présentes, et
60 aides soignantes parmi les 600 aides soignantes présentes. Indiquez de quel
type de sondage il s'agit (une ou plusieurs réponses possibles) :
12
Reproduction et diffusion interdite sans accord des auteurs.
Les principes des méthodes de sondage
A. Sondage à 3 degrés
B. Sondage en grappe
C. Sondage aléatoire simple
D. Sondage stratifié
E. Méthode des quotas
B. En pratique...
1. Effectif de personnes requis pour un échantillon
Un sondage, comme toute autre étude épidémiologique, nécessite le calcul d'un
nombre de sujets nécessaires selon la précision souhaitée de l'estimation. Les
modalités de calcul sont présentées dans le cours "Calcul du nombre de sujets
nécessaires dans une étude épidémiologique descriptive transversale".
Une fois ce calcul effectué, il faut également tenir compte du taux de participation
attendu.
Par exemple, si on souhaite réaliser une enquête par auto-questionnaire sur la
consommation d'alcool, et que le taux de participation attendu est 10%, si le calcul
du NSN indique qu'il faut inclure 100 personnes, alors il faudra envoyer 1 000
questionnaires (car 10%*1000=100)
2. Comment tirer au sort
Pour procéder au tirage au sort, il faut disposer d'une base de sondage dans
laquelle on va numéroter tous les individus de cette base. Ensuite, le tirage au sort
peut être réalisé par des logiciels statistiques ou à l'aide d'une table des nombres
au hasard .
Extrait d'une table de nombre au hasard.
Si on veut tirer 100 sujets dans une base comportant 1000 individus, on numérote
tous les individus de cette base de 0 à 999; Dans la table de nombres au hasard,
on prend les 100 premiers nombres de 3 chiffres en éliminant les répétitions. On
peut lire la table verticalement, horizontalement, en diagonale...L'essentiel est de
se fixer à l'avance la façon dont la table sera lue.
Exemple 1 : On décide de lire la table de gauche à
droite en commençant en haut et à gauche et en
prenant les chiffres par groupes de 3 colonnes : dans
l'exemple ci-dessous, on retiendra donc le 260, le
658, le 698, le 844, le 582, le 212, etc...
Reproduction et diffusion interdite sans accord des auteurs.
13
Les principes des méthodes de sondage
Exemple 2 : On décide de lire la table en diagonale.
Les nombres retenus seront : le 260, le 616, le 422,
le 833, le 669, le 720, etc...
S'il s'agit d'un sondage stratifié, il faudra numéroter les individus dans chacune des
strates.
S'il s'agit d'un sondage en grappe, on numérote chaque grappe, et on tire au sort
les grappes.
3. Exploitation des résultats fournis par le sondage
Le sondage consiste à n'inclure qu'une partie (= échantillon) de la population
source. Les individus de l'échantillon vont être inclus dans l'étude et être l'objet
d'un recueil de données : mesure d'une ou plusieurs variables quantitatives et /ou
qualitatives. A partir des valeurs observées dans l'échantillon, on calculera selon les
cas la moyenne et la variance de la variable (variable quantitative) ou la proportion
des individus présentant une certaine caractéristique (variable qualitative). Pour un
échantillon donné, la valeur prise par cet estimateur est appelée estimation.
On peut mesurer sur l'échantillon les mêmes types de paramètres de position et de
dispersion que sur une population. Les paramètres de l'échantillon n'ont d'intérêt
qu'en tant qu'estimation des vrais paramètres inconnus de la population.
Faire une estimation, c'est tenter de définir les paramètres d'une population à partir
des paramètres observés sur un échantillon (inférence).
a) Estimation des paramètres dans un sondage simple
i - Paramètres observés sur l'échantillon
1. Pour une variable quantitative
Moyenne
m : moyenne de l'échantillon. C'est l'estimateur de la moyenne µ inconnue.
x i : valeurs de la variable
∑xi : somme des valeurs de la variable
n = taille de l'échantillon
Variance
x i : valeurs de la variable
∑xi = somme des valeurs de la variable
s² = variance de l'échantillon
n = effectif de l'échantillon
14
Reproduction et diffusion interdite sans accord des auteurs.
Les principes des méthodes de sondage
2. Pour une variable qualitative à 2 modalités (variable binaire)
Proportion
p =n/N avec q=1-p
Variance
s² = pq/n
ii - Calcul de l'intervalle de confiance (estimation par
intervalle)
Les modalités de calcul de l'intervalle de confiance pour un sondage aléatoire
simple sont abordés dans le cours "Calcul du nombre de sujets nécessaires dans
une étude épidémiologique descriptive transversale - Intervalle de confiance".
b) Estimation des paramètres dans un sondage stratifié
i - Paramètres observés sur l'échantillon
1. Pour une variable quantitative
Moyenne
ms : : moyenne estimée sur l'ensemble de l'échantillon. C'est l'estimateur de
la moyenne µ inconnue.
Ni : effectif de la strate i dans la population
mi : moyenne estimée dans la strate i de l'échantillon
n : effectif de l'ensemble de l'échantillon
Variance :
Avec :
var ms : variance de l'ensemble de l'échantillon :
Ni : Effectif de la strate i dans la population :
N : Effectif de la population entière
(1-fi) : facteur d'exhaustivité correspondant à 1- ni/Ni
fi= ni/Ni = fraction de sondage dans la strate
si² : variance dans la strate i
ni : effectif de la strate i dans l'échantillon
2. Pour une variable qualitative
Pourcentage :
Avec
Ps : proportion estimée sur l'ensemble de l'échantillon
Ni : Effectif de la strate i dans la population
N : Effectif de la population entière
Pi : proportion estimée dans la strate i
Variance :
Reproduction et diffusion interdite sans accord des auteurs.
15
Les principes des méthodes de sondage
Ps : proportion estimée sur l'ensemble de l'échantillon
Ni : Effectif de la strate i
N : Effectif de la population entière :
Pi: proportion estimée dans la strate i
ni : effectif de la strate i dans l'échantillon qi=1-pi
c) Tableau récapitulatif
16
Reproduction et diffusion interdite sans accord des auteurs.
Reproduction et diffusion interdite sans accord des auteurs.
Inconvénients
Avantages
- pratique
Statistiques simples
- ne nécessite pas de base de
Bonne estimation du paramètre sondage détaillée
- moindre coût
- analyse statistique complexe
nécessitant de prendre en
Suppose d'avoir la liste
compte l'effet grappe
complète des sujets
- moins précis qu'un sondage
aléatoire simple
- numérotation des grappes
TAS des grappes
- numérotation des sujets
- TAS des sujets
Tirage
- liste complète des grappes
Sondage en grappe
Base de sondage Liste complète des sujets
Sondage aléatoire simple
- analyse plus complexe que le
sondage aléatoire simple
- suppose d'avoir une base de
sondage
Sondage stratifié
Liste complète des sujets dans
chaque strate
- numérotation des sujets dans
chaque strate
- TAS des sujets dans les
strates
- gain en précision
(possibilité de sur-représenter
les strates avec un faible
effectif)
Les principes des méthodes de sondage
Tableau 1 : -
d) Exercice avec corrigé - Les sondages
Question
[Solution n°1 p 49]
Complétez le tableau suivant (données fictives) afin d'estimer la proportion de
fumeurs dans une étude portant sur les élèves des lycées ruraux et urbains.
17
Les principes des méthodes de sondage
Strate
Nombre
d'élèves
dans la
strate i
Lycée rural
Lycée urbain
Total
Ni
500
1300
1800
Nombre
d'élèves
Fraction
dans
de
l'échantillon
sondage
pour la
strate i
ni
100
200
300
Nombre de
fumeurs
pour la
strate i
fi
0,2
0,15
nifumeur
10
100
Proportion
de
fumeurs
dans la
strate i
pi
Nipi/N
Tableau 2 : -
C. Interprétation des résultats
1. Taux de participation et non réponses
Le taux de participation doit être précisé. Bien souvent, les personnes ne répondant
pas à une enquête (ou les personnes pour lesquelles la variable étudiée n'a pas pu
être recueillie) diffèrent de celles qui répondent (ou celles chez qui la variable a pu
être recueillie). Ces différences sont responsable d'un biais de sélection de
l'échantillon. (cf cours sur les biais- chapitre 5)
a) Pendant l'étude : pour limiter le nombre de non-répondants
S'assurer de la faisabilité de l'étude : si enquête par questionnaire, tester les
questionnaires auparavant, ne pas commencer par des questions sensibles,
le questionnaire ne doit pas être trop long à remplir.
Faire une relance afin d'améliorer le taux de réponse, ce qui suppose que les
questionnaires ne soient pas anonymes
b) Lors de l'exploitation des résultats : pour étudier les biais de
sélection
Comparer les
répondants
caractéristiques
Redresser les résultats observés.
des
non-répondants
par
rapport
aux
Le redressement a pour objectif d'améliorer la précision des estimations, et de faire
en sorte que la structure de l'échantillon soit identique à la structure connue sur la
population de certaines variables liées aux variables étudiées. Il permet de corriger
partiellement le biais dû aux non-réponses.
2. Interprétation des résultats
On présente classiquement un paramètre de position et un paramètre de dispersion
: moyenne et écart-type, ou pourcentage et intervalle de confiance par exemple.
Le travail sur échantillon a pour but d'extrapoler les données observées à
l'ensemble de la population source (inférence). Les paramètres mesurés sur un
échantillon sont des estimateurs des vraies valeurs inconnues de la population.
→ L'échantillon doit être REPRESENTATIF de la population qu'il est censé décrire.
Pour cela, il faut que tous les individus de la population aient une probabilité
18
Reproduction et diffusion interdite sans accord des auteurs.
Les principes des méthodes de sondage
connue et non nulle de figurer dans l'échantillon. Seul le sondage aléatoire assure
cette condition.
On parle de biais de sélection (ou biais d'échantillonnage) lorsque l'échantillon
diffère systématiquement de la population dont il est supposé provenir (cf cours sur
les biais- chapitre 5).
Exemple
Exemple : choix de volontaires : personnes plus soucieuses de leur état de santé,
et non représentatives de la population générale.
Exemple : pour déterminer la prévalence de l'accouchement prématuré en Côte
d'Or, on effectue le tirage au sort uniquement parmi les femmes ayant accouché au
CHU. Comme c'est une maternité de type III, elle accueille plus de grossesses
pathologiques que les autres maternités : on risque de surestimer la prévalence de
l'accouchement prématuré en Côte d'Or.
Exemple : défaut de couverture : si la base de sondage est l'annuaire
téléphonique, alors il manquera toutes les personnes sur liste rouge, et toutes les
personnes ne possédant qu'un téléphone portable (jeunes essentiellement).
Exemple : On souhaite connaître la consommation d'alcool dans une population
d'ouvriers. Pour cela, on décide d'interroger sur leur consommation d'alcool par
questionnaire des ouvriers travaillant sur les chantiers. Si les seules personnes qui
répondent aux questionnaires sont les ouvriers ne consommant pas d'alcool, et que
les ouvriers consommant de l'alcool ne remplissent pas le questionnaire, alors les
résultats de l'enquête seront complètement faussés, et la consommation d'alcool
sous estimée.
Pour avoir une idée de la représentativité de l'échantillon étudié, on peut comparer
les caractéristiques générales des personnes de l'échantillon et des personnes de la
population caractéristiques de cet échantillon par rapport à celles de la population
cible.
Reproduction et diffusion interdite sans accord des auteurs.
19
La rédaction du
protocole d'une
investigation en
santé publique
II -
II
Les différentes parties du protocole d'une investigation en
santé publique
21
Le protocole est un document écrit contenant tous les éléments scientifiques,
techniques, organisationnels, réglementaires et budgétaires liés à la
réalisation d'une étude.
Il comprend :
un état des connaissances actuelles sur le thème étudié
une justification scientifique de l'investigation
une formulation de l'objectif de l'investigation,
une description détaillée de la méthodologie et du déroulement de
l'investigation.
Ses destinataires sont multiples :
les instances éthiques et réglementaires qui vont autoriser la mise en œuvre
de l'étude
les financeurs éventuels,
et les différents acteurs de l'investigation.
A. Les différentes parties du protocole d'une
investigation en santé publique
1. La page de titre
Les informations générales doivent être regroupées dans une “ page de titre ”. Ces
informations sont les suivantes :
le titre qui résume le but de l'étude
le nom de l'investigateur principal et ses coordonnées
le nom des co-investigateurs et leurs coordonnées
le nom et coordonnées des laboratoires impliqués
le nom du promoteur et son adresse : à quoi sert le promoteur dans une
Reproduction et diffusion interdite sans accord des auteurs.
21
La rédaction du protocole d'une investigation en santé publique
recherche biomédicale ? Le promoteur joue un rôle essentiel, ses
principales missions sont : d'assurer la gestion de la recherche, de vérifier
que le financement est prévu, d'envoyer le projet de recherche aux
instances compétentes pour obtenir l'autorisation de mise en œuvre de
l'étude (cf. chapitre 6 "Principes éthiques s'appliquant aux investigations en
santé publique, le cadre réglementaire et les bonnes pratiques"), de
répondre aux éventuelles demandes de modification, de mandater les
personnes chargées du contrôle de qualité dans la gestion de la recherche,
de prévoir l'indemnisation des personnes incluses dans la recherche en
compensation des contraintes subies ; il doit également communiquer sans
délai au Comité de protection des personnes (CPP) et aux autorité de santé
compétentes les événements indésirables graves non attendus.
la date et le numéro de version du protocole pour éviter toute erreur dans
l'envoi de la dernière version.
2. Le plan du protocole, la liste des abréviations
A cette étape du protocole il convient d'indiquer le plan puis la liste des abréviations
utilisées dans l'ensemble du document.
3. Le résumé du protocole
Généralement, le résumé reprend en une page si possible les principales
caractéristiques du protocole :
justification (en moins de 5 lignes),
objectif principal, - caractéristiques principales de la population de l'étude,
type d'étude, schéma général ( ou design)
critère d'évaluation principal (en moins de 8 lignes),
résultats et/ou bénéfices éventuels attendus (en moins de 8 lignes).
Remarque
Le résumé est important car il est souvent l'élément de sélection du protocole.
4. La justification de l'étude
Dans cette partie du protocole, vous devez définir le thème, le sujet, ou la question
de recherche abordée. Cette partie permet de :
situer le thème, définir le sujet
justifier du bien fondé de l'investigation, quelque soit sa nature (recherche,
évaluation, ...) :
Quelles sont les questions non résolues, les problèmes existants
Justifier de l'intérêt de leur apporter une réponse (retombées et
perspectives)
Cette partie doit être référencée (cf. Les références bibliographiques).
Ajouter les hypothèses ici
5. L‘hypothèse et l'objectif de l'étude
L'hypothèse de recherche est une affirmation formulée par le chercheur.
Exemple. « La consommation quotidienne augmente le nombre d'apnées nocturnes
22
Reproduction et diffusion interdite sans accord des auteurs.
La rédaction du protocole d'une investigation en santé publique
supérieures à 2 minutes chez les hommes âgés de 60 à 80 ans ».
L'objectif de l'étude vise a confirmer ou infirmer cette hypothèse. Sa formulation
doit être précise. L'objectif contient généralement :
un verbe actif
le type d'étude adapté
l'indicateur de résultat ou critère de jugement principal
l'intervention évaluée le cas échéant
la définition sommaire de la population
Exemple
Exemple 1. « Estimer l'incidence en 2006 de l'insuffisance cardiaque dans le
département de la Meuse » ... et non pas « Étudier l'insuffisance cardiaque »
Exemple 2. « Mettre en évidence une relation entre la consommation
quotidienne de tabac et le nombre d'apnées nocturnes supérieures à 2
minutes chez les hommes âgés de 60 à 80 ans » ... et non pas « Tabac et
apnée du sommeil »
Remarque
Dans le cadre d'une recherche-action, il faut savoir différentier l'objectif de
l'intervention de celui de la recherche.
Exemple 1 : « Améliorer la santé des élèves de CM2 » est l'objectif de
l'intervention
Exemple 2 : « Démontrer l'efficacité de telle action de prévention auprès
des élèves de CM2 » est l'objectif de la recherche.
Enfin, veillez à ne définir qu'un seul objectif principal. Les autres objectifs sont
déclinés sous forme d'objectifs secondaires.
6. Le schéma général de l'étude/ Plan expérimental
Cette partie présente les grandes caractéristiques de l'étude choisies pour répondre
à l'objectif, en utilisant des termes standards (grand type d'étude, méthode de
sélection, méthode de suivi...).
Se référer au chapitre 6 - cours "Connaître les différents types d'études
épidémiologiques analytiques et leurs avantages et inconvénients" .
7. La population et échantillon
La « population » est autant la source des résultats que la cible des conclusions
tirées des résultats.
Dans un protocole, elle est représentée par un échantillon dont il faut définir les
caractéristiques de manière telle qu'un autre investigateur/ chercheur intéressé à
confirmer ultérieurement les résultats puisse les reproduire à partir d'un échantillon
similaire.
Les critères de sélection impliquent : a. Une population cible qui pourra
possiblement bénéficier des résultats de l'enquête ou de l'intervention
(généralisation des résultats de l'étude à une population plus large). b. Une
population source à partir de laquelle l'échantillon sera recruté. Exemple :
Les critères de sélection impliquent :
a. Une population cible qui pourra possiblement bénéficier des résultats de
l'enquête ou de l'intervention (généralisation des résultats de l'étude à une
Reproduction et diffusion interdite sans accord des auteurs.
23
La rédaction du protocole d'une investigation en santé publique
population plus large).
b. Une population source à partir de laquelle l'échantillon sera recruté.
Exemple
Nous souhaitons évaluer l'impact d'une campagne d'information dans une
agglomération X sur la conduite à tenir lorsqu'une personne s'effondre sur la voix
publique, victime d'un accident cardio-respiratoire.
La population cible de notre investigation correspond à l'ensemble des
personnes qui résident dans l'agglomération X.
Le choix de la population source dépend de la disponibilité d'une base de
données accessible, dans cet exemple, les investigateurs ont opté pour dans
l'annuaire téléphonique
Remarque
Si la population source diffère de la population cible sur des caractéristiques
susceptibles d'influencer le résultat de l'enquête (comme c'est probablement le cas
dans l'exemple ci-dessus, structure d'âge, niveau socio-économique, ...), les
investigateurs doivent impérativement en tenir compte au moment de
l'interprétation des résultats, la généralisation des résultats à la population cible
devient impossible.
c. Un choix de population où l'on est susceptible d'obtenir une réponse, après une
intervention de qualité optimale, et avec un échantillon de dimension raisonnable
(cf. calcul du NSN)
d. Une surveillance possible des effets parallèles des interventions
e. Une sélection sévère des sujets porteurs d'une condition qui peut moduler
l'obtention de la réponse
f. Une certaine assurance que les sujets vont pouvoir respecter les conditions de
participation
En résumé :
Veillez à définir précisément :
la population
types (territoriale/professionnelle
temporelle
/clientèle)
+
géographique
+
les unités de l'étude
individu/groupe d'individu/actes/épisodes de la vie/...
critères d'inclusion / de non inclusion
les modalités d'échantillonnage = ensemble des opérations qui vont
permettre de recruter les unités (cf. cours « Les sondages »)
la ou les sources de recrutement
les modalités de sondage
8. L'investigation, les explorations étudiées
Pour tous types d'investigations (évaluation d'une stratégie diagnostique,
évaluation d'un réseau de soin, validation d'un instrument de mesure de la qualité
de vie, etc.), l'intervention prévue doit être décrite de façon détaillée.
24
Reproduction et diffusion interdite sans accord des auteurs.
La rédaction du protocole d'une investigation en santé publique
9. La description des données collectées et des méthodes
de mesure
Cette partie présente les données qui seront collectées lors de l'investigation, les
modalités de recueil et les modalités de l'informatisation de ces mêmes données.
Quelles données/ informations seront recueillies ?
Le ou les critères de jugement; les variables explicatives et/ou
d'ajustement ; les variables de type techniques ou légales (ex : inclusion,
consentement, identification)
Le choix de telles ou telles variables doit être justifié
Selon quelles modalités ?
Précisez bien la ou les sources sollicitées ?
Présentez le mode de recueil (questionnaire auto-administré,
d'entretien) et les modes d'enregistrement des réponses
Si possible, proposez une méthode de vérification et de validation des
données recueillies
guide
Les modalités de l'informatisation des données
Précisez les modalités de transmission), le lieu de saisie (centralisation de la
saisie avec transmission des bordereau en version papier, saisie sur site), la
personne saisissant les données, s'il s'agit d'une simple ou double saisie, le
lieu de stockage des données, l'existence d'une procédure de sécurisation
physique et numérique particulière,...
10. L'analyse statistique, l'analyse de contenu
Vous devez présentez le plan général de l'analyse statistique s'il s'agit d'une
investigation quantitative :
Quelles méthodes d'analyse seront utilisées ?
Quelles variables sont prises en compte?
Quels tests statistiques sont envisagés ?
Que fera-t-on des données imparfaites (perdus de vue, non réponses,
données absentes ou aberrantes)
Pour rédiger cette partie, l'aide d'un biostatisticien peut être utile.
Dans le cas d'une investigation qualitative, vous devez décrire la façon dont sera
analysé le contenu de l'information recueillie.
11. Le déroulement de l'étude, les aspects logistiques
Cette partie présente les éléments de réponses aux questions suivantes :
Qui - fait quoi - quand - avec quels moyens ?
Des outils peuvent être utilisés pour faciliter la présentation de ces éléments et
l'enchaînement des tâches (ex : schéma, diagramme de Gantt)
Reproduction et diffusion interdite sans accord des auteurs.
25
La rédaction du protocole d'une investigation en santé publique
Exemple de diagramme de Gantt
Il convient également de présenter brièvement, si elles existent, les procédures
opérationnelles standardisées (POS).
Les POS sont des documents qui fixent les règles d'organisation écrites déterminant
les compétences, les moyens et la manière d'accomplir une activité pour parvenir à
26
Reproduction et diffusion interdite sans accord des auteurs.
La rédaction du protocole d'une investigation en santé publique
un but.
Pour toute action décrite dans la procédure, le lecteur doit trouver dans sa lecture
les réponses aux questions qu'il se pose :
CONTEXTE : la mise en application de la procédure ou la fiche technique.
QUOI ? De quoi s'agit il ?
QUI ? Qui fait ? avec qui ? pour qui ? qui est le responsable ?
OU ? Où est applicable cette action ?
QUAND ? Quand doit on appliquer ce qui est écrit, avec quels délais...?
COMMENT ? Comment met-on en œuvre cette action ? (méthodologie, moyens)
COMBIEN ? Toutes quantifications relatives aux autres questions (si nécessaire).
12. Les aspects médico-légaux (éthiques et
réglementaires)
Selon la nature de l'investigation, certaines instances sont susceptibles d'être
sollicitées avant le démarrage de l'étude : parmi elles, le Comité de Protection des
Personnes (CPP), le Comité Consultatif sur le Traitement de l'Information en
matière de Recherche dans le domaine de la Santé (CCTIRS), la Commission
Nationale de l'Informatique et des Libertés (CNIL) ou encore l'Agence Française de
Sécurité Sanitaire des Produits de Santé (AFSSAPS).
Le CPP représente l'équivalent français des "ethical research committee" ou
"Comités d'éthique de la recherche" présents dans les pays anglo-saxons et
les autres pays européens, son rôle est de s'assurer que tout projet de
recherche biomédicale sur l'être humain mené en France respecte diverses
mesures (médicales, éthiques et juridiques) visant à assurer la protection
des personnes qui participeront à cette recherche ;
Le CCTIRS éclaire la CNIL (Commission Nationale de l'Informatique et des
Libertés) sur la justification du traitement de données à caractère personnel
dans un but de recherche, et, pour cela, d'émettre un avis sur la
méthodologie de la recherche ;
La CNIL est chargée de veiller à la protection des données à caractère
personnel et de la vie privée, qu'elles soient directement ou indirectement
nominatives ;
L'AFFSAPS a parmi ses missions celle d'étudier et d'expertiser en
permanence les données qui modifient la connaissance des produits de
santé, elle se prononce notamment sur les demandes d'autorisation de mise
sur le marché (AMM) d'un nouveau médicament, elle est aussi en charge de
la pharmacovigilance.
Ces aspects doivent impérativement être présentés dans une partie bien distincte
du protocole.
Remarque
Pour plus de détails, se référer au chapitre 6 "Principes éthiques s'appliquant aux
investigations en santé publique, le cadre réglementaire et les bonnes pratiques"
13. Les références bibliographiques
La liste des références bibliographiques doit être mise à jour au fur et à mesure que
le protocole évolue. Veillez à présenter les références bibliographiques selon les
normes de Vancouver.
Reproduction et diffusion interdite sans accord des auteurs.
27
La rédaction du protocole d'une investigation en santé publique
14. Les annexes
Les annexes contiennent tous les documents nécessaires à la mise en œuvre de
l'investigation. Ces documents inclus :
28
La demande d'accord de participation à l'étude, ou le formulaire
d'information et le cas échéant de consentement des sujets, si nécessaire les
normes de laboratoires et les agréments
Les outils utilisés : les procédures opérationnelles standardisées
Le cahier d'observation / bordereau de recueil de données / questionnaires /
guides d'entretien dans leur version définitive
L'évaluation budgétaire détaillée
Le double des courriers aux différentes instances ainsi que de leur réponse
(si acceptation)
Un curriculum Vitae (si demandé)
Reproduction et diffusion interdite sans accord des auteurs.
Le calcul du
nombre de sujets
nécessaire dans
une étude
épidémiologique
descriptive
transversale
III -
III
Justification de l'échantillonnage
30
Précision de la mesure
30
Éléments du calcul du nombre de sujets nécessaire
34
Considérations pratiques
36
Conclusion
36
Pour l'ensemble de ce chapitre, nous nous placerons dans un contexte
d'échantillonnage aléatoire simple. D'autres méthodes d'échantillonnage existent et
requièrent des modalités de calcul du nombre de sujets nécessaire particulières qui
ne seront pas présentées ici.
Un chercheur vient vous voir pour vous présenter l'objectif de son étude
transversale qui est d'estimer la prévalence de l'infarctus du myocarde dans la
région Lorraine, en population générale. Il se demande combien de sujets il doit
inclure dans l'étude pour atteindre son objectif.
De la même manière, on pourrait vous demander d'estimer l'âge moyen des
habitants de la région Lorraine ayant présenté un infarctus du myocarde en 2010.
On vous demande alors combien de sujets il faudra inclure pour estimer cet âge
moyen.
Dans ce cours, vous aurez les éléments nécessaires pour répondre à ces questions.
Remarque :
Lorsque l'on parle de nombre de sujets nécessaire, le caractère « nécessaire »
doit être compris en termes de qualités méthodologiques : ce nombre minimum de
sujets à inclure permet de garantir un certain niveau de précision et de
reproductibilité des estimations produites à partir de données recueillies sur
l'échantillon.
Reproduction et diffusion interdite sans accord des auteurs.
29
Le calcul du nombre de sujets nécessaire dans une étude épidémiologique descriptive transversale
A. Justification de l'échantillonnage
Lorsque l'on veut mesurer un paramètre dans une population, on effectue en
général une mesure de ce paramètre sur un échantillon de la population. En effet,
l'idéal serait de mesurer le paramètre dans l'ensemble de la population, ceci
permettrait d'avoir une mesure non biaisée (cf cours sur les biais - chapitre 5) Mais
cette mesure sur l'ensemble de la population n'est pas toujours possible, en
particulier pour les raisons suivantes :
Coût trop élevé
Manque de temps
Manque de précision (si plusieurs enquêteurs font la mesure)
Manque de Faisabilité
En définitive, le recueil de données sur une population est possible s'il est limité à
un petit nombre de données sur un effectif de taille raisonnable.
Dans les cas contraires, on réalise un sondage avant d'effectuer le recueil de
données, ce qui permet de :
Diminuer les coûts
Diminuer la durée de l'étude
Recueillir un nombre plus important de données
Mais cela requiert une réflexion préalable sur la méthode d'échantillonnage utilisée
afin de limiter les erreurs liées à l'échantillonnage.
B. Précision de la mesure
Les données d'une étude sur un échantillon sont utilisées pour produire une
estimation du paramètre dans la population cible.
Plusieurs éléments influencent la valeur de cette mesure :
L'erreur (ou le biais) de mesure, à relier à la validité de cette mesure
Le biais de sélection de l'échantillon (Cf cours sur les biais - Chapitre 5)
L'erreur aléatoire
Il est ainsi peu probable que l'estimateur de la mesure sur l'échantillon considéré
soit exactement égale à la valeur du paramètre dans la population cible.
1. Fluctuations d'échantillonnage
Si l'on considère une population de 100 000 individus, dont 10% sont malades (10
000 individus). Le fait que cette population soit constituée de malades et de non
malades est une illustration de la variabilité individuelle.
Prenons un échantillon de 200 sujets tirés au sort dans cette population, dans
lequel on compte 20 (10%) malades. La question est de savoir si en répétant
l'échantillonnage selon les mêmes modalités, on retrouve à chaque fois la même
proportion de malades. La réponse à cette question est négative.
En effet, sur les tirages au sort suivants, on retrouve 10 (5%) malades sur le 2°
échantillon, puis 19 (9.5%) malades sur l'échantillon suivant puis 2 (1%) malades
sur le dernier échantillon. On pourrait même arriver à compter 200 (100%)
malades sur l'un des échantillons possibles de 200 personnes.
30
Reproduction et diffusion interdite sans accord des auteurs.
Le calcul du nombre de sujets nécessaire dans une étude épidémiologique descriptive transversale
Évidemment, en l'absence de biais de sélection, on a une probabilité plus
importante de tirer au sort un échantillon de 200 individus comptant 20 malades
qu'un échantillon comptant 200 malades. Toutefois, plusieurs estimations
peuvent être produites à partir des échantillons construits selon les mêmes
modalités, à partir d'une même population.
On parle de fluctuations d'échantillonnage.
Si l'on avait considéré des échantillons de 2 000 individus, on aurait observé le
même phénomène, à ceci près que la dispersion des valeurs de proportions de
malades aurait été moins importante.
On comprend bien ce phénomène en le considérant à l'extrême : si on prend des
échantillons de 199999 sujets, c'est-à-dire presque l'ensemble des individus de la
population cible, on aura un maximum de chances de retrouver une proportion de
malades proche de 10% (la vraie valeur du paramètre en population totale), donc
la dispersion sera minimale.
Devant l'ampleur de ces fluctuations d'échantillonnage, on comprend bien qu'il est
impossible de résumer l'estimation d'un paramètre en population à la seule valeur
de son estimateur sur un échantillon représentatif. Des éléments sur la dispersion
des observations est nécessaire.
2. Intervalle de fluctuation
Lorsque l'on veut exprimer la dispersion du paramètre dans la modalité
d'échantillonnage choisi, on peut utiliser l'intervalle de fluctuation dont les bornes
sont définies par la formule suivante :
Pour un paramètre quantitatif A, l'intervalle de fluctuation approché à (1-  ) d'une
moyenne observée s'écrit :
 A ±z  / 2  A ² /n
µA est la moyenne théorique de la variable d'intérêt (A) dans la population
σA ² est la variance de A dans la population
zα/2 lu dans la table de la loi normale centrée réduite, pour une valeur de α égale au
risque d'erreur consenti
n est la taille de l'échantillon.
Condition d'application : normalité de la distribution de A
Pour un paramètre qualitatif A, l'intervalle de fluctuation approché à (1-  ) d'un
pourcentage observé est donnée par la formule :
P A ± z / 2 P A Q A / N
PA étant la proportion dans la population pour la variable concernée (A)
QA étant le complément de la proportion de A dans la population concernée (QA=1PA )
zα/2 lu dans la table de la loi normale centrée réduite, pour une valeur de α égale au
risque d'erreur consenti
n est la taille de l'échantillon
Ces calculs supposent que la vraie valeur du paramètre est connue dans la
population, ce qui n'est généralement pas le cas. Cette méthode déductive n'est
donc pas applicable.
Habituellement, on dispose des mesures effectuées sur un seul échantillon et on
souhaite tirer des conclusions sur la vraie valeur du paramètre dans la population
(démarche inductive).
Condition d'application : nPA ≥ 5 et nQA ≥ 5
Reproduction et diffusion interdite sans accord des auteurs.
31
Le calcul du nombre de sujets nécessaire dans une étude épidémiologique descriptive transversale
Attention
Important : Ces formules supposent que la vraie valeur du paramètre en
population est connue, ce qui n'est généralement pas le cas.
Habituellement, on dispose des mesures effectuées sur l'échantillon et on souhaite
tirer des conclusions sur la vraie valeur du paramètre en population (démarche
inductive)
-
32
Reproduction et diffusion interdite sans accord des auteurs.
Le calcul du nombre de sujets nécessaire dans une étude épidémiologique descriptive transversale
3. Intervalle de confiance
Lorsque l'on ne connaît pas la vraie valeur du paramètre dans la population (ce qui
est le cas le plus fréquent), l'examen de l'ensemble des sujets permettrait de la
mesurer. Ce qui est rarement réalisable. On calcule alors la valeur de
l'estimateur du paramètre étudié à partir des mesures effectuées sur les sujets
d'un échantillon représentatif de la population cible.
MAIS en raison des fluctuations d'échantillonnage, on sait que si l'on avait calculé
l'estimateur à partir d'un autre échantillon représentatif de la population cible, on
aurait probablement trouvé une valeur différente.
DONC les résultats du calcul de cet estimateur doivent être présentés sous la forme
d'un intervalle de confiance, construit à partir de l'estimateur produit, au risque
de première espèce α fixé a priori.
a) Calcul de l'intervalle de confiance
Intervalle de confiance d'une proportion
Les bornes inférieure et supérieure de cet intervalle sont définies par la formule
suivante :
p0± z /2
 
N n
N
p 0 q0
n1
p0 étant la proportion estimée dans l'échantillon pour la variable concernée q0
étant le complément de cette proportion dans l'échantillon (q0=1-p0)
N étant la taille de la population cible
n étant la taille de l'échantillon
zα/2 lu dans la table de la loi normale centrée réduite, pour une valeur de α égale
au risque d'erreur consenti
Remarque
Si N est grand alors

N n
≈1 et les bornes de l'intervalle de confiance ne
N
dépendent alors plus de la taille de la population cible
Une formule approchée des bornes de l'intervalle de confiance peut être utilisée :
p0± z  /2

p0 q0
n
Il existe deux conditions d'application de cette formule approchée :
L'échantillon doit être suffisamment grand
La population d'origine doit être également suffisamment grande
En effet, à partir de la formule (1), on comprend bien que si n et N sont
suffisamment grands, alors
D'une part
n1≈n
D'autre part
Soient

N n
≈1
N
pi la proportion calculée pour la borne inférieure
qi le complément de cette proportion dans l'échantillon (qi=1-pi)
ps la proportion calculée pour la borne supérieure
qs le complément de cette proportion dans l'échantillon (qs=1-ps)
Reproduction et diffusion interdite sans accord des auteurs.
33
Le calcul du nombre de sujets nécessaire dans une étude épidémiologique descriptive transversale
Alors la condition d'utilisation de la formule approchée est remplie si
npi≥5 ET nqi ≥5 ET nps ≥5 ET nqs ≥5
Intervalle de confiance d'une moyenne
Les bornes inférieure et supérieure de cet intervalle sont définies par la
formule suivante :
m A± z /2

s 2A
n
mA est la moyenne observée de la variable d'intérêt (A) dans l'échantillon
SA ² est la variance de A dans l'échantillon
zα/2 lu dans la table de la loi normale centrée réduite, pour une valeur de α
égale au risque d'erreur consenti
n est la taille de l'échantillon.
Remarque
Condition d'utilisation : normalité de la distribution de la variable quantitative.
Interprétation de l'intervalle de confiance
L'intervalle de confiance peut contenir la vraie valeur du paramètre ou pas.
Il signifie qu'en l'absence de biais, si l'on reproduit l'échantillonnage selon le
même procédé, et si α est fixé à 5%, alors 95% des intervalles de confiance
produits à partir des estimateurs calculés contiendront la vraie valeur du
paramètre étudié.
Attention
Important : une interprétation commune de l'intervalle de confiance est pourtant
erronée : elle consiste à dire que l'intervalle de confiance produit à partir d'un
échantillon a 95% de chance de contenir la vraie valeur du paramètre étudié.
L'erreur tient au fait que la probabilité de 95% s'applique à l'ensemble des
intervalles de confiance produits à partir d'un ensemble d'échantillons, et non pas à
un intervalle de confiance en particulier, qui lui contient ou ne contient pas la valeur
P.
Cette formule permet de comprendre comment la taille de l'échantillon et l'étendue
de l'intervalle de confiance sont liés.
Plus l'échantillon est grand, moins l'intervalle de confiance est large (plus
l'estimation est précise).
C. Éléments du calcul du nombre de sujets nécessaire
1. Facteurs liés à la taille de l'échantillon
34
La variance : image de la reproductibilité (reliability en anglais) de
l'estimation produite
Taille échantillon ↑ => Reproductibilité ↑ => variance ↓
La valeur attendue du paramètre mesuré : déterminée par l'investigateur
La précision de la mesure : image de l'écart attendu à la vraie valeur du
paramètre mesuré
Taille échantillon ↑ => Écart ↓
Reproduction et diffusion interdite sans accord des auteurs.
Le calcul du nombre de sujets nécessaire dans une étude épidémiologique descriptive transversale
Remarque
On n'améliore pas la validité de la mesure (ou en d'autres termes on ne diminue
pas le biais ou l'erreur systématique) en augmentant la taille d'un échantillon. En
effet, si on utilise une balance mal tarée pour mesurer le poids moyen des sujets
d'un échantillon afin d'en déduire le poids moyen d'une population, la déduction du
poids moyen de la population cible sera biaisée par mauvaise tare de la balance
(erreur systématique ou biais de mesure). En augmentant le nombre de personnes
dans l'échantillon, on n'améliorera pas la validité de la mesure du poids (il y aura
toujours ce problème de tare); en revanche on améliore à la fois la reproductibilité
et la précision (la variance sera réduite, l'erreur aléatoire sera diminuée).
2. Formules pour calculer la taille d'un échantillon aléatoire
simple
Préambule : Les formules approchées pourront être utilisées si et seulement si :
les échantillons sont suffisamment grands ;
les populations d'étude sont suffisamment grandes.
a) Quand la variable à mesurer est qualitative
Formule exacte
n
z 2 / 2 N P 1P 
 N 1 2 P 2 z2 / 2 P 1P 
Formule approchée
n
z 2 /2 1P 
2 P
Dans les formules :
P est la proportion attendue dans la population
N est la taille de la population
ε est l'écart toléré à la proportion
zα/2 est lu dans la table de la loi normale centrée réduite, pour une valeur de α égale
au risque d'erreur consenti
b) Quand la variable à mesurer est quantitative
Formule exacte
n
2
2
z /
2N
z 2/2  2  N 1 2
Formule approchée
n
2
z /2
2
2
Dans les formules :
σ² est la variance de la variable dans la population
N est la taille de la population
ε est l'écart toléré à la moyenne
zα/2 est lu dans la table de la loi normale centrée réduite, pour une valeur de α égale
au risque d'erreur consenti
Reproduction et diffusion interdite sans accord des auteurs.
35
Le calcul du nombre de sujets nécessaire dans une étude épidémiologique descriptive transversale
D. Considérations pratiques
Lorsque plusieurs variables sont décrites sur une population, l'idéal est de calculer
une taille d'échantillon pour chaque variable, et de choisir la plus grande d'entre
elles pour déterminer le nombre de sujets à inclure.
L'utilisation des formules de ce cours afin de calculer la taille de l'échantillon pour
une étude descriptive est une étape NÉCESSAIRE, mais insuffisante pour mener à
bien la réflexion sur la taille de l'échantillon.
Complément
Les formules de calcul du nombre de sujets nécessaire sont en général insuffisantes
pour connaître le nombre de sujets à inclure en pratique dans une étude, en effet :
Ces formules produisent l'estimation de la taille de l'échantillon pour :
Une étude descriptive.
Une population particulière.
Une puissance d'étude donnée, ou une précision.
Les formules mathématiques ne prennent pas en compte certaines variables
d'ajustement.
Ces formules produisent au mieux une estimation grossière : dans certaines
situations, elles peuvent conduire à de mauvaises estimations. Par exemple
ces formules ne prennent pas en compte le rapport coût dépensé / précision
gagné pour chaque inclusion supplémentaire.
Résoudre le problème du nombre de sujets à inclure ressort donc d'une
analyse coût/bénéfice.
Sachant que les bénéfices d'une étude sont liés à des facteurs politiques,
sociaux et biologiques d'une grande complexité qui ne sont pratiquement
jamais quantifiés.
En conclusion, si la détermination de la taille d'un échantillon pour une enquête
descriptive peut être réalisée à partir d'une formule mathématique, le choix final,
l'effectif de sujets à inclure, doit tenir compte de considérations pratiques non
quantifiables.
E. Conclusion
Dans ce cours, les éléments nécessaires au calcul du nombre de sujets à inclure
dans une étude descriptive transversale vous ont été présentés selon la précision
attendue sur le paramètre estimé (proportion ou moyenne). Il est également
possible de calculer un nombre de sujets nécessaire à inclure dans un étude
descriptive longitudinale visant à estimer le taux d'incidence d'une maladie. Les
formules pour ce calcul n'ont volontairement pas été exposées dans ce cours. Elles
sont en effet très complexes, et seront envisagées ultérieurement. Toutefois, si
vous êtes intéressés par ces formules, vous pouvez vous reporter aux références en
fin de cours pour les retrouver.
36
Reproduction et diffusion interdite sans accord des auteurs.
Les méthodes et
techniques de base
du recueil de
données dans une
enquête
épidémiologique
IV -
IV
Introduction
37
Le recueil des informations
37
Le bordereau de recueil
39
A. Introduction
Le recueil des données se prépare dès la rédaction du protocole de l'enquête. La
qualité de cette démarche dépend directement de la pertinence et de la qualité de
l'information sur laquelle elle s'appuie. Il est par conséquent essentiel de s'assurer
tout au long de cette étape que les informations que vous souhaitez recueillir sont
en adéquation avec l'objectif de l'enquête, et que les informations que vous allez
recueillir sont bien celles que vous voulez réellement obtenir.
B. Le recueil des informations
1. Objectifs et contraintes
Il existe des liens étroits entre le protocole d'échantillonnage et l'enregistrement
des données, avec le mode de recueil et avec le choix des indicateurs en fonction
des objectifs, des contraintes et des critères de qualité imposés.
L'objectif de l'enquête conditionne toujours la nature des informations à
recueillir.
Exemple
Exemple 1 :
Si l'objectif est de décrire le comportement tabagique des footballeurs
professionnels évoluant en France, les informations à recueillir porteront sur :
Reproduction et diffusion interdite sans accord des auteurs.
37
Les méthodes et techniques de base du recueil de données dans une enquête épidémiologique
le profil sociodémographique et sportif des sujets échantillonnés (âge, sexe,
ancienneté de la carrière sportive,...),
le comportement tabagique (statut tabagique, type de consommation,
durée,...),
l 'environnement du sportif (présence de fumeurs dans l'environnement),
les attitudes du sportif vis-à-vis du tabagisme,
les connaissances que le sportif a des conséquences du tabagisme sur la
santé.
Il s'agira principalement de données déclaratives. On peut également prévoir pour
les fumeurs un test de dépendance au tabagisme, sous condition que ces derniers
acceptent de s'y soumettre (test de Fagerstrom par exemple).
Exemple
Exemple 2 :
Si l'objectif est d'estimer la prévalence d'une maladie, en plus d'informations sur le
profil des sujets enquêtés, l'investigateur aura besoin d'informations de nature
biologique et clinique recueillies par une équipe médicale pour confirmer la
présence de cette maladie.
Dans ces deux exemples, l'investigateur est confronté à des contraintes liées aux
moyens disponibles et à la qualification du personnel mis à sa disposition. A quel
moment pourrez-vous recueillir ces informations ? Certaines informations
nécessitent-elles de faire appel à un médecin, une infirmière ? etc.
En résumé, il faut s'assurer que les informations recueillies permettront à l'enquête
de répondre à l'objectif fixé d'une part, et que l'on dispose des moyens nécessaires
pour les recueillir.
2. Exercice avec corrigé - Le recueil des informations
Vous êtes chargé d'organiser et de planifier une enquête dont l'objectif est
d'estimer la prévalence du surpoids et de l'obésité chez les enfants scolarisés en
classe de cours moyen 1ère année en Lorraine. A partir de cet objectif, répondez
aux deux questions suivantes :
Question
[Solution n°2 p 50]
1- Quelles informations comptez-vous recueillir ? (10 maximum)
2- Quelles sont les contraintes dont vous devrez tenir compte ?
3. Critères de qualité propres à la mesure
Toute mesure doit répondre à des critères de qualité qui lui sont propres. Par
critère de qualité, on entend :
l'exactitude,
la sensibilité et la spécificité de la mesure,
la reproductibilité,
l'universalité,
l'objectivité,
et l'acceptabilité qui dépend des individus enquêtés, de la nature des
investigations menées et de la présentation générale de l'enquête.
Ces critères seront développés dans l'unité d'enseignement "Recherche clinique et
38
Reproduction et diffusion interdite sans accord des auteurs.
Les méthodes et techniques de base du recueil de données dans une enquête épidémiologique
épidémiologique" au 2ème semestre.
4. Type de données
Les variables recueillies peuvent être quantitatives ou qualitatives.
Une variable est dite quantitative lorsque la valeur mesurée sur chaque individu
représente une quantité (exemples : le poids (en kg), la taille (en cm), etc.).
Une variable est dite qualitative lorsque la valeur mesurée sur chaque individu
(parfois qualifiée de catégorie ou de modalité) ne représente pas une quantité. Elle
est peut qualifiée de « nominale » lorsque les modalités de réponse ne sont pas
hiérarchisées entre elles (exemple : la couleur des cheveux) ou « ordinale » lorsque
les modalités le sont (exemple : totalement insatisfait, plutôt insatisfait, plutôt
satisfait, totalement satisfait).
C. Le bordereau de recueil
Le bordereau est un outil qui répond aux besoins de l'enquête, il doit apporter une
réponse à l'objectif de l'enquête et être sous la forme la plus adaptée à la
population enquêtée.
Quelques éléments clés :
La construction du bordereau démarre après avoir balayé les différents
domaines d'intérêt par rapport à l'objectif qui a été fixé.
Chaque item qui compose le bordereau ne doit véhiculer qu'une seule
information ou idée à la fois. 
Le bordereau de recueil se compose d'informations techniques,
d'informations propres à l'enquête/ l'étude (caractéristiques des sujets
enquêtés, indicateurs de maladie, indicateurs d'exposition, indicateurs
comportementaux, indicateurs psychologiques, sociologiques, etc.)
Un effort particulier doit être fait sur la présentation, et il doit être, si nécessaire,
validé par des experts du domaine exploré, et faire l'objet d'un pré-test avant son
utilisation. Le pré-test consiste à tester préalablement le bordereau auprès d'un
petit groupe de personne dans le but de vérifier son acceptabilité.
1. Construction d'un bordereau
La construction d'un bordereau se déroule en plusieurs phases : phase préliminaire,
informations techniques, identification, données de vérification, informations
propres à l'enquête, types de questions.
a) Phase préliminaire
i - Revue de la littérature
La revue de la littérature est essentielle pour s'assurer du bien fondé de votre étude
d'une part et pour recueillir toutes les informations nécessaires d'autre part. Elle
permet entre autre de s'assurer de la pertinence du thème abordé, d'identifier les
hypothèses déjà testées et celles qui sont restent à tester, de connaître les types
d'enquêtes utilisées, les populations étudiées et le mode de recueil des données
Reproduction et diffusion interdite sans accord des auteurs.
39
Les méthodes et techniques de base du recueil de données dans une enquête épidémiologique
auquel ont eu recours les autres équipes.
ii - Avis d'experts
Le recours à l'avis d'un ou plusieurs experts est souvent nécessaire pour valider les
orientations prises, le choix de certains indicateurs et leur pertinence au regard de
l'objectif fixé.
A l'issu de cette phase préliminaire, il convient de sélectionner les questions les plus
pertinentes parmi le panel de questions possibles identifiées.
b) Informations techniques
Les informations techniques qui figurent sur le bordereau concernent des données
d'identification, des données de vérification de l'échantillonnage et du recueil de
l'information.
i - Données d'identification
Elles sont indispensables pour identifier les unités qui font l'objet de l'enquête :
l'individu, le service hospitalier, la classe de l'élève ; et les séquences du recueil de
l'information : sujet, enquêteur, lieux, moment de la mesure.
Les données d'identification doivent respecter les règles de confidentialité : les
données fournies à l'enquêteur ou à l'épidémiologiste doivent impérativement être
anonymes, sauf cas particuliers ayant une autorisation des instances compétentes
(CCTIRS, CNIL, ...). Ni le bordereau de recueil, ni le fichier informatisé ne doit faire
mention du nom ou du numéro national d'identité.
Attention, certaines informations peuvent être indirectement nominatives (initiales
du patient, date de naissance, ...).
Exemple d'identification
-
ii - Données de vérification de l'échantillonnage
Les critères d'inclusion et/ ou d'exclusion prévus dans le protocole de l'étude
doivent faire l'objet d'un recueil particulier, tout comme l'appartenance de l'individu
à une strate donnée.
40
Reproduction et diffusion interdite sans accord des auteurs.
Les méthodes et techniques de base du recueil de données dans une enquête épidémiologique
iii - Données sur le recueil de l'information proprement dit
Les conditions du recueil imposées par le protocole doivent également faire l'objet
d'un recueil particulier. Exemple : un prélèvement doit être réalisé dans des
conditions particulières X (à jeun), le jour J, par la méthode Y, geste effectué par le
médecin n°1 (respecter l'anonymat).
Il est enfin recommandé de remplir un bordereau pour chaque non réponse quand
cela est possible pour suivre le taux de répondeur et décrire les motifs associés aux
non réponses.
c) Informations propres à l'enquête
Les informations propres à l'enquête sont comme leur nom l'indique propres à
chaque enquête et sont étroitement liées aux objectifs fixés.
On distingue notamment :
Les indicateurs de maladie comme le diagnostic clinique de la maladie, les
paramètres biologiques, les causes du décès. Il est recommandé d'utiliser
des classifications internationales pour garantir la comparabilité des études
(CIM 10 et Classification Internationale du Fonctionnement et de la santé de
l'OMS, ,DSM IV pour les troubles mentaux).
Exemple d'enregistrement de maladie :
-
Reproduction et diffusion interdite sans accord des auteurs.
41
Les méthodes et techniques de base du recueil de données dans une enquête épidémiologique
Les indicateurs d'exposition regroupent des indicateurs collectifs
(environnement physique, indicateurs locaux – climat), des indicateurs
individuels observés (environnement proche, alimentation), déclarés
(connaître le passé, les habitudes de vie, ...), des indicateurs génétiques ou
biologiques d'exposition (polluants, marqueurs de vitamines), etc.
Les indicateurs psychologiques, sociologiques comme les activités de la vie
quotidienne, le bien-être, la qualité de vie, l'anxiété, les stratégies
d'adaptation, ...
d) Types de questions
Selon la nature des informations à recueillir, les questions (ou items) peuvent
prendre deux formes : soit ouvertes, soit fermées.
i - Questions ouvertes
La réponse obtenue est libre. Les réponses ouvertes sont recommandées lorsque
l'investigateur explore un domaine non maîtrisé.
Les avantages :
elles fournissent des informations riches et diversifiées,
elles peuvent servir de base pour la formulation d'une palette de réponses
possibles pour les questions fermées.
Les inconvénients :
elles sont délicates à formuler,
elles peuvent engendrer des réponses vagues ou à côtés du sujet,
elles fournissent des réponses parfois longues et difficiles à exploiter.
ii - Questions fermées
Le choix des réponses est fixé à l'avance. Elles peuvent prendre différentes
formes :
dichotomique ou binaire (oui/ non),
à plus de deux modalités de réponses,
à réponse unique ou à choix multiple,
avec classement ou situation sur une échelle (EVA par exemple)
attention au « faux » intérêt de la modalité « Autre » pour laquelle une
mention « précisez » doit être proposée.
Elles peuvent être formulées à partir d'une question ouverte :
cela nécessite une analyse fine et structurée du contenu des réponses à la
question ouverte,
la remplacer par une question fermée nécessite de formuler des modalités
de réponse pertinentes qui couvrent suffisamment le contenu des réponses à
la question ouverte.
Elles peuvent présenter des catégories de réponses exhaustives et mutuellement
exclusives :
toutes les possibilités de réponses sont présentes,
chaque réponse ne peut donc se situer que dans une seule catégorie.
Leurs avantages :
42
elles sont faciles à administrer et à interpréter,
elles constituent une aide à la mémoire et à la réflexion du répondeur,
elles permettent les comparaisons,
Reproduction et diffusion interdite sans accord des auteurs.
Les méthodes et techniques de base du recueil de données dans une enquête épidémiologique
elles reflètent la variété et la richesse des propositions de réponses.
Leurs inconvénients :
en étant trop restrictives, elles peuvent engendrer une perte d'informations,
elles risquent d'induire des choix de réponses peu réfléchis et entachés de
désirabilité sociale (considéré comme « bien » ou « positif » dans la
société),
elles peuvent être difficiles à rédiger,
elles peuvent être trop restrictives, et ne pas mentionner toutes les
réponses possibles.
Remarque
Evitez un nombre de modalités de réponses impair, la modalité centrale risquant de
se transformer en modalité « refuge » : « ni pour / ni contre », « ni bon / ni
mauvais », « ni satisfait / ni insatisfait », etc.
2. Organisation et présentation du bordereau (mode de
passation)
a) Structure du bordereau
i - Longueur du bordereau :
La longueur du bordereau dépend du thème abordé par l'étude et du temps alloué
pour y répondre ou disponible pour le remplir. Il n'y a pas de longueur idéale
définie.
Pour ne pas décourager l'enquêteur ou le répondeur, il faut veiller à ce que le
questionnaire ne comporte pas trop de questions.
Pour limiter le risque de lassitude du répondeur, il faut veiller à ce que le temps de
remplissage n'excède pas 30 minutes ; au-delà, la qualité des réponses peut en
pâtir.
Comme nous l'avons déjà mentionné en début d'exposé, il est impératif de prendre
en compte les contraintes propres à l'enquête.
ii - Place des questions d'identification :
Elles sont positionnées au début ou à la fin du bordereau. Certains auteurs
recommandent de les placer au début pour mettre en confiance la personne
enquêtée.
iii - Ordre des questions :
L'enchaînement des questions doit être le plus naturel possible, sans rupture. Le
risque pour l'enquêté est de « perdre le fil de ses pensées », trop de va-et-vient
risquent d'altérer les réponses.
Il est important de doser le niveau de difficulté des questions :
du général au particulier,
du simple au compliqué.
iv - Formulation des questions (items) :
Voici quelques recommandations à respecter concernant la formulation des
questions :
la formulation doit être accessible à tous (niveau enfant de 10-12 ans pour
une enquête chez les adultes), la personne enquêtée doit pouvoir répondre
Reproduction et diffusion interdite sans accord des auteurs.
43
Les méthodes et techniques de base du recueil de données dans une enquête épidémiologique
sans aucune difficulté,
le niveau conceptuel ne doit pas être trop abstrait,
le vocabulaire employé doit être simple et familier (attention aux termes
trop techniques),
évitez les mots à plusieurs sens, les formes grammaticales peu claires
(double négation),
précisez le cadre de référence (l'unité par exemple),
posez des questions neutres pour ne pas influencer l'enquêté,
évitez les questions chargées.
b) Présentation du bordereau
Le bordereau doit être accompagné, si nécessaire, d'une lettre d'information qui
présente l'enquête et son ou ses objectifs.
La mise en page doit être claire et la présentation du bordereau soignée :
prévoyez un titre, des transitions si nécessaire,
numérotez les questions, - formulez des explications simples pour le
remplissage,
si le bordereau contient plusieurs pages, prévoyez le maintien
questionnaire (agrafes, spirales, etc.) et la numérotation des pages,
enfin, dans le cadre d'un entretien ou d'un questionnaire auto-administré,
n'oubliez pas d'adresser vos remerciements pour la participation.
du
3. Modes de passation
Le choix du mode de passation va conditionner la présentation générale du
bordereau et la formulation des questions.
Le bordereau peut être auto-administré, administré par un enquêteur en face-àface ou utilisé comme simple grille de recueil lorsque les informations sont
collectées à partir de dossiers médicaux par exemple.
a) Auto-administration
i - Ce mode de passation est très sensible à la qualité du
questionnaire :
les questions et les instructions doivent être écrites et formulées en
conséquence,
la présentation générale et la mise en page doivent être particulièrement
soignées pour donner « envie » d'y répondre,
la lettre d'introduction doit également faire l'objet de toutes les attentions au
moment de sa rédaction, la clarté et la précision de l'information sont
cruciales (ne pas hésiter à faire relire cette lettre par plusieurs personnes
avant usage).
ii - Les avantages :
44
il est moins coûteux,
il permet de toucher une population cible plus large,
Reproduction et diffusion interdite sans accord des auteurs.
Les méthodes et techniques de base du recueil de données dans une enquête épidémiologique
iii - Les inconvénients
un taux de non réponse plus élevé,
une auto-sélection,
moins de réponses de bonne qualité, très dépendant de la compréhension
des questions, de la capacité à répondre,
ne permet pas de garantir que la personne sollicitée est bien celle qui a
répondu (fréquent dans un foyer).
Pour améliorer le taux de retour, joignez au questionnaire une enveloppe
affranchie, prévoyez des relances téléphoniques ou postales (attention à adapter le
contenu de la lettre d'information qui accompagne le questionnaire) et dans
certains cas, mentionnez les intéressements s'il y en a.
Le répondeur peut aussi bien être un individu tout venant, un patient ou un
professionnel de santé.
→ le pré-test de l'auto-questionnaire est vivement recommandé.
b) Interrogatoire par un enquêteur
i - Ce mode de recueil implique la formation de l'enquêteur/
trice
L'enquêteur doit être sélectionné et préalablement formé. Il doit être motivé,
correctement informé du déroulement de l'enquête, de ses objectifs et de son
intérêt. Il doit aussi faire l'objet de contrôles pour vérifier la qualité de son travail.
Le principal risque est l'influence qu'il peut avoir sur la réponse aux questions.
ii - Le bordereau doit être adapté
Une attention particulière doit être portée à la standardisation du questionnaire et à
ses modalités d'utilisation pour éviter « l'effet » enquêteur. Les consignes doivent
être claires et différentiables des questions.
iii - Les avantages :
moins de refus,
des réponses de meilleure qualité,
moins de réponses manquantes.
iv - Les inconvénients :
plus coûteux que l'auto-administration,
risque d'orienter les réponses.
4. Quelques remarques sur la forme
Il est recommandé d'utiliser des cases à cocher bien disjointes pour éviter
que la croix ne se trouve à cheval sur deux modalités :
-
Reproduction et diffusion interdite sans accord des auteurs.
45
Les méthodes et techniques de base du recueil de données dans une enquête épidémiologique
Les réponses de type « oui/ non » sont sans ambiguïté :
-
46
Reproduction et diffusion interdite sans accord des auteurs.
Les méthodes et techniques de base du recueil de données dans une enquête épidémiologique
En général, évitez les questions (items) mixtes :
Préférez :
-
Reproduction et diffusion interdite sans accord des auteurs.
47
Les méthodes et techniques de base du recueil de données dans une enquête épidémiologique
La forme guide souvent la réponse :
-
5. Qualité du recueil de l'information
La qualité du recueil de l'information dépend comme nous l'avons vu du type
d'informations recueillies : délai écoulé entre la survenue de l'événement et le
recueil de l'information, importance de l'événement, nature de l'événement, ...
ainsi que des caractéristiques des sujets interrogés, de l'interrogatoire et de
l'enquêteur.
6. Test (ou pré-test) et validation
C'est une étape trop souvent négligée, elle est pourtant recommandée.
On l'appelle test, pré-test ou enquête pilote. Son objectif est de vérifier la faisabilité
de l'enquête, la pertinence et l'acceptabilité du bordereau de recueil (ou
questionnaire).
Si des problèmes sont identifiés à ce stade, des ajustements sont possibles. Ce qui
est oublié ou mal formulé est difficilement rattrapable ensuite.
En pratique, ce test :
s'effectue sur un petit groupe de personnes issues de la même population
enquêtée ou ayant des caractéristiques similaires,
s'effectue dans les mêmes conditions que celles prévues pour l'enquête,
permet de vérifier la formation des enquêteurs,
permet de vérifier l'acceptabilité du contenu du bordereau à travers le
niveau de compréhension des questions, la durée de passation, «
l'impression » des personnes testées,
permet de vérifier que les données recueillies sont celles nécessaires pour
répondre aux objectifs de l'enquête.
7. Conclusion
Préalablement au recueil de l'information, il convient de bien définir l'objectif de
l'enquête, d'analyser toutes les contraintes et définir les critères de qualité. Quant à
la construction du bordereau, il s'agit d'un travail important, long et technique.
48
Reproduction et diffusion interdite sans accord des auteurs.
Solution des
exercices de TD
> Solution n°1 (exercice p. 17)
fi = n i/N i
pi = nifumeur/ni
Nombre
Nombre de Proportion
d'élèves
Fraction
dans
fumeurs
de fumeurs
de
l'échantillon
pour la
dans la
sondage
pour la
strate i
strate i
strate i
Strate
Nombre
d'élèves
dans la
strate i
Ni
ni
fi
nifumeur
pi
Nipi/N
Lycée rural
Lycée urbain
Total
500
1300
1800
100
200
300
0,2
0,15
10
100
10,00%
50,00%
110
2,78%
36,11%
38,89%
N= ΣNi
ps = Σ Ni p i
N
Tableau 3 : -
Reproduction et diffusion interdite sans accord des auteurs.
49
Annexes
Au total, dans la population de laquelle est issu l'échantillon, on compte 1800
élèves.
L'échantillon comporte 300 élèves, dont 100 fumeurs. Lorsqu'on prend en compte
la stratification sur le caractère rural ou urbain, la proportion de fumeurs est
38,9%.
> Solution n°2 (exercice p. 38)
Réponse question n°1
Cette enquête implique de recueillir les caractéristiques socio-démographiques et
anthropométriques des enfants pour définir leur statut pondéral : le poids, la taille,
l'âge, le sexe. Dans le cadre d'une enquête de prévalence, la représentativité de
l'échantillon est primordiale pour permettre la généralisation du résultat. Outre les
informations sur la localisation de l'école (urbain/ rural), des informations sur les
déterminants du surpoids et de l'obésité peuvent également être recueillies :
sédentarité, pratique d'une activité physique, etc. Vous pouvez enfin recueillir des
informations relatives au déroulement de la mesure sur le terrain, elles vous
permettront (1) de vérifier si les modalités du recueil se sont ou non écartées de la
procédure
prévue
(infirmière
scolaire
pour
recueillir
les
données
anthropométriques, enfant accompagné ou non pour le remplissage des données
sur les activités, etc.) et (2) de comprendre le niveau de participation à l'enquête
(mesures effectuées dans le cadre de la visite médicale traditionnelle ou
spécialement prévue pour l'étude, à quel moment dans la semaine, disponibilité ou
non du matériel, etc.). Mais attention à ne collecter que les informations
véritablement utiles à l'enquête.
Réponse question n°2
Dans cette enquête, vous serez principalement confronté à des contraintes liées
aux caractéristiques de l'échantillon (enfants en classe de CM1) et aux moyens
nécessaires à l'enquête (pèse-personne, toise, ...). S'agissant d'une enquête
réalisée en milieu scolaire, un accord préalable du rectorat de l'Académie concernée
est indispensable. De plus, si vous prévoyez de questionner les enfants scolarisés,
sur leur activité physique par exemple, un accord préalable des parents doit être
obtenu. Vous ne manquerez pas de rappeler aux parents le caractère anonyme de
l'enquête et les mesures qui pourraient être proposées en cas de repérage d'un
enfant en surpoids ou obèse. Vous devrez vous appuyer sur une personne
compétente et autorisée à effectuer des mesures anthropométriques chez ces
enfants (médecin, infirmière) et envisager avec cette dernière le moment opportun
pour effectuer ces mesures, lors d'une visite médicale par exemple. Vous devrez
également vérifier la disponibilité du matériel dans les écoles concernées et si
nécessaire fournir les éléments manquants. Enfin, à l'issue de l'enquête, si vous
repérez des enfants en situation de surpoids ou obèses, vous devrez prévoir et
proposer une prise en charge adaptée aux familles.
50
Reproduction et diffusion interdite sans accord des auteurs.
Solution des Quiz
> Solution n°1 (quiz p. 11)
A. Sondage aléatoire simple
B. Sondage stratifié
C. Sondage en grappe
D. Sondage systématique
E. Méthode des quotas
> Solution n°2 (quiz p. 12)
A. Sondage aléatoire simple
B. Sondage stratifié
C. Sondage en grappe
D. Sondage systématique
E. Méthode des quotas
F. Sondage à 2 degrés
> Solution n°3 (quiz p. 12)
A. Sondage stratifié
B. Sondage en grappe
C. Sondage aléatoire simple
D. Sondage à 2 degrés
E. Sondage à 3 degrés
> Solution n°4 (quiz p. 12)
Reproduction et diffusion interdite sans accord des auteurs.
51
Annexes
A. Sondage à 3 degrés
B. Sondage en grappe
C. Sondage aléatoire simple
D. Sondage stratifié
E. Méthode des quotas
52
Reproduction et diffusion interdite sans accord des auteurs.

Documents pareils