Calcul des probabilités d`inclusion dans les enquêtes par

Transcription

Calcul des probabilités d`inclusion dans les enquêtes par
Calcul des probabilités d’inclusion
dans les enquêtes par sondage
probabiliste issues de bases de
numéro de téléphone fixe et mobile
Retour d’expérience de l’enquête
KABP VIH/SIDA 2010
C Sommen, J Warszawski, N Beltzer
AFS RT 20, 6 Juillet 2011
Contexte
KABP
• Connaissances, attitudes, comportements et
perceptions à l’égard du SIDA
• Enquêtes KABP répétées en 1992, 1994, 1998,
2001, 2004 et 2010
• Enquêtes nationales avec sur-échantillon IdF
• Tirage au sort des ménages
• Choix d’un individu au sein du ménage
Contexte
KABP : évolution des enquêtes
• 1992-1998 : utilisation de la liste blanche de
l’annuaire FT
• En 2001 : prise en compte des numéros non
disponibles sur l’annuaire (Liste rouge)
• En 2004 : Petit sur-échantillon de détenteurs
de mobiles exclusifs (questionnaire court)
Contexte
2010
• 18% ne sont pas joignables par téléphone mobile
• 13% des adultes ne sont pas joignables par
téléphone fixe
• Nouveaux opérateurs
– 39% des abonnés en téléphonie fixe ne sont pas inscrits
sur annuaire opérateur public (France Télécom)
• Absence d’un annuaire universel
Méthode alternative de tirage au sort
des numéros de téléphone
Choix méthodologiques 2010
Échantillon filaire
Échantillon mobile
1%
Génération aléatoire
de numéros préfixe
filaire (01 à 05)
Génération
aléatoire de
numéros
préfixe mobile
(06)
Ni fixe, ni
mobile ou
uniquement en
09
Nettoyage G’NUM de
l’ARCEP
Passage annuaire inversé
Adresse non
connue
Numéros
avec adresse
connue
Filaire
exclusif
Mobiles +
filaires
Mobiles
exclusifs
Pondération et redressement
• Tenir compte de la probabilité d’être
interrogé
• Tenir compte de la représentation de la
région IdF dans l’échantillon national (suréchantillon)
• Tenir compte de la représentation des
variables socio-démographiques dans
l’échantillon national
Pondération
Difficultés enquête 2010
• Enquêtes précédentes : poids inversement
proportionnel au nombre de personnes dans
le ménage
• 2010 : plan de sondage plus complexe
– 2 échantillons (F+P), 3 strates (F,FP,P)
– Génération aléatoire de numéros (pas
d’annuaire)
Pondération
Questions fondamentales
• Quelle est la répartition F/P/FP ?
• Quelle est la probabilité d’être interrogé sur
fixe, sur mobile ? Ou qu’un tel fixe/mobile
soit appelé ?
• La population des FP est-elle la même selon
le support téléphonique ?
• Les taux de réponses sont-ils indépendants
du support tel possédé par les individus ?
Pondération
proposition de 2 méthodes
• Méthode 1 :
 Calcul de la probabilité qu’un individu soit
interrogé en fonction du type de tel possédé
 Hypothèse : calcul du nombre de lignes
éligibles à partir des taux de réponses
• Méthode 2 :
 Redresser la répartition F/FP/P observée
 Hypothèse : population FP identiques selon
support tel
Pondération
Méthode 1
Pondération
Méthode 1 (1)
Pondération
Méthode 1 (2)
288 500 numéros
générés aléatoirement
Passage
annuaire
inversé
Passage
ARCEP
29%
Après
composition
et contact
84 696 numéros
Lettre
annonce
9 348 numéros
avec adresse
32%
75 348 numéros
sans adresse
3%
2951 inters réalisées
2051 inters réalisées
Taux de réponse : 1/58
Passage
43 200 numéros
générés aléatoirement
ARCEP
61%
Après
composition
et contact
26 268 numéros
19%
5007 inters réalisées
Taux de réponse : 1/9
Pondération
Méthode 2
Pondération
Méthode 2
• Deux échantillons : 1 (filaire) 2 (portable)
• Trois strates : FP / P / F
• Idée :
– Estimer ratios F/FP (dans ech 1) et P/FP (dans
ech 2) après pondération par nb utilisateurs
– En déduire la répartition estimée F / FP / P
– Redresser la répartition observée par la
répartition estimée
Pondération
Méthode 2
Population générale : répartition non observée
F
Ech 1 : filaire
FP
Ech 2 : portable
Estimation de la répartition à partir des données
Echantillon redressé
P
Pondération
Comparaisons des 2 méthodes
• M2 s’affranchit de la connaissance de la
probabilité qu’une ligne soit tirée au sort
utilisée dans M1
• M2 part du principe que les sous-éch FP
sont identiques
• M1 plus classique (calcul de la proba
d’inclusion) est assimilable à la méthode
des partages des poids
Pondération
Comparaisons des 2 méthodes : Téléphones
90
85
80
75
70
Données brutes Pondération ORS Pondération JW
Redress ORS
Redress JW
Fixe et Mobiles
20
15
10
5
0
Données brutes
Pondération
ORS
Pondération JW
Exclusifs mobiles
Redress ORS
Exclusifs fixes
Redress JW
Pondération
Comparaisons des 2 méthodes : Sexe
Sexe femme
57
56
55
54
53
52
51
50
49
48
47
Données brutes
Pondération ORS
Pondération JW
Redress ORS
Redress JW
Pondération
Comparaisons des 2 méthodes : Sexe
Sexe féminin
65
60
55
Téléphonie mobile
50
Téléphonie fixe
45
40
Données brutes
Pondération
ORS
Pondération JW Redress ORS
Redress JW
Pondération
Comparaisons des 2 méthodes : Age
Age < 30 ans
26
25
24
23
22
21
20
19
Données brutes
Pondération ORS
Pondération JW
Redress ORS
Redress JW
Pondération
Comparaisons des 2 méthodes : Age
Age < 30 ans
30
28
26
24
22
20
Téléphonie mobile
18
Téléphonie fixe
16
14
12
10
Données brutes
Pondération
ORS
Pondération JW Redress ORS
Redress JW
Pondération
Comparaisons méthodes : Utilisation du préservatif
Utilisation du préservatif dans les 12 mois
Données brutes
Pondération ORS
Pondération JW
Redress ORS
Distance entre 2 traits : 0,5 (%)
Redress JW
Pondération
Comparaisons méthodes : Utilisation du préservatif
Utilisation du préservatif dans les 12 mois
Téléphonie mobile
Téléphonie fixe
Données brutes Pondération ORS Pondération JW
Redress ORS
Redress JW
Distance entre 2 traits : 2 (%)
Conclusion
• Principales différences sur la répartition
F/P/FP
• Différences selon le support téléphonique
• Intervalles de confiance de taille similaire
selon les 2 méthodes
• Pas de différences sur les indicateurs
épidémiologiques