Calcul des probabilités d`inclusion dans les enquêtes par
Transcription
Calcul des probabilités d`inclusion dans les enquêtes par
Calcul des probabilités d’inclusion dans les enquêtes par sondage probabiliste issues de bases de numéro de téléphone fixe et mobile Retour d’expérience de l’enquête KABP VIH/SIDA 2010 C Sommen, J Warszawski, N Beltzer AFS RT 20, 6 Juillet 2011 Contexte KABP • Connaissances, attitudes, comportements et perceptions à l’égard du SIDA • Enquêtes KABP répétées en 1992, 1994, 1998, 2001, 2004 et 2010 • Enquêtes nationales avec sur-échantillon IdF • Tirage au sort des ménages • Choix d’un individu au sein du ménage Contexte KABP : évolution des enquêtes • 1992-1998 : utilisation de la liste blanche de l’annuaire FT • En 2001 : prise en compte des numéros non disponibles sur l’annuaire (Liste rouge) • En 2004 : Petit sur-échantillon de détenteurs de mobiles exclusifs (questionnaire court) Contexte 2010 • 18% ne sont pas joignables par téléphone mobile • 13% des adultes ne sont pas joignables par téléphone fixe • Nouveaux opérateurs – 39% des abonnés en téléphonie fixe ne sont pas inscrits sur annuaire opérateur public (France Télécom) • Absence d’un annuaire universel Méthode alternative de tirage au sort des numéros de téléphone Choix méthodologiques 2010 Échantillon filaire Échantillon mobile 1% Génération aléatoire de numéros préfixe filaire (01 à 05) Génération aléatoire de numéros préfixe mobile (06) Ni fixe, ni mobile ou uniquement en 09 Nettoyage G’NUM de l’ARCEP Passage annuaire inversé Adresse non connue Numéros avec adresse connue Filaire exclusif Mobiles + filaires Mobiles exclusifs Pondération et redressement • Tenir compte de la probabilité d’être interrogé • Tenir compte de la représentation de la région IdF dans l’échantillon national (suréchantillon) • Tenir compte de la représentation des variables socio-démographiques dans l’échantillon national Pondération Difficultés enquête 2010 • Enquêtes précédentes : poids inversement proportionnel au nombre de personnes dans le ménage • 2010 : plan de sondage plus complexe – 2 échantillons (F+P), 3 strates (F,FP,P) – Génération aléatoire de numéros (pas d’annuaire) Pondération Questions fondamentales • Quelle est la répartition F/P/FP ? • Quelle est la probabilité d’être interrogé sur fixe, sur mobile ? Ou qu’un tel fixe/mobile soit appelé ? • La population des FP est-elle la même selon le support téléphonique ? • Les taux de réponses sont-ils indépendants du support tel possédé par les individus ? Pondération proposition de 2 méthodes • Méthode 1 : Calcul de la probabilité qu’un individu soit interrogé en fonction du type de tel possédé Hypothèse : calcul du nombre de lignes éligibles à partir des taux de réponses • Méthode 2 : Redresser la répartition F/FP/P observée Hypothèse : population FP identiques selon support tel Pondération Méthode 1 Pondération Méthode 1 (1) Pondération Méthode 1 (2) 288 500 numéros générés aléatoirement Passage annuaire inversé Passage ARCEP 29% Après composition et contact 84 696 numéros Lettre annonce 9 348 numéros avec adresse 32% 75 348 numéros sans adresse 3% 2951 inters réalisées 2051 inters réalisées Taux de réponse : 1/58 Passage 43 200 numéros générés aléatoirement ARCEP 61% Après composition et contact 26 268 numéros 19% 5007 inters réalisées Taux de réponse : 1/9 Pondération Méthode 2 Pondération Méthode 2 • Deux échantillons : 1 (filaire) 2 (portable) • Trois strates : FP / P / F • Idée : – Estimer ratios F/FP (dans ech 1) et P/FP (dans ech 2) après pondération par nb utilisateurs – En déduire la répartition estimée F / FP / P – Redresser la répartition observée par la répartition estimée Pondération Méthode 2 Population générale : répartition non observée F Ech 1 : filaire FP Ech 2 : portable Estimation de la répartition à partir des données Echantillon redressé P Pondération Comparaisons des 2 méthodes • M2 s’affranchit de la connaissance de la probabilité qu’une ligne soit tirée au sort utilisée dans M1 • M2 part du principe que les sous-éch FP sont identiques • M1 plus classique (calcul de la proba d’inclusion) est assimilable à la méthode des partages des poids Pondération Comparaisons des 2 méthodes : Téléphones 90 85 80 75 70 Données brutes Pondération ORS Pondération JW Redress ORS Redress JW Fixe et Mobiles 20 15 10 5 0 Données brutes Pondération ORS Pondération JW Exclusifs mobiles Redress ORS Exclusifs fixes Redress JW Pondération Comparaisons des 2 méthodes : Sexe Sexe femme 57 56 55 54 53 52 51 50 49 48 47 Données brutes Pondération ORS Pondération JW Redress ORS Redress JW Pondération Comparaisons des 2 méthodes : Sexe Sexe féminin 65 60 55 Téléphonie mobile 50 Téléphonie fixe 45 40 Données brutes Pondération ORS Pondération JW Redress ORS Redress JW Pondération Comparaisons des 2 méthodes : Age Age < 30 ans 26 25 24 23 22 21 20 19 Données brutes Pondération ORS Pondération JW Redress ORS Redress JW Pondération Comparaisons des 2 méthodes : Age Age < 30 ans 30 28 26 24 22 20 Téléphonie mobile 18 Téléphonie fixe 16 14 12 10 Données brutes Pondération ORS Pondération JW Redress ORS Redress JW Pondération Comparaisons méthodes : Utilisation du préservatif Utilisation du préservatif dans les 12 mois Données brutes Pondération ORS Pondération JW Redress ORS Distance entre 2 traits : 0,5 (%) Redress JW Pondération Comparaisons méthodes : Utilisation du préservatif Utilisation du préservatif dans les 12 mois Téléphonie mobile Téléphonie fixe Données brutes Pondération ORS Pondération JW Redress ORS Redress JW Distance entre 2 traits : 2 (%) Conclusion • Principales différences sur la répartition F/P/FP • Différences selon le support téléphonique • Intervalles de confiance de taille similaire selon les 2 méthodes • Pas de différences sur les indicateurs épidémiologiques