La Qualité des données de cadrage
Transcription
La Qualité des données de cadrage
La Qualité des données de cadrage Jérôme NERAUDAU Directeur Etudes & Méthodes Scientifiques La qualité des données de cadrage Sommaire I – Les données INSEE a) Les différentes sources utilisables b) La mise au point d’une base socio-démographique II – Etudes utilisées comme source de cadrage a) La Référence des Equipements Multimedia b) La 126.000 c) L’Observatoire des Usages Internet Exposé SFdS du 5 juin 2007 2 La qualité des données de cadrage Introduction Pourquoi des données de cadrage en amont : construction des échantillons en aval : redressement et extrapolation Contexte diversité croissante des modes de recueil populations inégalement joignables Exposé SFdS du 5 juin 2007 3 La qualité des données de cadrage Introduction La maîtrise des échantillons d’enquête (élaboration, redressement) passe par l’utilisation d’un dispositif de cadrage robuste. Exposé SFdS du 5 juin 2007 4 La qualité des données de cadrage I - Les données INSEE Exposé SFdS du 5 juin 2007 5 La qualité des données de cadrage I – Les Données INSEE Les différentes sources utilisables Les données du recensement : Dernier recensement exhaustif : 1999 Depuis 2004, changement de méthodologie : - Communes de –10.000 hab. : recensement annuel auprès d’un cinquième des communes (recensement exhaustif au bout des 5 années) - Communes de +10.000 hab. : recensement annuel de 8% des logements de chaque commune Résultats disponibles : - Depuis 2005 : résultats provisoires pour les communes de moins de 10.000 hab. ayant fait l’objet d’un recensement, et estimations de la population pour chaque commune de plus de 10.000 hab. - Fin 2008 : population dans chaque commune (statistiques complètes sur les habitants et logements) Exposé SFdS du 5 juin 2007 6 La qualité des données de cadrage I – Les Données INSEE Les différentes sources utilisables Les données des enquêtes emploi : Jusqu’en 2002, enquête annuelle en Mars Depuis 2002, changement de méthodologie : - collecte en continu tout au long de l’année (échantillons trimestriels de 35.000 logements répondants) - renouvellement par 1/6 de l’échantillon par trimestre (logement interrogé six trimestres consécutifs) - environ 150.000 logements répondants par an. Résultats disponibles : - résultats sur l’activité professionnelle et les caractéristiques du foyer (nombre de personnes) en 2003, 2004, 2005 Exposé SFdS du 5 juin 2007 7 La qualité des données de cadrage I – Les Données INSEE Les différentes sources utilisables Le tableau annuel de la population : Publié dans le numéro de janvier du Bulletin Mensuel de la Statistique : - estimations de la population totale par sexe et âge au 1er janvier - à partir des bulletins d’état civil, d’une estimation du solde migratoire, et des estimations des derniers recensements (2004, 2005, 2006) Résultats disponibles : - estimation de la population totale par sexe et âge au 1er janvier de chaque année Exposé SFdS du 5 juin 2007 8 La qualité des données de cadrage I – Les Données INSEE Les différentes sources utilisables Les projections de population de l’INSEE : - Projections de la population par sexe, âge et région INSEE à partir du Recensement 1999 - Résultats disponibles : projections de la population par sexe, âge, région INSEE en 2007 à partir du recensement 1999 Exposé SFdS du 5 juin 2007 9 La qualité des données de cadrage I – Les Données INSEE La construction d’une base socio-démographique annuelle : Méthode utilisée : - Estimation de la population totale sur les critères sexe X âge, à partir du BMS et du taux d’appartenance aux ménages - Application de ces effectifs de population aux projections INSEE, pour déterminer la répartition de la population par région INSEE et par département. - Estimation de la population active des individus et des personnes de référence, de la taille du foyer, à partir des données de l’Enquête Emploi Utilisation des données INSEE les plus récentes Exposé SFdS du 5 juin 2007 10 La qualité des données de cadrage I – Les Données INSEE Validation annuelle avec le CESP : Sources utilisées Méthode d’élaboration Résultats obtenus Collaboration avec le CESP permettant : La cohérence des chiffres de population avec autres études médias Des démarches communes vis-à-vis de l’INSEE en cas de questions sur les données du recensement ou des Enquêtes Emploi Exposé SFdS du 5 juin 2007 11 La qualité des données de cadrage II – Etudes utilisées comme source de cadrage A) La Référence des Equipements Multimedia (R.E.M) Exposé SFdS du 5 juin 2007 12 La qualité des données de cadrage II – Etudes utilisées comme source de cadrage A) La Référence des Equipements Multimedia Un partenariat GFK-ISL-Médiamétrie - objectifs de l’étude : Etablir des taux d’équipements de référence chaque trimestre dans les domaines suivants : - audio-visuel : télévision, magnétoscope, lecteur DVD, modes de réception TV, abonnements bouquets TV,… - informatique : ordinateurs, imprimantes, périphériques - internet : accès domicile, haut/bas débit, fournisseur,… - téléphonie fixe et mobile : équipement, utilisation,… - autres équipements : appareils photo numériques, baladeurs, … Exposé SFdS du 5 juin 2007 13 La qualité des données de cadrage II – Etudes utilisées comme source de cadrage A) La Référence des Equipements Multimedia - dispositif d’étude : - Enquête face à face : 22.000 interviews annuelles (2.000 interviews mensuelles, sauf en août, cumuls trimestriels pour les résultats) - Entretiens réalisés au domicile des personnes interrogées : - enquêteurs munis de documents pour aider l’interviewé à répondre - possibilité de vérifier sur place les caractéristiques des équipements - utilisation du système CAPI, permettant d’assurer la fluidité logique de l’entretien, et la saisie directe des réponses - Questionnaire évolutif, mis à jour chaque trimestre, en fonction des nouveaux équipements Exposé SFdS du 5 juin 2007 14 La qualité des données de cadrage II – Etudes utilisées comme source de cadrage La Référence des Equipements Multimedia - dispositif d’étude : Représentativité assurée en amont : - Plan de sondage construit sur une matrice Région ZEAT X habitat (5 catégories) - Interviews réalisées au prorata de la population dans chaque strate, y compris pour la répartition ville / banlieue - 210 communes touchées à chaque vague trimestrielle - Quotas sur les variables Sexe / Age / Csp de l’individu / Activité de la femme Exposé SFdS du 5 juin 2007 15 La qualité des données de cadrage II – Etudes utilisées comme source de cadrage La Référence des Equipements Multimedia - dispositif d’étude : Représentativité assurée en aval : - Les résultats INSEE livrent les effectifs et les structures de population - Les panels distributeurs de GFK procurent les chiffres de vente des produits, ainsi qu’un taux d’obsolescence pour chaque équipement - Les résultats de l’enquête donnent des taux de multi-équipement et des taux de renouvellement pour chaque équipement L’utilisation conjointe de ces sources permet de définir un taux de possession faisant référence pour chaque bien d’équipement, ainsi que le profil des possesseurs Exposé SFdS du 5 juin 2007 16 La qualité des données de cadrage II – Etudes utilisées comme source de cadrage A) La Référence des Equipements Multimedia (REM) - données de cadrage produites : Taux d’équipements audio-visuels - télévision - magnétoscope / DVD - réception TV (câble, satellite, TNT, ADSL, + abonnements) Taux d’équipements informatiques & internet - micro-ordinateur - accès internet domicile Taux d’équipement en téléphonie - lignes fixes - mobiles dont « exclusifs mobiles » Exposé SFdS du 5 juin 2007 17 La qualité des données de cadrage II – Etudes utilisées comme source de cadrage B) La « 126.000 » Exposé SFdS du 5 juin 2007 18 La qualité des données de cadrage II – Etudes utilisées comme source de cadrage B) La « 126.000 » Objectifs de l’étude : mesure de l’audience de la radio auprès de la population 13 ans ou plus France Métropolitaine 4 résultats par an au niveau national et IDF (hors étude « grilles d’été »)) 2 résultats par an pour huit grandes agglomérations 1 résultat par an pour autres zones locales Exposé SFdS du 5 juin 2007 19 La qualité des données de cadrage II – Etudes utilisées comme source de cadrage B) La « 126.000 » Dispositif d’étude : 126.000 interviews annuelles par téléphone (fixe & mobile) Equi-répartition quotidienne des interviews Quotas quotidiens, sur 5 régions de recueil Recueil de l’audience « dernières 24 heures » de la radio Recueil de l’audience veille TV et de l’audience cinéma (lors d’un 2ème appel) Exposé SFdS du 5 juin 2007 20 La qualité des données de cadrage II – Etudes utilisées comme source de cadrage B) La « 126.000 » Dispositif d’étude : - Un plan de sondage stratifié : - sur-échantillons locaux (agglomérations) - sous-représentation des 65 ans & + - interrogation des « exclusifs mobiles » à la moitié de leur poids réel - Des quotas sur les variables : - sexe X âge - sexe X activité (4 catégories) - type d’appel (fixe / mobile) Exposé SFdS du 5 juin 2007 21 La qualité des données de cadrage II – Etudes utilisées comme source de cadrage B) La « 126.000 » Dispositif d’étude : - Représentativité assurée a posteriori par le redressement : - remise à leur poids des zones géographiques - remise à leur poids des « 65 ans & + » - remise à leur poids des « exclusifs mobiles » - ajustement sur autres critères socio-démographiques : sexe, âge, profession (individu & chef), habitat, taille du foyer - Utilisation des données de cadrage : - Socio-démographiques (cf partie I-) - Données issues de la REM (taux d’exclusifs mobiles) Exposé SFdS du 5 juin 2007 22 La qualité des données de cadrage II – Etudes utilisées comme source de cadrage B) La « 126.000 » Données de cadrage produites : - Répartition et structure de la population selon sa fréquentation cinéma - fréquentation cinéma 12 Derniers Mois - fréquentation cinéma 7 Derniers Jours - Assidus / Réguliers / Occasionnels - Utilisation de ces données : - Pour les études sur le public du cinéma, dont beaucoup sont réalisées en mode CAWI (questionnaires auto-administrés sur internet) - En particulier, Cin’hebdo : étude sur la notoriété et l’intention de voir des films, évaluées avant leur sortie en salles Exposé SFdS du 5 juin 2007 23 La qualité des données de cadrage II – Etudes utilisées comme source de cadrage B) La « 126.000 » Données de cadrage produites : - Volet télévision : - mesure de l’audience veille de la télévision : - protocole de recueil d’audience similaire à celui utilisé pour la radio - périmètre : audience déclarée quel que soit le lieu - comparaison avec les résultats du Médiamat : - s’assurer que les résultats du Médiamat ne sont pas impactés par un « effet panel » Exposé SFdS du 5 juin 2007 24 La qualité des données de cadrage II – Etudes utilisées comme source de cadrage C) L’Observatoire des Usages Internet (O.U.I.) Exposé SFdS du 5 juin 2007 25 La qualité des données de cadrage II – Etudes utilisées comme source de cadrage C) L’Observatoire des Usages Internet (« O.U.I.») Objectifs de l’étude : mesure des usages en terme d’internet et téléphonie mobile population 11 ans et plus France Métropolitaine Résultats trimestriels Exposé SFdS du 5 juin 2007 26 La qualité des données de cadrage II – Etudes utilisées comme source de cadrage C) L’Observatoire des Usages Internet (« O.U.I.») Dispositif d’étude : Enquête téléphonique (fixe & mobile) 11.000 interviews annuelles (1.000 par mois, sauf août) Quotas socio-démographiques Exposé SFdS du 5 juin 2007 27 La qualité des données de cadrage II – Etudes utilisées comme source de cadrage C) L’Observatoire des Usages Internet (« O.U.I.») Dispositif d’étude : - Représentativité assurée : - a priori par la méthode des quotas - a posteriori par le redressement sur des critères sociodémographiques et d’équipement informatique - Utilisation des données de cadrage : - Socio-démographiques (cf partie I-) - Données issues de la REM (taux d’exclusifs mobiles, taux de possession microordinateur et accès internet) Exposé SFdS du 5 juin 2007 28 La qualité des données de cadrage II – Etudes utilisées comme source de cadrage C) L’Observatoire des Usages Internet (« O.U.I.») Données de cadrage produites : - Répartition et structure de la population selon : - accès internet à domicile - accès internet sur lieu de travail - Utilisation de ces données : - Redressement des résultats du Panel Internet Exposé SFdS du 5 juin 2007 29 La qualité des données de cadrage Conclusion Les données INSEE constituent le socle essentiel pour l’élaboration des échantillons Les études construites sur ce référentiel INSEE permettent à leur tour d’élaborer d’autres données de cadrage. Ce principe de cadrage permet d’assurer la pertinence et la cohérence des résultats des études Exposé SFdS du 5 juin 2007 30 Merci pour votre attention Exposé SFdS du 5 juin 2007 31