La Qualité des données de cadrage

Transcription

La Qualité des données de cadrage
La Qualité des données
de cadrage
Jérôme NERAUDAU
Directeur Etudes
& Méthodes Scientifiques
La qualité des données de
cadrage
Sommaire
I – Les données INSEE
a) Les différentes sources utilisables
b) La mise au point d’une base socio-démographique
II – Etudes utilisées comme source de cadrage
a) La Référence des Equipements Multimedia
b) La 126.000
c) L’Observatoire des Usages Internet
Exposé SFdS du 5 juin 2007
2
La qualité des données de
cadrage
Introduction
Pourquoi des données de cadrage
en amont : construction des échantillons
en aval : redressement et extrapolation
Contexte
diversité croissante des modes de recueil
populations inégalement joignables
Exposé SFdS du 5 juin 2007
3
La qualité des données de
cadrage
Introduction
La maîtrise des échantillons d’enquête (élaboration,
redressement) passe par l’utilisation d’un dispositif de
cadrage robuste.
Exposé SFdS du 5 juin 2007
4
La qualité des données de
cadrage
I - Les données INSEE
Exposé SFdS du 5 juin 2007
5
La qualité des données de
cadrage
I – Les Données INSEE
Les différentes sources utilisables
Les données du recensement :
Dernier recensement exhaustif : 1999
Depuis 2004, changement de méthodologie :
- Communes de –10.000 hab. : recensement annuel auprès d’un cinquième des
communes (recensement exhaustif au bout des 5 années)
- Communes de +10.000 hab. : recensement annuel de 8% des logements de chaque
commune
Résultats disponibles :
- Depuis 2005 : résultats provisoires pour les communes de moins de 10.000 hab. ayant fait
l’objet d’un recensement, et estimations de la population pour chaque commune de plus
de 10.000 hab.
- Fin 2008 : population dans chaque commune (statistiques complètes sur les habitants et
logements)
Exposé SFdS du 5 juin 2007
6
La qualité des données de
cadrage
I – Les Données INSEE
Les différentes sources utilisables
Les données des enquêtes emploi :
Jusqu’en 2002, enquête annuelle en Mars
Depuis 2002, changement de méthodologie :
- collecte en continu tout au long de l’année (échantillons trimestriels de 35.000
logements répondants)
- renouvellement par 1/6 de l’échantillon par trimestre (logement interrogé six
trimestres consécutifs)
- environ 150.000 logements répondants par an.
Résultats disponibles :
- résultats sur l’activité professionnelle et les caractéristiques du foyer (nombre de
personnes) en 2003, 2004, 2005
Exposé SFdS du 5 juin 2007
7
La qualité des données de
cadrage
I – Les Données INSEE
Les différentes sources utilisables
Le tableau annuel de la population :
Publié dans le numéro de janvier du Bulletin Mensuel de la Statistique :
- estimations de la population totale par sexe et âge au 1er janvier
- à partir des bulletins d’état civil, d’une estimation du solde migratoire, et des
estimations des derniers recensements (2004, 2005, 2006)
Résultats disponibles :
- estimation de la population totale par sexe et âge au 1er janvier de chaque
année
Exposé SFdS du 5 juin 2007
8
La qualité des données de
cadrage
I – Les Données INSEE
Les différentes sources utilisables
Les projections de population de l’INSEE :
- Projections de la population par sexe, âge et région INSEE à partir du
Recensement 1999
- Résultats disponibles :
projections de la population par sexe, âge, région INSEE en 2007 à partir du
recensement 1999
Exposé SFdS du 5 juin 2007
9
La qualité des données de
cadrage
I – Les Données INSEE
La construction d’une base socio-démographique annuelle :
Méthode utilisée :
- Estimation de la population totale sur les critères sexe X âge, à partir du BMS
et du taux d’appartenance aux ménages
- Application de ces effectifs de population aux projections INSEE, pour
déterminer la répartition de la population par région INSEE et par
département.
- Estimation de la population active des individus et des personnes de référence,
de la taille du foyer, à partir des données de l’Enquête Emploi
Utilisation des données INSEE les plus récentes
Exposé SFdS du 5 juin 2007
10
La qualité des données de
cadrage
I – Les Données INSEE
Validation annuelle avec le CESP :
Sources utilisées
Méthode d’élaboration
Résultats obtenus
Collaboration avec le CESP permettant :
La cohérence des chiffres de population avec autres études médias
Des démarches communes vis-à-vis de l’INSEE en cas de questions
sur les données du recensement ou des Enquêtes Emploi
Exposé SFdS du 5 juin 2007
11
La qualité des données de
cadrage
II – Etudes utilisées comme source de cadrage
A) La Référence des Equipements Multimedia
(R.E.M)
Exposé SFdS du 5 juin 2007
12
La qualité des données de
cadrage
II – Etudes utilisées comme source de cadrage
A) La Référence des Equipements Multimedia
Un partenariat GFK-ISL-Médiamétrie
- objectifs de l’étude :
Etablir des taux d’équipements de référence chaque trimestre dans les
domaines suivants :
- audio-visuel : télévision, magnétoscope, lecteur DVD, modes de réception
TV, abonnements bouquets TV,…
- informatique : ordinateurs, imprimantes, périphériques
- internet : accès domicile, haut/bas débit, fournisseur,…
- téléphonie fixe et mobile : équipement, utilisation,…
- autres équipements : appareils photo numériques, baladeurs, …
Exposé SFdS du 5 juin 2007
13
La qualité des données de
cadrage
II – Etudes utilisées comme source de cadrage
A) La Référence des Equipements Multimedia
- dispositif d’étude :
- Enquête face à face : 22.000 interviews annuelles (2.000 interviews
mensuelles, sauf en août, cumuls trimestriels pour les résultats)
- Entretiens réalisés au domicile des personnes interrogées :
- enquêteurs munis de documents pour aider l’interviewé à répondre
- possibilité de vérifier sur place les caractéristiques des équipements
- utilisation du système CAPI, permettant d’assurer la fluidité logique de
l’entretien, et la saisie directe des réponses
- Questionnaire évolutif, mis à jour chaque trimestre, en fonction des nouveaux
équipements
Exposé SFdS du 5 juin 2007
14
La qualité des données de
cadrage
II – Etudes utilisées comme source de cadrage
La Référence des Equipements Multimedia
- dispositif d’étude :
Représentativité assurée en amont :
- Plan de sondage construit sur une matrice Région ZEAT X habitat (5
catégories)
- Interviews réalisées au prorata de la population dans chaque strate, y
compris pour la répartition ville / banlieue
- 210 communes touchées à chaque vague trimestrielle
- Quotas sur les variables Sexe / Age / Csp de l’individu / Activité de la
femme
Exposé SFdS du 5 juin 2007
15
La qualité des données de
cadrage
II – Etudes utilisées comme source de cadrage
La Référence des Equipements Multimedia
- dispositif d’étude :
Représentativité assurée en aval :
- Les résultats INSEE livrent les effectifs et les structures de population
- Les panels distributeurs de GFK procurent les chiffres de vente des produits,
ainsi qu’un taux d’obsolescence pour chaque équipement
- Les résultats de l’enquête donnent des taux de multi-équipement et des taux
de renouvellement pour chaque équipement
L’utilisation conjointe de ces sources permet de définir un taux de
possession faisant référence pour chaque bien d’équipement, ainsi que le
profil des possesseurs
Exposé SFdS du 5 juin 2007
16
La qualité des données de
cadrage
II – Etudes utilisées comme source de cadrage
A) La Référence des Equipements Multimedia (REM)
- données de cadrage produites :
Taux d’équipements audio-visuels
- télévision
- magnétoscope / DVD
- réception TV (câble, satellite, TNT, ADSL, + abonnements)
Taux d’équipements informatiques & internet
- micro-ordinateur
- accès internet domicile
Taux d’équipement en téléphonie
- lignes fixes
- mobiles dont « exclusifs mobiles »
Exposé SFdS du 5 juin 2007
17
La qualité des données de
cadrage
II – Etudes utilisées comme source de cadrage
B) La « 126.000 »
Exposé SFdS du 5 juin 2007
18
La qualité des données de
cadrage
II – Etudes utilisées comme source de cadrage
B) La « 126.000 »
Objectifs de l’étude : mesure de l’audience de la radio auprès de la population 13
ans ou plus
France Métropolitaine
4 résultats par an au niveau national et IDF (hors étude « grilles d’été »))
2 résultats par an pour huit grandes agglomérations
1 résultat par an pour autres zones locales
Exposé SFdS du 5 juin 2007
19
La qualité des données de
cadrage
II – Etudes utilisées comme source de cadrage
B) La « 126.000 »
Dispositif d’étude :
126.000 interviews annuelles par téléphone (fixe & mobile)
Equi-répartition quotidienne des interviews
Quotas quotidiens, sur 5 régions de recueil
Recueil de l’audience « dernières 24 heures » de la radio
Recueil de l’audience veille TV et de l’audience cinéma (lors d’un 2ème
appel)
Exposé SFdS du 5 juin 2007
20
La qualité des données de
cadrage
II – Etudes utilisées comme source de cadrage
B) La « 126.000 »
Dispositif d’étude :
- Un plan de sondage stratifié :
- sur-échantillons locaux (agglomérations)
- sous-représentation des 65 ans & +
- interrogation des « exclusifs mobiles » à la moitié de leur
poids réel
- Des quotas sur les variables :
- sexe X âge
- sexe X activité (4 catégories)
- type d’appel (fixe / mobile)
Exposé SFdS du 5 juin 2007
21
La qualité des données de
cadrage
II – Etudes utilisées comme source de cadrage
B) La « 126.000 »
Dispositif d’étude :
- Représentativité assurée a posteriori par le redressement :
- remise à leur poids des zones géographiques
- remise à leur poids des « 65 ans & + »
- remise à leur poids des « exclusifs mobiles »
- ajustement sur autres critères socio-démographiques : sexe, âge,
profession (individu & chef), habitat, taille du foyer
- Utilisation des données de cadrage :
- Socio-démographiques (cf partie I-)
- Données issues de la REM (taux d’exclusifs mobiles)
Exposé SFdS du 5 juin 2007
22
La qualité des données de
cadrage
II – Etudes utilisées comme source de cadrage
B) La « 126.000 »
Données de cadrage produites :
- Répartition et structure de la population selon sa fréquentation cinéma
- fréquentation cinéma 12 Derniers Mois
- fréquentation cinéma 7 Derniers Jours
- Assidus / Réguliers / Occasionnels
- Utilisation de ces données :
- Pour les études sur le public du cinéma, dont
beaucoup sont
réalisées en mode CAWI
(questionnaires auto-administrés sur
internet)
- En particulier, Cin’hebdo : étude sur la notoriété et
l’intention
de voir des films, évaluées
avant leur sortie en salles
Exposé SFdS du 5 juin 2007
23
La qualité des données de
cadrage
II – Etudes utilisées comme source de cadrage
B) La « 126.000 »
Données de cadrage produites :
- Volet télévision :
- mesure de l’audience veille de la télévision :
- protocole de recueil d’audience similaire à celui utilisé pour la
radio
- périmètre : audience déclarée quel que soit le lieu
- comparaison avec les résultats du Médiamat :
- s’assurer que les résultats du Médiamat ne sont pas impactés
par un « effet panel »
Exposé SFdS du 5 juin 2007
24
La qualité des données de
cadrage
II – Etudes utilisées comme source de cadrage
C) L’Observatoire des Usages Internet
(O.U.I.)
Exposé SFdS du 5 juin 2007
25
La qualité des données de
cadrage
II – Etudes utilisées comme source de cadrage
C) L’Observatoire des Usages Internet (« O.U.I.»)
Objectifs de l’étude : mesure des usages en terme d’internet et
téléphonie mobile
population 11 ans et plus
France Métropolitaine
Résultats trimestriels
Exposé SFdS du 5 juin 2007
26
La qualité des données de
cadrage
II – Etudes utilisées comme source de cadrage
C) L’Observatoire des Usages Internet (« O.U.I.»)
Dispositif d’étude :
Enquête téléphonique (fixe & mobile)
11.000 interviews annuelles (1.000 par mois, sauf août)
Quotas socio-démographiques
Exposé SFdS du 5 juin 2007
27
La qualité des données de
cadrage
II – Etudes utilisées comme source de cadrage
C) L’Observatoire des Usages Internet (« O.U.I.»)
Dispositif d’étude :
- Représentativité assurée :
- a priori par la méthode des quotas
- a posteriori par le redressement sur des critères sociodémographiques et d’équipement informatique
- Utilisation des données de cadrage :
- Socio-démographiques (cf partie I-)
- Données issues de la REM (taux d’exclusifs mobiles,
taux de
possession microordinateur et accès internet)
Exposé SFdS du 5 juin 2007
28
La qualité des données de
cadrage
II – Etudes utilisées comme source de
cadrage
C) L’Observatoire des Usages Internet (« O.U.I.»)
Données de cadrage produites :
- Répartition et structure de la population selon :
- accès internet à domicile
- accès internet sur lieu de travail
- Utilisation de ces données :
- Redressement des résultats du Panel Internet
Exposé SFdS du 5 juin 2007
29
La qualité des données de
cadrage
Conclusion
Les données INSEE constituent le socle essentiel pour l’élaboration des
échantillons
Les études construites sur ce référentiel INSEE permettent à leur tour
d’élaborer d’autres données de cadrage.
Ce principe de cadrage permet d’assurer la pertinence et la cohérence
des résultats des études
Exposé SFdS du 5 juin 2007
30
Merci pour votre attention
Exposé SFdS du 5 juin 2007
31