Questionnaires et données de seconde main
Transcription
Questionnaires et données de seconde main
Introduction De quelques avantages De quatre écueils Conclusion Questionnaires et données de seconde main. Quelques enjeux de l'analyse secondaire des données Yoann Demoli Laboratoire de Sociologie Quantitative Observatoire Sociologique du Changement Université de Paris 8 Quantier en Sciences Sociales Séminaire organisé par Thomas Collas École des Hautes Études en Sciences Sociales 9 décembre 2014 Questionnaires et données de seconde main 1 / 48 Introduction De quelques avantages De quatre écueils Conclusion Sommaire Introduction Présentation de la thèse Références bibliographiques De quelques avantages du recours à l'analyse secondaire des données De quatre écueils posés par l'analyse secondaire des données Conclusion Questionnaires et données de seconde main 2 / 48 Introduction De quelques avantages De quatre écueils Conclusion Sommaire Introduction Présentation de la thèse Références bibliographiques De quelques avantages du recours à l'analyse secondaire des données Éléments de contextualisation de l'analyse secondaire De quelques avantages de l'analyse secondaire des données De quatre écueils posés par l'analyse secondaire des données Des données doublement inconnues Des données superues Des données biscornues Des données peu congrues Conclusion Questionnaires et données de seconde main 3 / 48 Introduction De quelques avantages De quatre écueils Conclusion Architecture de la thèse 1. Partie I : La diusion sociale de l'automobile en questions I I I Une banalisation inachevée ? Ménages sans voiture et multi-équipement Les dynamiques générationnelles de l'équipement automobile Les logiques sociales de l'accès à l'automobile chez les femmes au cours du XXè siècle 2. Partie II : Classes d'automobiles et automobiles de classes I I La stratication sociale des modèles automobiles Les propriétés sociales des conducteurs de 4x4 3. Partie III : Les coûts sociaux de l'automobile, structures et évolutions I I Concurrence pour la sécurité et la pollution. L'espace social des modèles dangereux et polluants La straticaton sociale des coûts budgétaires de l'automobile Questionnaires et données de seconde main 4 / 48 Introduction De quelques avantages De quatre écueils Conclusion Les bases de données utilisées La série des enquêtes Budget de famille I I I I Cinq (six) dates : 1984, 1989, 1995, 2001, 2006 (et 2011) Une enquête par carnet 10 000 ménages par enquête Un poste de dépenses automobiles très détaillé La série des enquêtes Transports I I I I Trois dates : 1981, 1993-4, 2008 Une enquête par carnet 10 000 ménages par enquête Articulation de l'échelle du ménage, du parc automobile et de l'individu Questionnaires et données de seconde main 5 / 48 Introduction De quelques avantages De quatre écueils Conclusion Sommaire Introduction Présentation de la thèse Références bibliographiques De quelques avantages du recours à l'analyse secondaire des données Éléments de contextualisation de l'analyse secondaire De quelques avantages de l'analyse secondaire des données De quatre écueils posés par l'analyse secondaire des données Des données doublement inconnues Des données superues Des données biscornues Des données peu congrues Conclusion Questionnaires et données de seconde main 6 / 48 Introduction De quelques avantages De quatre écueils Conclusion Références bibliographiques I I I I I I I I I Amossé, T., Peretti (de), G., (2011), Hommes et femmes en ménage statistique : une valse à trois temps , Travail, Genre et Sociétés, Vol. 26, No 2, pp.23-46. Boudon, R., (1969), Analyse secondaire et sondages sociologiques , Cahiers Internationaux de Sociologie, Vol. 47, No 2, pp. 5-34. Dale, A., Arbor, S. et Proctor, M., (1988), Doing Secondary Analysis, Unwin Hyman Ltd, Londres. Dale, A., (1997), Le rôle de l'analyse secondaire dans la recherche en sciences sociales , Sociétés contemporaines, Vol. 14-15, no 3, pp. 7-21. Gollac, M., (1997), Des chires insensés ? Pourquoi et comment on donne un sens aux données , Revue française de sociologie, Vol. 38, No 1, pp. 1-36. Meulders, D., (2011), Lorsque seul le ménage compte Variations autour de la pauvreté des ménages et des individus en Europe, Travail, genre et sociétés, Vol. 26, No 2, pp. 85-104. Mochmann, E., Vardigan, M., (2011), L'analyse secondaire de données et la documentation pour leur diusion , in Chenu, A. (dir.), La France dans les comparaisons internationales, Paris, Presses de Sciences Po, pp. 173-181. Saint Pol (de), T., (2003), Le sociologue et l'apprenti sorcier : de l'usage raisonné des chires , Terrains & travaux, Vol. 1, No 4, pp. 215-228. Verger, D., (1984), Équipement du foyer ou équipement dans le foyer ? , Économie et statistique, Vol. 168, pp. 77-92. Questionnaires et données de seconde main 7 / 48 Introduction De quelques avantages De quatre écueils Conclusion Sommaire Introduction De quelques avantages du recours à l'analyse secondaire des données Éléments de contextualisation de l'analyse secondaire De quelques avantages de l'analyse secondaire des données De quatre écueils posés par l'analyse secondaire des données Conclusion Questionnaires et données de seconde main 8 / 48 Introduction De quelques avantages De quatre écueils Conclusion Sommaire Introduction Présentation de la thèse Références bibliographiques De quelques avantages du recours à l'analyse secondaire des données Éléments de contextualisation de l'analyse secondaire De quelques avantages de l'analyse secondaire des données De quatre écueils posés par l'analyse secondaire des données Des données doublement inconnues Des données superues Des données biscornues Des données peu congrues Conclusion Questionnaires et données de seconde main 9 / 48 Introduction De quelques avantages De quatre écueils Conclusion Quelques éléments historiques sur l'analyse secondaire des données (1) Une proposition de dénition L'analyse secondaire est dénie comme étant la ré-exploitation de données d'enquêtes dont les résultats prolongent et se distinguent de l'analyse originaire, issue du recueil des données. Un large éventail de sources de données peut être soumis à l'analyse secondaire, depuis les données issues d'un entretien enregistré jusqu'aux agrégats staistiques de l'économie. [Dale, 1993 ; p. 7] Un essor dans les années 1960 I I I I Progrès des puissances de calcul Accès facilité aux méthodes d'analyse Rôle de diusion de la statistique nationale Accès des chercheurs à des données réalisées sur vaste échantillon Questionnaires et données de seconde main 10 / 48 Introduction De quelques avantages De quatre écueils Conclusion Quelques éléments historiques sur l'analyse secondaire des données (2) Des origines lointaines I I I I I Développement ancien de l'analyse secondaire avec l'École de Chicago Diusion de l'ordinateur dans les années 1950 1. Données stockées et transportables facilement 2. Données susceptibles d'être anonymisées aisément Développement de logiciels (SPSS dès les années 1960) Création de centres d'archivage de données 1. Roper Public Opinion Research Center en 1959 2. Inter-university Consortium for Political and Social Research en 1967 Rôle central des enquêtes des instituts nationaux de statistiques 1. Enquêtes représentatives à l'échelle nationale 2. Enquêtes conduites par entretien 3. Enquêtes réalisées par des professionnels de l'échantillonnage Questionnaires et données de seconde main 11 / 48 Introduction De quelques avantages De quatre écueils Conclusion Sommaire Introduction Présentation de la thèse Références bibliographiques De quelques avantages du recours à l'analyse secondaire des données Éléments de contextualisation de l'analyse secondaire De quelques avantages de l'analyse secondaire des données De quatre écueils posés par l'analyse secondaire des données Des données doublement inconnues Des données superues Des données biscornues Des données peu congrues Conclusion Questionnaires et données de seconde main 12 / 48 Introduction De quelques avantages De quatre écueils Conclusion De quelques avantages de l'analyse secondaire des données dans le cas des grandes enquêtes nationales I I I I I I I I Des données disponibles (presque) immédiatement Des données disponibles gratuitement ou à un prix très bas Des données permettant d'extrapoler à l'ensemble de la population Des données permettant une certaine démocratisation de la recherche Des données permettant de faire des comparaisons historiques Des données permettant d'obtenir des données relatives à des sous-populations pour lesquelles il n'existe pas d'échantillonnage évident Des données permettant une enquête de cadrage Des données permettant des analyses à plusieurs échelles : ménages et individus Questionnaires et données de seconde main 13 / 48 Introduction De quelques avantages De quatre écueils Conclusion Sommaire Introduction De quelques avantages du recours à l'analyse secondaire des données De quatre écueils posés par l'analyse secondaire des données Des données doublement inconnues Des données superues Des données biscornues Des données peu congrues Conclusion Questionnaires et données de seconde main 14 / 48 Introduction De quelques avantages De quatre écueils Conclusion Sommaire Introduction Présentation de la thèse Références bibliographiques De quelques avantages du recours à l'analyse secondaire des données Éléments de contextualisation de l'analyse secondaire De quelques avantages de l'analyse secondaire des données De quatre écueils posés par l'analyse secondaire des données Des données doublement inconnues Des données superues Des données biscornues Des données peu congrues Conclusion Questionnaires et données de seconde main 15 / 48 Introduction De quelques avantages De quatre écueils Conclusion Des données construites sous contraintes Des arbitrages complexes I Concepteurs de l'enquête doivent arbitrer entre... 1. ... l'exhaustivité du questionnaire... 2. ... et le coût de l'enquête... I ... sous diérentes contraintes comme : 1. 2. 3. 4. La comparabilité avec les séries précédentes Les défauts des séries précédentes Les desiderata des chercheurs, experts et commanditaires Les collaborations disponibles Questionnaires et données de seconde main 16 / 48 Introduction De quelques avantages De quatre écueils Conclusion Des données absentes ou pas toujours présentes I Des données non récoltées : des questions qui n'ont pas été posées mais que vous auriez aimé poser 1. Fréquence de lavage de la voiture 2. Couleur du véhicule I Des données non diusées : des questions qui ont été posées mais qui ne sont pas diusées au chercheur 1. Modèle précis du véhicule 2. Commune de résidence et de travail des individus I Des données pas toujours présentes : des questions qui ont été posées parfois mais pas à toutes les dates d'enquête 1. Gamme du véhicule 2. Kilométrage parcouru Questionnaires et données de seconde main 17 / 48 Introduction De quelques avantages De quatre écueils Conclusion Un problème d'absence de données - Exemple (1) Le coût budgétaire de l'automobile I I I I Question de recherche : L'automobilité permet-elle une mobilité de masse dont les coûts seraient semblables au sein de l'espace social ? Opérationnalisation : Comment évolue le coût de revient kilométrique de l'automobile parmi les diérents ménages ? Variables nécessaires : Kilométrage annuel, coût annuel de l'automobile, dépenses budgétaires totales Données présentes uniquement pour l'enquête Budget de famille 1984 Une solution : reconstruire les données par simulation I I I I En 2005, présence des coûts annuels de l'automobile et des dépenses budgétaires totales... ... et absence de la variable de kilométrage Extraction des variables d'ancienneté, d'âge et de puissance du véhicule... ... et simulation du kilométrage annuel Questionnaires et données de seconde main 18 / 48 Introduction De quelques avantages De quatre écueils Conclusion Un problème d'absence de données - Exemple (2) Modélisation du kilométrage parcouru Pour modéliser la distance parcourue par le parc automobile des ménages pour l'enquête Budget de famille de 2006, nous avons utilisé les données de l'Enquête Nationale Transports et Déplacements de 2008. Nous avons estimé les paramètres de la régression linéaire suivante, pour chacun des véhicules des deux types de motorisation (gazole - G - ou essence - E) : Kilométrage2008E = β0,E + β1,E AgeVéhiculeE + µE Kilométrage2008G = β0,G + β1,G AgeVéhiculeG + µG Questionnaires et données de seconde main 19 / 48 Introduction De quelques avantages De quatre écueils Conclusion Un problème d'absence de données - Exemple (3) Tableau 1: Médiane de l'eort budgétaire de l'automobilité selon la P.C.S. du conducteur en 1984 et en 2006. Agriculteur Artisan, commerçant Profession libérale, chef d'entreprise Cadres du public Cadres du privé Professions intermédiaires du public Professions intermédiaires du privé Techniciens, contremaîtres Employés qualiés Employés non qualiés Ouvriers qualiés Ouvriers non qualiés 1984 1,12 0,85 0,48 0,49 0,51 0,73 0,65 0,72 0,96 1,12 0,91 1,17 2006 0,82 0,72 0,43 0,63 0,55 0,76 0,73 0,69 0,8 0,91 0,78 1,01 Source : Enquêtes Budget de famille 1984 et 2006. Champ : Ensemble des ménages motorisés composés d'au moins un actif. Note de lecture : En 1984, 50% des ménages dont le parc automobile est composé d'une voiture achetée d'occasion, âgée de plus de 8 ans, dépensent plus de 1,11% de leur budget pour parcourir 1000 kilomètres en voiture. Questionnaires et données de seconde main 20 / 48 Introduction De quelques avantages De quatre écueils Conclusion Des données dont la construction est inconnue Plusieurs inconnues 1. Quelle est la qualité des données récoltées ? I I I Quels ménages faut-il exclure de l'analyse ? Quels ménages ont été sous-représentés dans l'enquête ? Comment utiliser les coecients de pondération ? 2. Quelles sont les conditions de la passation ? I I Quelles ont été les consignes données aux enquêteurs ? Comment la passation s'est-elle déroulée ? Questionnaires et données de seconde main 21 / 48 Introduction De quelques avantages De quatre écueils Conclusion Redresser des échantillons biaisés : les coecients de pondération Les coecients de pondération : une boîte noire nécessaire I I I I Bases de données fournissent une variable de pondération C'est un poids permettant de passer de la base de données sur échantillon à la population totale Dans des bases complexes, existence de plusieurs variables de pondération Pour l'ENTD : 1. Variable de pondération pour la base de tronc commun des ménages 2. Variable de pondération pour la base des longs trajets 3. Variable de pondération pour la mobilité quotidienne Des variables porteuses de biais I I I I Une construction complexe qu'il est dicile d'analyser Un problème général : une sous-représentation systématique des individus les moins lettrés compensée par le redressement lié à la pondération Un problème spécique : cf. enquête Emploi du Temps où les lundis sont sous-représentés Un examen attentif de la construction des coecients de pondération ainsi que des tris à plat sur les variables d'intérêt Questionnaires et données de seconde main 22 / 48 Introduction De quelques avantages De quatre écueils Conclusion Les conditions de la passation : une connaissance nécessairement partielle Les biais possibles et les documents nécessaires I Les résultats d'une enquête sont sensibles aux conditions de sa passation : 1. Contexte de l'entretien 2. Eet-enquêteur 3. Protocole d'enquête I Pour appréhender de tels eets, il faut s'intéresser... 1. ... aux consignes destinées à l'enquêteur 2. ... au protocole d'enquête 3. ... aux variables renseignées par l'enquêteur concernant l'accueil et la qualité des données 4. ... aux comptes-rendus de passation 5. ... aux consignes de saisie Questionnaires et données de seconde main 23 / 48 Introduction De quelques avantages De quatre écueils Conclusion Sommaire Introduction Présentation de la thèse Références bibliographiques De quelques avantages du recours à l'analyse secondaire des données Éléments de contextualisation de l'analyse secondaire De quelques avantages de l'analyse secondaire des données De quatre écueils posés par l'analyse secondaire des données Des données doublement inconnues Des données superues Des données biscornues Des données peu congrues Conclusion Questionnaires et données de seconde main 24 / 48 Introduction De quelques avantages De quatre écueils Conclusion Des données en surnombre Des traitements potentiellement innis I Exemple de l'Enquête Nationale Transport et Déplacements 1. 19 bases de données diérentes 2. Plus de 1500 variables 3. Des appariements et des traitements très nombreux Extraire les données pertinentes I Construire des extractions des bases de données 1. 2. 3. 4. I I I Recenser les variables d'intérêt pour une enquête Les identier pour les autres dates d'enquête Utiliser une nomenclature homogène pour chaque variable à chaque date Fusionner les bases de données Construire plusieurs bases de données mêlant les diérentes dates d'enquête Construire autant de bases de données que de questions de recherche Dictionnaire des codes de l'enquête Transports et Télécommunication 1993 Questionnaires et données de seconde main 25 / 48 Introduction De quelques avantages De quatre écueils Conclusion Sommaire Introduction Présentation de la thèse Références bibliographiques De quelques avantages du recours à l'analyse secondaire des données Éléments de contextualisation de l'analyse secondaire De quelques avantages de l'analyse secondaire des données De quatre écueils posés par l'analyse secondaire des données Des données doublement inconnues Des données superues Des données biscornues Des données peu congrues Conclusion Questionnaires et données de seconde main 26 / 48 Introduction De quelques avantages De quatre écueils Conclusion Des structures de bases de données complexes Non pas une mais des bases de données I I Enquête souvent constituée d'un ensemble de bases de données 1. 2. 3. 4. 5. Tronc commun des ménages Tronc commun des individus Carnets (budget, emploi du temps, ...) Équipements Données reconstruites 1. 2. 3. 4. Quel est le questionnaire à l'origine de la base ? Quelle est l'unité d'analyse de la base ? S'agit-il de données brutes ou reconstruites ? Quelles sont les clés d'appariement entre les diérentes bases ? Nécessité de bien comprendre comment sont construites ces bases : Questionnaires et données de seconde main 27 / 48 Introduction De quelques avantages De quatre écueils Conclusion Une architecture souvent complexe. Exemple 1 : l'ENTD Questionnaires et données de seconde main 28 / 48 Introduction De quelques avantages De quatre écueils Conclusion Une architecture souvent complexe. Exemple 2 : l'enquête Budget de Famille Les diérentes tables de l'enquête BdF Questionnaires et données de seconde main 29 / 48 Introduction De quelques avantages De quatre écueils Conclusion Ménages, individus et autres unités de sondage Une valse à trois temps [Amossé, 2011] I Les notions d'individus et de ménages ne sont pas si évidentes : 1. Jusque dans les années 1970, le chef de ménage tout visible 2. Depuis les années 1970, un retour à l'échelle de l'individu 3. Enn, une articulation ménages et individus Le choix de l'échelle d'observation I Pour étudier un taux d'équipement : 1. Faut-il utiliser la base des ménages ? 2. Faut-il utiliser la base des individus ? 3. Faut-il utiliser la base du parc des automobiles ? I Équipement du ménage ou équipement dans le ménage [Verger, 1984] ? Questionnaires et données de seconde main 30 / 48 Figure 1: Individualisation et multipossession, schéma extrait de D. Verger, 1984 Figure 2: Où est l'automobile ? Schéma extrait de D. Verger, 1984 Introduction De quelques avantages De quatre écueils Conclusion Cas No 1 : L'espace social des modèles automobiles Les modèles d'automobile sont-ils de moins en moins distinctifs ? I Des choix techniques diérents 1. Appariement du chef de ménage et de l'automobile principale du ménage [Boltanski, 1975] 2. Appariement de la personne de référence et de l'automobile pour les ménages mono-équipés [Coulangeon, Petev, 2011] 3. Appariement de la personne de référence et du véhicule de rang 1 pour tous les ménages [Prieto, 2006] I Un autre choix possible : 1. À partir du chier des véhicules, retenir le conducteur principal 2. Apparier le conducteur principal à la base de données du tronc commun des individus 3. Obtention d'une base de données retenant tous les véhicules et tous les conducteurs principaux 4. Que faire des véhicules partagés ? Questionnaires et données de seconde main 33 / 48 Introduction De quelques avantages De quatre écueils Conclusion Cas No 2 : La diusion de l'accès à l'automobile chez les femmes Questions de recherche I I I I Quand a eu lieu la diusion de l'automobile auprès des femmes ? Comment caractériser une telle diusion ? Qui sont les femmes qui ont tout d'abord pris le volant ? Qui sont les femmes qui restent à l'écart de l'automobile ? Des travaux enthousiastes... à l'échelle inadaptée I I I I Au sein d'un ménage équipé, les individus le composant peuvent avoir un accès bien diérencié à l'automobile 1. L'un peut ne pas avoir le permis 2. Et, s'il l'a, il peut n'être qu'occasionnellement conducteur Travaux généralement réalisés à l'échelle du ménage D'où la conclusion (hâtive) d'universalisation de l'automobile Enjeu important de mesure des inégalités : 1. Inégalités de niveau de vie moindres pour les femmes lorsque l'on mesure à l'échelle du ménage [Meulders, 2011] 2. En étudiant le ménage, on occulte les inégalités de genre [Amossé, 2011] Questionnaires et données de seconde main 34 / 48 Figure 3: Possibilité de conduire pour des personnes de plus de 18 ans selon leur sexe et leur lien avec le chef de ménage. Figure 4: Dénition de l'accès au volant : puis-je, ou non, conduire ma propre automobile ? Figure 5: Accès au volant selon le sexe des individus de 1981 à 2008 Source : Enquêtes Transports 1981, 1993-4 et 2008 Champ : Ensemble des adultes. Introduction De quelques avantages De quatre écueils Conclusion Sommaire Introduction Présentation de la thèse Références bibliographiques De quelques avantages du recours à l'analyse secondaire des données Éléments de contextualisation de l'analyse secondaire De quelques avantages de l'analyse secondaire des données De quatre écueils posés par l'analyse secondaire des données Des données doublement inconnues Des données superues Des données biscornues Des données peu congrues Conclusion Questionnaires et données de seconde main 38 / 48 Introduction De quelques avantages De quatre écueils Conclusion Des données dicilement comparables Des causes diverses 1. Modication des questions 2. Modication des modalités 3. Modication du protocole d'enquête Des réponses adaptées I I Modications des modalités : Demoli, Y., (2014), Les femmes prennent le volant. Diusion du permis et usage de l'automobile auprès des femmes au cours du XXe siècle , Travail, Genre et Sociétés, Vol. 32, No 2, pp. 119-140. Modications du protocole : Saint Pol (de), T., (2003), Le sociologue et l'apprenti sorcier : de l'usage raisonné des chires , Terrains & travaux, Vol. 1, No 4, pp. 215-228. Questionnaires et données de seconde main 39 / 48 Introduction De quelques avantages De quatre écueils Conclusion Des modalités modiées Question de recherche et position du problème I I I I Question de recherche : Les usages de l'automobile convergent-ils entre les hommes et les femmes ? Opérationnalisation : Quels sont les motifs qui président aux diérents trajets des unes et des autres ? Données nécessaires : Motifs des trajets automobiles des hommes et des femmes pour les enquêtes 1981, 1993 et 2008 Problèmes : Les motifs ne sont pas du tout détaillés de la même façon, ni appréhendés à la même échelle Deux problèmes I I Des nomenclatures très diérentes 1. Des modalités au nombre variable 2. Des modalités pas toujours présentes 3. Prendre les modalités d'une année comme point de référence Des échelles diverses 1. L'échelle du trajet 2. L'échelle du déplacement Questionnaires et données de seconde main 40 / 48 Introduction De quelques avantages De quatre écueils Conclusion Les modalités des motifs de déplacement en 1981 Questionnaires et données de seconde main 41 / 48 Introduction De quelques avantages De quatre écueils Conclusion Les modalités des motifs de déplacement en 1993 Questionnaires et données de seconde main 42 / 48 Introduction De quelques avantages De quatre écueils Conclusion Les modalités des motifs de déplacement en 2008 Tableau 2: Typologie des motifs des diérents déplacements pour l'Enquête Nationale Transports et Déplacements Loisirs Activité associative Centre de loisirs Manger hors du domicile Visiter un monument Voir un spectacle Faire du sport Sociabilité Visite à des parents Visite à des amis Se promener Vacances Résidence secondaire Questionnaires et données de seconde main Travail Travailler dans son lieu xe Travailler hors du lieu xe Stage, conférence... Tournées professionnelles Autres motifs professionnels Aller à l'école Travail domestique Faire garder un enfant Grande surface Commerce de proximité Soins médicaux ou personnels Démarche administrative Accompagner qq'un à la gare, au bus... Accompagner qq'un ailleurs Chercher qq'un à la gare, au bus... Chercher qq'un ailleurs... 43 / 48 Figure 6: Répartition du sexe du conducteur selon le type de trajets entre 1981 et 2008 Source : Enquêtes Transports 1981, 1993-4 et 2008. Champ : Ensemble des trajets réalisés par des conducteurs actifs. Note de lecture : Sur 100 trajets réalisés pour un motif de loisirs en 1981, 81 le sont par des hommes au volant. Introduction De quelques avantages De quatre écueils Conclusion Des protocoles modiés : deux exemples L'enquête Emploi du temps I I I I Série des enquêtes 1974, 1986, 1998 et 2010 Rupture en 1998 avec un pas de 10 minutes, au lieu de 5 Activités les plus courtes peuvent disparaître au sein des activités les plus longues Perte importante pour le travail domestique très fractionné L'Enquête Nationale Transports et Déplacements I I I I Étude des déplacements de longue distance (80/100 km) En 1981 et 1993, recensement de tels voyages pour les trois derniers mois En 2008, recensement de ces voyages (au maximum) au cours des quatre dernières semaines Comparabilité complexe et nécessité de construire de nouveaux indicateurs pondérés Questionnaires et données de seconde main 45 / 48 Introduction De quelques avantages De quatre écueils Conclusion Sommaire Introduction De quelques avantages du recours à l'analyse secondaire des données De quatre écueils posés par l'analyse secondaire des données Conclusion Questionnaires et données de seconde main 46 / 48 Introduction De quelques avantages De quatre écueils Conclusion Des dicultés diverses Le sociologue en apprenti sorcier ? 1. 2. 3. 4. Des données inconnues Des données superues Des données biscornues Des données peu congrues Des dicultés récurrentes I I Une mise à disposition potentiellement longue Un archivage de la documentation inégal 1. Pas de nancement dédié à la documentation 2. Un temps souvent négligé dans la conception de l'enquête 3. Des formats parfois peu commodes I I Des données parfois sous embargo Une familiarisation longue aux données Questionnaires et données de seconde main 47 / 48 Introduction De quelques avantages De quatre écueils Conclusion Quelques conseils en guise de conclusion Conseils généraux I I I I I I I I Lire la documentation : ne pas se jeter sur les données ! Ne pas négliger les documents techniques Retrouver les questionnaires destinées aux enquêtés et les remplir Se renseigner sur les consignes d'entretien Se renseigner sur les consignes de codage Ne pas hésiter à contacter les responsables d'enquête Ne pas hésiter à contacter d'autres chercheurs travaillant sur les mêmes données Ne pas hésiter à explorer les archives de l'INSEE Conseils spéciques I I I I I I Ne pas hésiter à se créer des dictionnaires des codes personnels Renseigner ses propres traitements et ses opérations Ne pas hésiter en annexe à soulever les problèmes rencontrés Faire autant de tables que de questions de recherches Faire des extractions des diérentes tables Soigner tout particulièrement les fusions de tables Questionnaires et données de seconde main 48 / 48