Le recensement rénové de la population : résultats statistiques

Transcription

Le recensement rénové de la population : résultats statistiques
/Charte7
Groupe Statistique et Société
Le recensement rénové de la population : résultats statistiques
Séminaire Insee-SFdS
Jeudi 19 mai 2011
Compte rendu
La Société française de statistique (SFdS) et l'Insee ont organisé le 19 mai 2011 un séminaire
sur les résultats statistiques du recensement de la population en France, rassemblant plus
de cent participants d’horizons divers, pour la plupart chercheurs, enseignants et chargés
d’études. Au delà de l’établissement des populations légales, les recensements ont toujours
été un instrument essentiel de connaissance des structures démographiques et sociales du
pays, en particulier à niveau géographique fin. Depuis près de deux ans, des résultats
structurels du nouveau recensement français ont été mis à disposition des utilisateurs, et
déjà suffisamment d’études ont été conduites, dans des organismes très divers, pour qu’il
soit possible de confronter utilement les expériences. L’objectif du séminaire était
d'examiner l'adéquation des résultats aux besoins des utilisateurs de diverses spécialités et
de divers horizons professionnels, et si nécessaire de dégager des pistes d'amélioration.
Ce compte rendu résume les interventions des orateurs, dans l’ordre du programme, en
renvoyant pour plus de détails aux supports qu’ils ont utilisés. En outre, il retrace
quelques-unes des interventions émanant de la salle.
A - Ouverture
En ouverture du séminaire, Michel-Henri Gensbittel, représentant la Société française de
statistique, replace cette séance dans la lignée des rencontres organisées conjointement par
l’Insee et la SFdS sur le recensement de la population. Trois séminaires ont été organisés
pendant la préparation du nouveau système, en 2000, 2001 et 2002 : ils ont permis
d’informer la communauté scientifique sur la nouvelle méthode, et de recueillir ses
réactions1. Après cinq enquêtes annuelles de recensement, un nouveau séminaire s’est tenu
en mai 2009, essentiellement consacré aux résultats de population légale2. Aujourd’hui, ce
sont les résultats statistiques qui vont être au cœur des échanges entre utilisateurs et
producteurs des données.
Michel-Henri Gensbittel passe la parole au sénateur Jean-Claude Frécon, président
de la Commission nationale d’évaluation du recensement. Celui-ci explique que cette
commission de trente trois membres est chargée de représenter les principales parties
1
2
On pourra consulter le Journal de la SFdS volumes 140, n°4, 142, n°3 et 143 n°3-4
Quatre exposés sont téléchargeables sur le site de la SFdS sfds.asso.fr
prenantes du recensement, au premier rang desquels les collectivités locales, dans le cadre
du CNIS, et de favoriser le dialogue avec de l’Insee. Elle se réunit plusieurs fois par an
depuis 2004 et veille de près au bon déroulement des collectes. Elle s’intéresse aussi aux
utilisations des résultats, et à ce titre sera attentive à tous les problèmes qui pourront être
soulevés durant ce séminaire.
B - Exposé introductif
Bilan et perspectives de la rénovation du recensement français, par François
Clanché, chef du département de la démographie de l’Insee.
François Clanché souligne d’abord que le pari du nouveau recensement a été tenu :
les résultats sont maintenant disponibles chaque année ; ils sont conformes à ce qui était
attendu au départ, et les utilisations se développent progressivement. C’est une réussite
globale, qui était loin d’être acquise au départ. Il met en lumière ensuite quelques motifs
d’insatisfaction ou d’inquiétude : certaines variables n’ont encore pas la qualité souhaitée
(immigration récente, nombre d’enfants de 0 à 3 ans) ; l’expertise des données tirées des
enquêtes annuelles prises séparément reste à réaliser ; la comparaison de deux nouveaux
recensements entre eux, qui sera possible à partir des résultats 2011, reste à préparer. Par
ailleurs, le coût pour l’Etat du recensement dépasse 50 M€ par an et augmente chaque
année avec la population (mécaniquement, un accroissement de 0,7 % de la population
augmente de 200 000 € les dépenses de recensement) ; simultanément, les charges
méthodologiques restent à un niveau élevé, du fait des nombreux aléas qui interdisent de
figer les chaînes de production et de calcul (franchissements du seuil de 10 000 habitants,
rénovation de grands ensembles, transformation de communautés, etc.). Dans le contexte
budgétaire que connaît l’Insee, comme les communes, les moyens financiers et humains
risquent de manquer si des progrès de productivité ne sont pas réalisés. C’est pourquoi
plusieurs projets d’amélioration du recensement dans un avenir proche ou à moyen
terme sont en cours de finalisation ou à l’étude. François Clanché en cite trois : la collecte
par Internet, prévue à partir de 2013 ; la modernisation de la gestion du Répertoire des
immeubles localisés (RIL), dans le même calendrier; et la création d’un répertoire statistique
de logements, à une échéance plus lointaine. Ce dernier projet, outre ses vertus propres,
permettrait de proposer ultérieurement aux décideurs publics des voies d’économies
importantes (diminution de la taille des échantillons, collecte par voie postale). Pour être
complet sur les perspectives du recensement, il faut en outre rappeler la réflexion entamée
cette année par le Conseil national de l’information statistique (CNIS) à propos du
questionnaire du recensement, qui pourrait évoluer quelque peu en 2014.
[cf. power-point de son exposé]
C - Témoignages d’utilisateurs
Premier témoignage : Les usages des données du recensement à l'Institut
d’aménagement et d’urbanisme d’Ile-de-France : exemples, enseignements et pistes pour
l'avenir. Philippe Louchart, démographe à l'IAU-IdF.
Philippe Louchart présente trois exemples d’utilisations des données du
recensement, seules ou conjointement avec d’autres données : « Migrations et mobilité »,
« Dynamique démographique et immobilière », « Densité de population sur les espaces
bâtis ». Il se félicite de la mise à disposition de fichiers-détail du recensement, qu’il a
beaucoup utilisés, mais il en souligne les limites ; en particulier, il donne une liste de
grandeurs qu’on ne peut pas reconstituer à partir de ces fichiers-détail (par exemple :
l’effectif des émigrants internes quittant l’Ile-de-France pour d’autres régions par sexe et
âge détaillé ; les lieux de travail des ex-Franciliens ayant quitté l’Ile-de-France pour
s’installer dans les départements limitrophes ; le lieu de travail comparé des couples biactifs). Il fait des propositions d’extension pour ces fichiers. Lorsque ces limites étaient
touchées, l’IAU s’est adressé à l’Insee, dont Philippe Louchart salue les qualités d’écoute,
tout en constatant que, faute de moyens, ses suggestions n’ont pas toujours été suivies
d’effet. Dans certains cas, l’IAU a pu construire avec l’Insee une information adaptée dans
le cadre de partenariats (« service spécifique ») : mais cette possibilité n’est pas offerte à
tous les organismes et le serait-elle que l’Insee ne pourrait pas répondre à tous. Philippe
Louchart en souligne la lourdeur, pour les deux partenaires, et s’enquiert de sa pérennité.
Il évoque ensuite des problèmes statistiques touchant à la dynamique d’évolution. Les
comparaisons dans le temps doivent toujours se faire avec le recensement de 1999, jusqu’à
ce qu’on dispose de dix années de collecte du nouveau système (résultats datés 2011) :
quelle sera alors la significativité des évolutions sur cinq ans ? Il cite aussi le problème des
ajustements statistiques opérés par l’Insee en 1999 et 2006, qui ont porté seulement sur le
chiffre global de population France entière. Pour l’Ile-de-France, une estimation de
l’ajustement 1999 global a pu être réalisée, mais ce n’est pas le cas pour les données
détaillées, ni pour les autres régions. Rétablir une cohérence entre stocks et flux est
nécessaire pour écarter l’hypothèse selon laquelle des biais systématiques auraient été
induits par la nouvelle méthode de recensement. S’agissant de l’évolution du parc de
logements, Philippe Louchart regrette de ne plus pouvoir en dresser le bilan quantitatif à
partir du seul recensement et prend comme exemple un arrondissement de Paris : il appuie
donc fortement le projet de création d’un fichier statistique des logements. En ce qui
concerne la création de données à niveau géographique très fin, il présente les résultats
obtenus en croisant le recensement avec d’autres sources (comme le « Mode d’occupation
des sols » MOS), par des « règles de trois intelligentes » qui utilisent parfois encore
l’information à l’îlot du recensement de 1999.
[cf. pdf de son exposé]
Deuxième témoignage : Les géographes et les données localisées, des RP au RRP, par
Catherine Rhein, directeur de recherches CNRS, Unité mixte de recherche GéographieCités.
Catherine Rhein commence par louer la grande richesse et la qualité des données de
recensement mises à disposition par l’Insee en France, par comparaison à d’autres pays
voisins, qu’il s’agisse de tableaux ou de fichiers-détail. Elle souligne la valeur du service
rendu par le réseau Quetelet – Centre Maurice Halbwachs - pour faciliter la compréhension
de ce qui est disponible et l’accès aux données. Celles-ci sont utilisées par les géographes
dans l’enseignement, qui s’appuie de plus en plus sur la pratique des diagnostics
territoriaux, et dans la recherche. Cependant, les géographes ont besoin de données plus
détaillées à niveau géographique fin (canton, IRIS) que celles qui sont actuellement
disponibles. Catherine Rhein cite trois exemples : les structures par catégorie socioprofessionnelle (en 24 ou 42 postes, au lieu de 8 actuellement) ; les répartitions par
nationalité ou pays de naissance pour tous les membres d’un ménage, de façon à pouvoir
décrire les populations de jeunes d’origine étrangère ; la période d’achèvement des
immeubles. Elle illustre son propos par des exemples de cartes tirées de recherches récentes
et utilisant des séries temporelles sur les anciens recensements qu’il faudrait pouvoir
prolonger. Par ailleurs, dans la perspective d’un développement de la formation des
étudiants à l’utilisation correcte et lucide de données statistiques, elle appelle de ses vœux
l’émergence d’une « ingénierie des données en sciences de l'homme et de la société ». Cette
ingénierie des données serait incluse dans la formation des étudiants en géographie, pour
que les cursus puissent couvrir toutes les dimensions de la question : cadres juridique et
déontologique, procédures du recensement, méthodes et outils de traitement des données,
définition des variables (incluant leur historique), cartographie, intégration dans des
systèmes d’information géographique (SIG). A propos de ce dernier point, elle rappelle que
n’est pas encore résolu le problème de la mise à disposition des chercheurs du fonds de
carte des IRIS, sous une forme qu’ils puissent réutiliser.
[cf. power-point de son exposé]
Troisième témoignage : Les utilisations par les collectivités locales, par
Marie-Hélène Boulidard, démographe territoriale.
Marie-Hélène Boulidard illustre l’utilisation du recensement dans les collectivités
locales en s’appuyant sur de nombreux exemples : l’alimentation d’un observatoire local, la
production d’un atlas, le montage d’une exposition, et surtout la participation (au stade du
diagnostic ou à celui du suivi) à de nombreuses études : programme local de l’habitat,
diagnostic social des quartiers, sectorisation scolaire, accueil de la petite enfance, etc. Elle
souligne le rôle des données de recensement, à côté d’autres sources, comme outil de
cadrage et d’évaluation des besoins potentiels. Dans certains cas, une sous-population
particulière peut utilement être comparée à une population de référence ; dans d’autres cas,
le recensement fournit les ratios nécessaires à des exercices de simulation. Toutes ces
utilisations dans des contextes décisionnels nécessitent la prise en compte des limites de la
source. Ceci se fait en particulier en tenant compte de la précision des données issues des
sondages. Marie-Hélène Boulidard présente par exemple un cas d’utilisation de données
du recensement de 2007 à l’IRIS dans lequel, compte tenu des intervalles de confiance, une
différence avec la moyenne communale ne peut être valablement affirmée que dans un IRIS
sur deux. C’est seulement au prix d’efforts d’analyse et de présentation suffisants que le
recensement, complété par d’autres sources, pourra rester une pièce maîtresse de
l’observation locale.
[cf. pdf de son exposé]
D - Disponibilité des données
Le RP : tabulations et secret statistique, que faire ? par Alexandre Kych, Centre
Maurice Halbwachs - Réseau Quetelet
Alexandre Kych décrit la contradiction dans laquelle il se débat, en tant
qu’intermédiaire entre les chercheurs et l’Insee, pour l’accès à des données détaillées des
recensements. D’un côté, le recours à des tabulations sur mesure est devenu de plus en plus
nécessaire aux chercheurs. En effet, ceux-ci ne trouvent pas toujours ce dont ils ont besoin
dans les produits standard diffusés par l’Insee. Les collections de tableaux s’appuient sur
des versions agrégées des nomenclatures. Les fichiers-détail qui contiennent des
localisations précises (en dessous de la région) ne contiennent pas non plus les versions
détaillées des variables, et ne permettent pas les appariements d’informations entre niveaux
(ménages-individus, par exemple). De l’autre côté, les règles de secret statistique
appliquées aux tabulations sur mesure ont été précisées, de sorte que la plupart des
tableaux à produire pour les chercheurs contiennent un nombre important de cases
masquées pour cause de petit effectif. Face à cette contradiction, Alexandre Kych énumère
les trois solutions qu’il entrevoit : recourir aux nouvelles possibilités ouvertes aux
chercheurs par la modification récente de la loi statistique française – mais ceci impose
actuellement le passage par le centre d’accès sécurisé distant, procédure lourde pour un
chercheur qui a seulement besoin d’un tableau de travail simple ; redéfinir la règle
d’application du secret statistique pour les tabulations sur mesure – mais il est probable que
les mêmes problèmes surgiraient avec une nouvelle règle ; se mettre en capacité d’utiliser
dans un travail statistique des tableaux contenant des « cases masquées » - mais ceci
suppose un investissement méthodologique préalable. Alexandre Kych en appelle à la
communauté statistique pour réaliser un tel investissement.
[cf. power-point de son exposé]
E - Précision des résultats
Deux exposés ont abordé ce thème.
Les calculs de précision dans le recensement rénové, par Gwennaëlle Brilhault,
division Méthodes et traitements des recensements, Insee
Gwennaëlle Brilhault rappelle d’abord la distinction entre l’erreur totale pouvant
affecter les résultats d’un recensement, toutes causes d’erreur confondues, et l’erreur
d’échantillonnage, due à l’introduction de sondages dans la procédure du recensement.
Dans son exposé, elle considère seulement l’erreur d’échantillonnage due au sondage dans
les adresses ni grandes ni nouvelles des communes de 10 000 habitants ou plus3. Depuis le
début des années 2000, des calculs ont été réalisés pour estimer l’ordre de grandeur de cette
erreur à l’aide de simulations dans les fichiers du recensement de 1999. Les résultats
figurent notamment dans le rapport du CNIS de décembre 2005 : « Utilisation des données
produites par le recensement rénové ». Depuis 2009, de nouveaux calculs de précision ont
été effectués en utilisant cette fois les données des cinq collectes 2004-2008. Ces calculs
utilisent les formules théoriques des échantillons équilibrés dues à Jean-Claude Deville et
Yves Tillé (et incorporées dans une macro SAS), sans prendre en compte l’incertitude
introduite par les décalages temporels entre les cinq vagues d’observation. Les résultats
prennent la forme de coefficients de variation disponibles aux niveaux France
métropolitaine, régions, départements, communes et IRIS. Gwennaëlle Brilhault présente
certains de ces coefficients de variation : dans l’ensemble, ils sont moins élevés que ceux qui
figurent dans le rapport de 2005 ; la précision est donc plutôt meilleure que ce qui était
attendu avant les collectes. Les coefficients de variation au niveau de chaque IRIS ont été
calculés pour l’ensemble des variables diffusées : ils figurent, sous forme résumée, dans les
fichiers mis à disposition sur le site Internet de l’Insee.
[cf. power-point de son exposé]
Un participant souhaiterait pouvoir réaliser des calculs de précision analogues sur
des résultats établis par lui-même à partir des fichiers-détail fournis par l’Insee. La question
de la mise à disposition des éléments qui permettraient de tels calculs de précision « à
façon » est donc posée.
Territoires urbains : que peut dire le recensement ? par Jean-Michel Floch,
département de l’action régionale, Insee
Pour donner une idée des possibilités et des limites du nouveau recensement pour la
description finement localisée des territoires urbains, Jean-Michel Floch présente les
résultats d’une simulation qu’il a réalisée à partir de données réelles. Il a constitué à partir
de sources administratives un pseudo-fichier de recensement complet d’une pseudo-ville
de 37 000 habitants composée de dix IRIS, et réalisé sur ce fichier le tirage d’un échantillon
de 40% de logements conformément aux modes de tirage du recensement (équilibrage à
l’IRIS, etc.). Le résultat lui permet d’abord d’examiner et de représenter la qualité de la
répartition locale de l’échantillon, dans des carroyages allant de 100 mètres à 1 000 mètres
de côté. Par exemple, pour 90% des carreaux de côté 500 mètres, la valeur issue de
l’échantillon diffère de moins de 5% de la valeur vraie ; pour 90% des carreaux de côté 100
mètres, la valeur issue de l’échantillon diffère de moins de 40% de la valeur vraie. La
simulation permet aussi de présenter des précisions d’estimation pour diverses variables
selon la dimension des carreaux. Qu’en conclure ? Jean-Michel Floch distingue deux
situations d’utilisation. Lorsqu’il s’agit d’établir un tableau de bord pour un territoire
particulier, il faut être extrêmement prudent. Les territoires délimités sur le terrain par les
acteurs de la politique de la ville sont très hétérogènes en taille, et quelquefois
« pathologiques » vis-à-vis du tirage des adresses ; dans certains cas, la précision
3
Cet exposé n’évalue donc ni la précision du RIL, ni le gain de qualité sur la collecte permis par le nouveau système.
atteignable avec seulement le recensement ne sera pas suffisante et il faudra recourir à des
informations complémentaires. Lorsqu’il s’agit de prendre une vue d’ensemble de
l’agglomération, pour y repérer les zones qui présentent certaines spécificités, le
recensement à lui seul peut y réussir. Une illustration en est fournie par une cartographie
des zones de surreprésentation de la population immigrée dans la pseudo-ville considérée,
d’après les données exhaustives et d’après l’échantillon.
[cf. power-point de son exposé]
F - Qualité des variables
Là aussi, il y a eu deux exposés.
Comment comparer les données du recensement en matière en matière d'activité
et de catégorie socioprofessionnelle avec celles des recensements précédents ? par
Olivier Marchand et Louis Meuric, direction des statistiques démographiques et sociales,
Insee
Le recensement est une source irremplaçable pour traiter des questions d’activité,
d’emploi et de chômage à niveau géographique fin dans des approches structurelles.
Olivier Marchand explique la différence des concepts utilisés dans le nouveau recensement
avec ceux du recensement de 1999 (et des recensements précédents), en les positionnant par
rapport aux concepts du BIT, bien mesurés par l’enquête emploi. Dans le questionnaire du
recensement, la question « Quelle est votre situation ? », qui n’offrait que deux possibilités
de réponse ( « Vous travaillez » ou « Vous ne travaillez pas (ou plus) ») et qui servait de
filtre pour la suite, a été remplacée par un couple de questions qui permettent d’obtenir
une meilleure description des situations mixtes, intermédiaires entre l’emploi et le
chômage, fréquentes chez les 15-25 ans et chez les 55-65 ans. De ce fait, le concept d’emploi
au recensement s’est rapproché du concept d’emploi au sens du BIT, sans y adhérer aussi
complètement que celui de l’enquête emploi. En revanche, le concept de chômage au
recensement n’a guère bougé, et reste très différent (plus large) du concept BIT. Cette
analyse permet de comprendre les différences de résultats entre recensements et enquêtes
emploi, tant en niveau qu’en évolution. Elle permet à Olivier Marchand de formuler des
conseils d’utilisation des différentes sources disponibles en fonction du contexte de l’étude.
[cf. power-point de son exposé]
Louis Meuric prolonge l’analyse d’Olivier Marchand à propos de la variable « catégorie
socio-professionnelle ». Les résultats tirés de cette variable sont affectés par la modification
du concept d’emploi. Au recensement de 2007, environ 1 500 000 personnes qui ne se
classent pas spontanément « en emploi » sont réintégrés dans l’emploi parce qu’elles
déclarent travailler à la deuxième question-filtre ; d’après les estimations de Louis Meuric,
le nouveau questionnement entraînerait pour cette raison un supplément de croissance
d’emploi de 500 000 entre 1999 et 2007. Si on déduit les étudiants ayant un emploi et les
retraités ayant un emploi, ce « saut statistique » est réduit de beaucoup. La variable
« catégorie socio-professionnelle » est de plus affectée par deux autres changements : un
changement de nomenclature, la « PCS2003 » ayant succédé à la « PCS1982 » ; et un
changement d’outil de codification (fichier d’apprentissage rénové en 2008). L’emploi
actuel aux RP99 et RP2007 a été recodé en PCS2003 avec quasiment le même outil SICORE
2008 ; les deux fichiers double-codés correspondants ont été diffusés.
Louis Meuric présente l’incidence de ces différents changements sur l’évolution de la
structure de la population active par catégorie socio-professionnelle : par exemple, la part
des employés qui baisse de 0,46 point en données brutes baisserait de 0,9 point après
correction.
[cf. power-point de son exposé]
En réponse à une question, il est précisé que le code permettant de distinguer, parmi les
actifs ayant un emploi, ceux qui ne se déclarent tels qu’en réponse à la seconde question
(code « Doublact ») sera prochainement inclus dans le fichier-détail diffusé par l’Insee. Ce
code figure aussi dans le fichier double-codé du RP2007, ce qui rend possible les études sur
évolutions 99-2007 de structures de PCS pour les actifs occupés.
Ménages et familles : le recensement et les autres sources de données, par Laurent
Toulemon, directeur de recherches, Ined
De plus en plus de personnes partagent leur temps entre plusieurs logements. Or, au
recensement, chaque personne est prise en considération dans un logement et un seul.
Laurent Toulemon explore les conséquences de cette convention, qu’il reconnait comme
nécessaire, sur les résultats du recensement quant au nombre de ménages et de familles,
répartis par taille ou par type de composition. Pour ce faire, il utilise comme source de
comparaison les « tableaux de composition du ménage » des échantillons de nombreuses
enquêtes auprès des ménages de l’Insee, dans lesquels il est possible de repérer les
individus qui ont un autre logement habituel que celui sur lequel porte l’enquête. D’après
ces tableaux de composition, 4% des habitants de France seraient des « multi-résidents », et
ce phénomène toucherait 11% des logements. Grâce à la comparaison des deux sources, il
met en perspective trois indicateurs : le pourcentage d’adultes vivant en couple, pour
lequel les enquêtes révèlent l’importance des cas de couples non cohabitants ou
partiellement cohabitants (avec un important flou de définition du « couple ») ; le
pourcentage de jeunes vivant seuls, nettement supérieur au recensement par rapport aux
enquêtes ; le pourcentage d’enfants de moins de 18 ans vivant en famille monoparentale
évalué à 16,4% aux enquêtes annuelles de recensement et 12% seulement dans une enquête
ménages correctement dépouillée pour redresser les doubles comptes. Ces comparaisons
lui permettent de formuler des hypothèses sur la manière dont les personnes répondent au
recensement, et donc sur les doubles comptes et omissions qui pourraient l’affecter. Laurent
Toulemon en déduit quelques suggestions d’utilisation et d’amélioration des recensements.
[cf. power-point de son exposé]
G - L’enrichissement du recensement par d’autres sources
RP et sources administratives : le point de vue d'un statisticien spatial, par
Jean-Luc Lipatz, chef de la division Etudes territoriales, Insee
Jean-Luc Lipatz montre d’abord la nécessité de faire des progrès considérables dans
la mise à disposition de données statistiques finement localisées. Traditionnellement, celleci repose sur des zonages : communes, IRIS, etc. Et cela reste nécessaire pour le suivi de
politiques établies dans des découpages administratifs. Mais pour l’étude, la planification et
l’évaluation, les zonages a priori masquent trop souvent les véritables localisations, et on ne
saurait trop insister sur l’importance du « MAUP » (« modifiable area unit problem » - qui
fait disparaître des disparités locales par un simple effet de maillage). Pour lui, la bonne
solution réside dans le couple géolocalisation-carroyage : l’information statistique
correctement géolocalisée (coordonnées x,y) est établie et publiée par carreau, sans aucun a
priori sur les contours des territoires pertinents. De ce point de vue, le recensement français
actuel pose deux problèmes principaux, auxquels les sources administratives peuvent
apporter des réponses. Dans les communes comptant au moins 10 000 habitants, le sondage
peut être complété par des sources administratives au moyen de régressions locales
permettant d’affecter des valeurs estimées aux adresses non enquêtées. Dans les
communes de moins de 10 000 habitants, qui couvrent 96% du territoire et pour lesquelles
le recensement à lui seul n’offre aucun détail infracommunal (sauf dans les cas, rares, où
elles comptent plus de 5000 habitants et sont découpées en Iris), une source administrative
comme les revenus fiscaux locaux permet d’affecter une géo-localisation à la presque
totalité des immeubles recensés, le résidu étant affecté au chef-lieu de la commune. La mise
en œuvre de ces deux voies de progrès permet d’établir une information carroyée
homogène sur l’ensemble du territoire national, capable de s’intégrer dans des cartes de
toute l’Europe établies selon les mêmes principes.
[cf. power-point de son exposé]
H - Conclusion du séminaire
Au nom de la SFdS, Jean-François Royer remercie les intervenants de la richesse de
leurs apports. Les témoignages d’utilisateurs l’ont montré : les données du nouveau
recensement sont déjà beaucoup utilisées, et le dispositif mis en place depuis 2004 a tenu
ses promesses. Comme toute source statistique, le nouveau recensement doit être utilisé en
tenant compte de ses conventions et de sa précision : les informations apportées par les
exposés de l’après-midi sont très précieuses à cet égard, et ont dans certains cas apporté des
réponses à des interrogations exprimées par les utilisateurs dans leurs témoignages. Tout
au long de la journée, un certain nombre de difficultés ont été signalées par les utilisateurs.
Certaines peuvent trouver remède dans des améliorations de produits de diffusion des
données (y compris les documentations attenantes) : il appartient à l’Insee de voir ce qui est
possible en ce domaine. D’autres relèvent plus du domaine de la formation, comme la
suggestion de créer un cursus spécialisé pour les étudiants susceptibles d’exploiter le
recensement : là, ce sont les organismes d’enseignement ou de recherche qui peuvent
relever le défi. Certaines difficultés structurelles ne pourront être résolues qu’à long terme,
dans le cadre de programmes statistiques publics : on pense aux pistes évoquées par
François Clanché en ouverture, notamment la constitution d’un répertoire des logements,
unanimement souhaitée pendant cette journée ; ou aux utilisations de données
administratives anticipées par Jean-Luc Lipatz. Mention spéciale doit être faite de la
difficulté de concilier la confidentialité due aux répondants et l’utilisation de tableaux
détaillés : la question soulevée en particulier par Alexandre Kych a reçu de multiples échos,
et mérite d’être traitée pour aboutir à une solution qui respecte bien les deux impératifs.
Peut-être cette solution est-elle à chercher dans un brouillage statistique des données,
technique encore balbutiante en France.
Tous ces problèmes, et toutes ces suggestions, seront communiqués à la Commission
nationale d’évaluation du recensement, dont le Président a bien voulu ouvrir cette journée.
Le dialogue entre utilisateurs et producteurs de l’information est une des conditions du
progrès des systèmes statistiques : s’agissant du recensement, il faudra certainement le
poursuivre bien au-delà de cette journée.