Recommandations pour la collecte et le traitement de données

Transcription

Recommandations pour la collecte et le traitement de données
Recommandations pour la collecte
et le traitement de données
Sommaire
Contexte, objectif et démarche
1
1 Identification du besoin
2
2 Conception et définition du processus de la collecte de données
3
3 Collecte et traitement des données
4
4 Diffusion et conservation des données
5
5 Bilan de la collecte et standardisation du processus
5
Contexte, objectif et démarche
Ce document est le fruit des travaux du Club des contrôleurs de gestion
des ministères économiques et financiers. Il a été élaboré grâce à l’expertise de l’Insee sur ce sujet.
Le contrôleur de gestion facilite le pilotage et la prise de décision en mettant à la disposition des décideurs
des éléments d’arbitrage opérationnels et objectivés : indicateurs, tableaux de bord, analyses de coûts, etc.
Afin de mener à bien cette mission, il est amené à solliciter divers contributeurs externes ou internes à sa
structure (correspondants métier, responsables budgétaires ou RH, etc.).
À cette occasion, il lui revient de définir les modalités de la collecte des données, de leur traitement et de la
diffusion des informations ainsi obtenues.
Le présent document synthétise les recommandations méthodologiques en la matière dans le double objectif
d’harmoniser les pratiques et d’alléger les tâches de l’ensemble des services.
Ces recommandations sont regroupées autour de cinq rubriques, constituant les étapes à suivre pour répondre
à toute demande de données :
1 - Identification du besoin
2 - Conception et définition du processus de collecte de données
3 - Collecte et traitement des données
4 - Diffusion et conservation des données
5 - Bilan de la collecte et standardisation du processus
L’application de ces recommandations méthodologiques doit être adaptée :
- à la nature de chaque demande de données,
- aux moyens à mobiliser pour la satisfaire,
- à la structure concernée (taille, existence d’un réseau déconcentré),
- au niveau de maturité de la structure dans la mise en œuvre du contrôle de gestion,
- au système de pilotage existant, en tenant compte de l’existence éventuelle de systèmes d’information.
1
1 - Identification du besoin
La première étape préalable à toute collecte de donnée consiste à cerner précisément le besoin du commanditaire, en répondant à différentes questions détaillées ci-après (leur présentation n’est pas chronologique et
doit être adaptée à chaque demande).
Qui ?
Répondre à cette question doit permettre d’identifier les différents acteurs amenés à intervenir tout au long
du processus de collecte :
- Qui est le commanditaire ?
- Qui est destinataire final de l’information ?
- Qui pilote la collecte ?
- Qui valide l’information (qu’il s’agisse d’une validation intermédiaire ou finale) ?
- Qui doit être sollicité pour contribuer à fournir l’information, de manière complète ou partielle ?
Pour quoi faire ?
Il s’agit de comprendre l’utilisation finale des données à collecter :
- Quelle est l’utilisation envisagée des données demandées : pilotage/reporting/performance, allocation des
moyens, information règlementaire, communication externe, étude plus large, etc. ?
- Les données ont-elles un caractère confidentiel ou seront-elles publiées ? Si elles doivent faire l’objet d’une
diffusion, le public sera-t-il large ou restreint ?
Quoi ?
Cette question permet d’identifier plus précisément les principales caractéristiques des données à produire :
- De quel type de données s’agit-il : champ, volumétrie, degré de précision souhaité ?
- S’agit-il d’une demande nouvelle ou l’information est-elle déjà existante, ou potentiellement disponible sous
réserve d’aménagements ?
- Si la demande contient la collecte et le traitement de données nominatives, il conviendra de s’assurer d’une
conformité aux obligations de la CNIL.
- Ces données sont-elles brutes ou nécessitent-elles un retraitement ou une consolidation ?
Quand ?
Il s’agit de s’accorder avec le commanditaire sur les échéances et d’anticiper une éventuelle récurrence de la
demande :
- Quelle est l’échéance pour produire la donnée ?
- Les délais sont-ils négociables ?
- La donnée doit-elle être fournie de manière fiable d’emblée, ou peut-elle être estimée dans un premier
temps puis définitive dans un second temps ?
- S’agit-il d’une demande ponctuelle ou sera-t-elle récurrente ?
- Si cette information devient récurrente : quelle est la périodicité souhaitée ?
A quel coût ?
Il s’agit d’estimer le coût de production des données attendues.
À ce stade, une simple estimation (fourchette de coûts), calculée essentiellement à partir des réponses
au « Quoi ? », est suffisante pour identifier les différentes solutions réalistes, en fonction des ressources
disponibles.
Cette phase d’identification du besoin doit aboutir aux conclusions suivantes :
- Identification des solutions possibles pour la collecte
- Analyse de la faisabilité technique et financaière de chaque solution
- Estimation de la complexité technique
• Estimation du coût associé (coût de la première collecte et coût éventuellement récurrent)
• Analyse du rapport coûts/bénéfices et choix définitif de la solution
 en conclusion : calcul du coût final et description « macro » de la solution retenue
2
2 - Conception et définition du processus de collecte de données
Les professionnels estiment que près de la moitié du coût d’une collecte de données est consacrée à la collecte de l’information (travaux préparatoires et collecte proprement dite) et moins de 15 % au traitement des
données1. Quelle que soit la méthode de collecte utilisée, les données brutes ne peuvent servir que si elles
sont correctement recueillies, avec autant de rigueur que possible : ainsi, une collecte bien préparée en amont
est la garantie de données plus fiables.
La préparation d’une collecte de données passe par deux grandes étapes :
- Définition précise de la (des) donnée(s) à collecter.
- Organisation temporelle et matérielle de la collecte : l’organisation d’une collecte de données nécessite en
effet une collaboration entre plusieurs acteurs, qui doit être formalisée, afin de sécuriser le processus.
Les trois formes que peut revêtir une collecte de données sont les suivantes :
a - Interrogation directe des systèmes d’information
b - Collecte de donnée(s) chiffrée(s) auprès d’un ou plusieurs contributeurs
c - Collecte de données nécessitant la conduite d’une enquête
1 - Définition précise de la (des) donnée(s) :
Quelle que soit sa forme :
Si une fiche de documentation existe déjà : en préciser la référence
Sinon : élaborer la fiche de documentation en renseignant les items suivants : libellé, unité de mesure,
périmètre, mode de calcul, source (application informatique, base de données, fichier informatique,
document)
2 - Organisation temporelle et matérielle de la collecte :
En fonction des 3 formes répertoriées :
a - Interrogation directe des systèmes d’information
- Vérification de la cohérence et/ou de la date de dernière mise à jour des données existantes.
- Paramétrage et choix des requêtes
b - Collecte de donnée(s) chiffrée(s)
- Définition du processus de collecte : acteurs et rôles (contributeurs, valideurs, consolideurs) et description des étapes du processus (production et transmission des données de base, contrôles de cohérence et corrections éventuelles, calculs éventuels et mise en forme).
- Assistance méthodologique auprès des contributeurs à prévoir : quel est le besoin en la matière,
quelle est la forme la plus adaptée ?
c - Enquête
- Protocole et questionnaire de collecte.
- Échantillon ou recensement.
- Définition du processus de collecte : acteurs et rôles (contributeurs, valideurs, consolideurs) et description des étapes du processus (production et transmission des données de base, contrôles de cohérence et corrections éventuelles, calculs éventuels et mise en forme).
- Prise en compte du facteur temps, du côté du demandeur (à quel moment, quel délai donner, quand
relancer, quand exploiter et valider les données ?) et des personnes enquêtées (disponibilité des répondants, temps de passation du questionnaire, temps nécessaire pour mobiliser les réponses ?).
- Assistance méthodologique auprès des contributeurs à prévoir : quel est le besoin en la matière,
quelle est la forme la plus adaptée ?
1
Jacques Lendrevie, Julien Levy et Denis Lindon. Dunod, septembre 2009
3
3 - Collecte et traitement des données
La collecte et le traitement des données s’effectuent en 5 grandes étapes, à adapter au contexte de la demande :
- Lancement de la collecte.
- Suivi de la collecte et relances.
- Contrôle de cohérence et corrections éventuelles.
- Exploitation, mise en forme et analyse.
- Validation finale.
Il est recommandé de procéder à un reporting régulier au commanditaire et/ou aux échelons intermédiaires.
1 - Lancement de la collecte
2 - Suivi de la collecte
et relances
- Répondre aux questions des contributeurs.
- Relancer les non-répondants.
- Informer régulièrement le commanditaire de l’état d’avancement.
3 - Contrôle de cohérence
et corrections éventuelles
Vérifier la cohérence et la qualité des données de base, et les
corriger si nécessaire (apporter soi-même les corrections en
informant au préalable les contributeurs de toute modification
intégrée, ou faire corriger les données).
 Ce travail peut s’appuyer sur les diverses techniques de traitement de données existantes.
4 - Exploitation,
mise en forme et analyse
- Exploiter les données (calculs, pondération etc.).
- Produire le « livrable » final sous le format attendu par le commanditaire.
- Rédiger une analyse si nécessaire (selon les besoins préalablement définis).
 Ce travail peut s’appuyer sur les diverses techniques d’analyses des données existantes (dans le cas d’une enquête, il
convient de se référer aux techniques éprouvées d’exploitation
statistique d’une enquête). Ces techniques sont plus ou moins
élaborées : leur utilisation est à adapter à chaque contexte.
5 - Validation finale
4
Communiquer auprès des contributeurs : objectifs de la collecte,
nature des données demandées, circuits de transmission des
données et échéance(s) associée(s), aide disponible.
- Transmettre au commanditaire le « livrable » attendu, pour validation
- Apporter les corrections éventuelles
4 - Diffusion et conservation des données
Une fois collectées et traitées, les données font l’objet d’une diffusion aux destinataires identifiés lors de la
première phase, et d’une restitution à ceux qui ont fourni les éléments.
Une attention particulière doit être portée :
- à la conservation des données (modalités d’archivage),
- au processus de documentation associé,
- à l’organisation du partage éventuel (intranet, réseau informatique…).
Cette étape, souvent négligée, est primordiale :
- En assurant la traçabilité de l’information, elle facilite la mise à jour ultérieure.
- En partageant l’information, elle permet également de supprimer les redondances dans les futures demandes de données.
Conseil pratiques / points d'attention
Aucune information ou résultats issus du traitement des données ne doit filtrer en dehors des destinataires préalablement identifiés. Lorsque les données sont confidentielles ou diffusées dans un cadre
restreint, il convient d’en adapter les modalités de conservation.
5 - Bilan de la 1ère collecte et standardisation du processus
La dernière étape consiste à réaliser un bilan de la collecte et à standardiser le processus de collecte.
Bilan de la collecte :
Cette démarche permet d’établir un retour d’expérience en identifiant :
- d’une part ce qui a bien fonctionné,
- d’autre part, à s’interroger, par une analyse détaillée, sur les causes des dysfonctionnements lors de la
collecte et du traitement des données et à définir les actions correctrices afin d’éviter qu’ils se reproduisent.
C’est également l’occasion de déterminer précisément le coût final de la collecte, dans toutes ses composantes, tant humaines que matérielles.
Standardisation du processus :
Il s’agit de mettre à jour la documentation associée et de l’archiver, afin de sécuriser les données en les rendant auditables et traçables.
1 - Bilan de la collecte
2 - Standardisation
du processus
- Répertorier les dysfonctionnements rencontrés, en les classant
éventuellement par grand type (exemple : organisation, systèmes
d’information …)
- Identifier leurs causes et définir les actions correctrices pouvant être apportées
- Identifier ce qui a bien fonctionné
- Mettre à jour la documentation associée (fiches indicateurs
notamment)
- Archiver les données
Conseils pratiques / points d’attention
Le retour d’expérience peut passer par des entretiens avec le commanditaire et les différents contributeurs.
5
AVRIL 2013
SG - SEP2B - 2013
Sous-Direction des Affaires budgétaires et de la performance
Bureau performance et contrôle de gestion SAFI 1C