Les données numériques, mai 2007

Transcription

Les données numériques, mai 2007
Les données numériques, mai 2007
2 types de fichiers de données
- données d’enquêtes (brut, besoin d’un cliché d’enregistrement), micro données
- données agrégées (traitement statistique), séries chronologiques
Où trouver les données
Statistique Canada, une source d'information unifiée:
- Cansim II : le Système Canadien d'Information Socio-Economique est la base de données de Statistique
Canada. Il est disponible à travers deux interfaces : E-Stat et CHASS.
- Sherlock : données d’enquêtes de Statistique Canada (principalement) et rassemblées par la CREPUQ.
Pour les États-Unis, il n’y a pas de site unifié, il faut aller chercher les données statistiques auprès de chaque
Département d’état (ou auprès de tout autre organisme compétent). Ex :
- ICPSR http://www.icpsr.umich.edu/ Microdonnées d’enquêtes et données agrégées.
- le Bureau of Economic Analysis. http://www.bea.gov du Department of Commerce.
- Department of Labor http://www.dol.gov
- Bureau of Census, http://www.census.gov/
- Ameristat, http://www.ameristat.org/
- County and city datas http://fisher.lib.virginia.edu/collections/stats/ccdb/
- Integrated Public Use Microdata Series http://www.ipums.org/
Ailleurs:
- Institut de la statistique du Québec http://www.bdso.gouv.qc.ca/pls/ken/iwae.proc_acce?p_temp_bran=ISQ
- AMECO, statistiques macros collectées par l'Union européenne sur les pays européens et de l'OCDE. Gratuit.
http://europa.eu.int/comm/economy_finance/indicators/annual_macro_economic_database/ameco_en.htm
- Un CD-Rom de la Banque Mondiale appelé "World Development Indicators (WDI) 1971-2001" est disponible
au 3e étage de la bibliothèque. Sujets : World View, People, Environment, Economy, States and Markets, and Global Links.
- Un CD-Rom de Statistiques Canada sur le commerce mondial est disponible à HEC ("World trade data" aka
"World Trade Analyzer"), pour les années 1980-1999. S'utilise avec SPSS.
- Pour les autres sources de statistiques possibles, voir le répertoire de liens sur le site de la bibliothèque :
http://www.bib.umontreal.ca/SB/num/dataweb.htm
Micro données venant d’enquêtes
Accès aux enquêtes par CANSIM II E-Stat et CHASS: elles sont associées aux tableaux.
Par Sherlock http://sherlock.crepuq.qc.ca/ :
- Lister toutes les enquêtes par ordre alphabétique
- Moteur de recherche (par variables entre autre)
- Pour chaque enquête, il faut utiliser :
o Obligatoire : Le « Cliché d’enregistrement » ou « Manuel des codes » permet d’avoir le détail des
variables utilisées avec leurs codes.
o Fortement conseillé : Le « Résumé » ou « Guide de l’utilisateur » : synthèses, méthodologie et
aperçu général de l’enquête
- Possibilité d’extraire les données par variables
o par 30 max.
o possibilité de les fusionner ensuite (fonction merge dans Stata)
o en extraire plus que moins c’est mieux
- Extraction conseillées : ASCII séparées par des tabulations
- Parfois, être patient pour l’envoi de statistiques par courriel.
Données agrégées de CANSIM
Via E-Stat
http://estat.statcan.ca/cgi-win/CNSMCGI.exe?Lang=F&CANSIMFile=EStat/Francais/CII_1_F.htm
- Cansim II contient des tableaux et des séries.
o Les tableaux :
ƒ ont des « numéros » sous la forme 000-0000.
ƒ ils sont des consolidations de « séries ».
ƒ il y a des tableaux « actifs » et des tableaux « terminés »
o Les séries
ƒ ont des « codes » sous la forme V0000000.
-
Comment trouver le(s) série(s) et/ou tableau(x) qui m’intéressent ?
o en connaissant déjà leurs numéros ou codes (sic)
o Répertoire des tableaux (PDF) de E-Stat
http://estat.statcan.ca/MIS/Directory/Estat_Repertoire_des_tableaux.pdf
o en utilisant le moteur de recherche Web de E-Stat et CHASS.
ƒ ne renvoie que des tableaux, il faut ensuite trouver la(les) série(s) pertinentes.
ƒ Utiliser le signe de troncature * après les mots-clés utilisés (Ex: Salaire* Légume*)
-
Le point fort de E-Stat :
o Il permet d’obtenir facilement des extractions de plusieurs séries et de les consolider.
ƒ Par exemple : Avoir les données de plusieurs provinces et de plusieurs indicateurs dans le
même tableau.
ƒ Il faut chercher les données par séries, les unes après les autres. Puis quand elles ont toutes
été réunies, on peut lancer l’extraction de données.
ƒ On peut sélectionner plusieurs séries de tableaux différents.
-
Extraction des données et périodicité
ƒ Éviter de faire des transformations de fréquences dans le sens annuel -> trimestriel.
ƒ NB : Si les séries proviennent de plusieurs tableaux différents, elles devront avoir la même
périodicité (ce qui n’est pas toujours le cas).
Via CHASS
Les points forts de CHASS :
- On peut faire des recherches par mot clé dans les séries.
- Conseil : chercher d’abord dans « titres de tableaux », puis « titre de séries ».
- Données un peu plus nombreuses et mieux mise à jour mais extraction moins souple qu’avec E-Stat.

Documents pareils

Données numériques - Département de sciences économiques

Données numériques - Département de sciences économiques • Utiliser le signe de troncature * après les mots-clés utilisés (Ex: Salaire* Légume*) • Le point fort de E-Stat : • Il permet d’obtenir facilement des extractions de plusieurs séries et de les co...

Plus en détail