Partiel de rattrapage Mardi 12 juin 2012 – 2 heures

Transcription

Partiel de rattrapage Mardi 12 juin 2012 – 2 heures
UNIVERSITE PARIS 1 PANTHEON SORBONNE ANNEE UNIVERSITAIRE 2011‐2012 M1 Economie Techniques quantitatives
Cours de C. Perraudin Partiel de rattrapage Mardi 12 juin 2012 – 2 heures Les réponses doivent être rédigées soigneusement de manière précise et concise. La notation en tiendra compte. On étudie les dépenses totales de consommation (selon la définition de l’INSEE) des ménages en France en 2006, à partir des données de la base Budget des Familles (INSEE). On dispose pour 9 912 ménages (qui ne sont pas des familles de type « complexe ») d’informations pour les variables suivantes :  « deptotuc » : dépenses totales de consommation du ménage par unité de consommation (uc)  « revtotuc » : revenu total du ménage par unité de consommation (uc)  « age » : âge de la personne de référence du ménage  « nadul » : nombre d’adultes dans le ménage  « nenfants » : nombre d’enfants dans le ménage  « npers » : nombre de personnes dans le ménage  « typmen5 » : type de ménages (selon la définition de l’Insee), qui prend 4 modalités : personne seule, famille monoparentale, couple sans enfant, couple avec enfants  « CS » : catégorie socioprofessionnelle de la personne de référence du ménage, sauf pour les personnes en retraite qui sont isolées dans une catégorie à part. CS est une variable qualitative à 7 modalités : sans CS (personnes n’ayant jamais travaillé), indépendants, cadres, professions intermédiaires, employés, ouvriers, retraités. L’objectif est d’étudier les dépenses totales de consommation selon les caractéristiques socio‐
économiques des ménages. 1. On étudie les liens entre les variables suivantes : « deptotuc, revtotuc, age, nadul, nenfants ». a) Vous commenterez brièvement les résultats donnés par la matrice de corrélation, en précisant les liens (signe, intensité et significativité) qui apparaissent entre les variables (ou ensemble de variables). (1,5 point) b) On mène une analyse en composantes principales (ACP) normée (cela signifie que les variables sont centrées et réduites). En vous appuyant sur les résultats reportés ci‐dessus, vous exposerez les raisons qui peuvent justifier ce choix. (0,5 point) 1
c) A partir des résultats de l’ACP reportés ci‐dessous, vous proposerez une interprétation et un titre aux deux axes principaux en précisant les éléments à l’appui de vos commentaires. (2 points) 2. On mène une classification ascendante hiérarchique. a) A partir des résultats reportés ci‐dessous (cluster procedure et arbre de classification), quelles seraient les différentes classifications pertinentes selon vous (nombre de classes retenu) ? Justifiez vos choix. (1 point) (….) 2
b) Les tableaux suivants donnent les résultats d’une classification en 4 classes : les moyennes par classe (et dans l’ensemble) des variables qui ont servi à la classification, les tris croisés entre d’une part, la variable donnant le numéro de classe (« cluster ») et d’autre part, la variable d’âge en classe (« age ») et la variable décrivant le type de ménage (« typmen5 »). Vous décrirez succinctement mais précisément les différentes classes, leur contenu et leurs caractéristiques, en utilisant les 3 tableaux. (4 points) Remarque : pour les tris croisés, vous présenterez très précisément votre mode de lecture d’un tri croisé pour une situation seulement. Vous préciserez également en quoi les tris croisés vous apportent une information différente des moyennes par classe. 3
c) On étudie la répartition de la catégorie socio‐professionnelle de la personne de référence (variable « CS ») par classe. Vous présenterez les catégories socio‐professionnelles qui sont sur‐
représentées dans chacune des classes. (2 points) Remarque : vous justifierez précisément votre réponse pour une situation seulement. 3. On analyse les dépenses totales de consommation par unité de consommation en logarithme (notées « log_deptotuc »). Quelques statistiques descriptives de cette variable sont reportées ci‐dessous. Proposez en quelques lignes un commentaire de l’allure de la distribution de la variable (Ligne « All ») et des différences qui apparaissent selon la catégorie socio‐professionnelle. (1 point) 4. On utilise la méthode des moindres carrés ordinaires (MCO) pour expliquer les dépenses totales de consommation par unité de consommation en logarithme (notées « log_deptotuc ») en fonction du revenu total par unité de consommation en logarithme (noté « log_deptotuc »). a) A partir des résultats ci‐dessous, l’effet du revenu sur les dépenses de consommation est‐il significatif ? Donnez une interprétation précise et compréhensible pour un non spécialiste à ce coefficient. (1 point) 4
b) On ajoute à cette régression la variable correspondant au nombre de personnes dans le ménage (notée « npers »). Commentez l’influence de cette variable et de sa présence sur le coefficient associé à la variable « log_revtotuc » (en comparaison avec la régression précédente). Proposez une explication à ce résultat. (1 point) c) On ajoute à la régression de la question a) la variable correspondant à l’âge de la personne de référence du ménage (notée « age »). Commentez l’influence de cette variable et de sa présence sur le coefficient associé à la variable « log_revtotuc » (en comparaison avec la régression a)). Proposez une explication à ce résultat. (1 point) d) On construit 3 variables indicatrices relatives à l’âge de la personne de référence du ménage : « age_m30 » qui vaut 1 si la personne a moins de 30 ans et 0 sinon, « age_3060 » qui vaut 1 si la personne a entre 30 et 60 ans et 0 sinon, « age_p60 » qui vaut 1 si la personne a plus de 60 ans et 0 sinon. Donnez une interprétation précise aux coefficients associés aux variables « age_m30 » et « age_p60 » dans la régression ci‐dessous. L’influence de l’âge obtenue ici est‐elle en cohérence avec les résultats de la question c) ? (1 point) 5
5. Afin de tenir compte de la CS de la personne de référence du ménage, on définit autant de variables indicatrices que de modalités de la variable « CS » sachant que les personnes en retraite sont isolées dans une catégorie à part : personnes n’ayant jamais travaillé (CS_sans), agriculteurs et indépendants (CS_indep), cadres (CS_cadre), professions intermédiaires (CS_profint), employés (CS_emplo), ouvriers (CS_ouvr), retraités (CS_retrait). Commentez les résultats ci‐dessous en précisant l’ampleur et la significativité des écarts de consommation estimés selon la CS. Obtient‐on les mêmes résultats que ceux obtenus dans la question 3 ? Sinon, proposez une explication. (2 points) 6. Vous proposerez une synthèse des résultats obtenus (en une page recto maximum) en comparant ceux issus de l’ACP et la classification à ceux obtenus par la méthode des MCO. Vous pourrez souligner l’intérêt et les limites de ces résultats. (3 points) 6