Compétition Spatiale dans le Secteur de la Grande et
Transcription
Compétition Spatiale dans le Secteur de la Grande et
Compétition Spatiale dans le Secteur de la Grande et Moyenne Distribution Française Version provisoire (14/10/2007) Stéphane TUROLLA Université Montpellier I - LASER Résumé Avec près de 1 400 hypermarchés et 5 600 supermarchés, la France est l’un des pays au monde où ce que l’on nomme la grande et moyenne distribution est la mieux représentée. Cependant, peu d’études empiriques ont à ce jour mesuré la concurrence de ce secteur à un niveau local. Cet article se propose de construire un modèle d’économétrie structurelle intégrant conjointement une meilleure spéci…cation du comportement spatial du consommateur tout en tenant compte des interactions stratégiques entre les points de vente. La modélisation repose sur un modèle structurel d’o¤re et de demande à la BLP (1995, 2004). La modélisation du comportement des consommateurs s’opère à travers un modèle de choix discrets de type Logit à coe¢ cients aléatoires où les points de vente sont localisés spatialement et les consommateurs ont des préférences hétérogènes sur les caractéristiques des grandes surfaces. A l’aide de données relatives aux choix des lieux d’achats pour divers produits alimentaires recueillies dans l’aire urbaine de Montpellier, nous sommes à même d’estimer dans un second temps notre modèle et d’e¤ectuer plusieurs simulations a…n de mesurer les conséquences économiques de diverses con…gurations de localisation. Key words: Concurrence spatiale, Econométrie structurelle, Modèle de choix discrets, Di¤érenciation des produits, Grande et Moyenne Distribution Classi…cation JEL : C35, L13, L81 L’auteur tient à remercier Jean-Louis Monino, la CCI de Montpellier et les participants des JMA 2007 pour leurs commentaires. Un remerciement tout particulier à Aurélie Bonein sans qui ce travail n’aurait pas la même qualité. Toute erreur restant mienne. Faculté des Sciences Economiques - Espace Richter - Avenue de la mer - C.S 79606 - 34960 Montpellier Cedex 2/ Tel : 33 (4) 67 15 83 81 / Fax : 33 (4) 67 15 84 86 Email address: [email protected] (Stéphane TUROLLA). 1 Introduction Avec près de 1 400 hypermarchés et 5 600 supermarchés, la France est l’un des pays au monde où ce que l’on nomme la grande et moyenne distribution est la mieux représentée. Cette avancée, quelle que soit l’interprétation bonne ou mauvaise qu’on lui donne, est la résultante d’une nouvelle façon d’appréhender le commerce de détail. Cette a- uence dans le paysage commercial français est toutefois sous contrôle d’un nombre restreint d’acteurs, implantés depuis de longues années. Au …l du temps, ces distributeurs ont diversi…é leurs formats de vente (hypermarché, supermarché, maxidiscompte, supérette, etc..) et leurs lieux d’implantations de façon à répondre aux besoins des consommateurs, tout en réduisant la concurrence en prix, dans l’objectif d’accroître leur pouvoir de marché. Le secteur de la distribution répond ainsi parfaitement à la dé…nition d’un marché oligopolistique où les produits (ici les points de vente) sont di¤érenciés. Les modèles standards de concurrence oligopolistique (Hotelling, 1929; Chamberlin, 1933) fournissent un premier cadre d’étude pour ces marchés. En intégrant les comportements stratégiques des …rmes dans un contexte concurrentiel, ils permettent de faire dépendre la demande et les pro…ts d’une …rme en fonction de ses propres choix, mais aussi de ceux de ces concurrents. La nature de la concurrence et des interactions variant toutefois d’un modèle à l’autre. Les travaux théoriques menés à l’aide de ces modèles suggèrent que l’absence d’internalisation par les …rmes de leurs propres choix, sur les concurrents et les consommateurs, conduit à des décisions sous optimales de localisation, de tari…cation ou encore de nombre de produits proposés sur le marché (Spence, 1976; Anderson, de Palma, et Nesterov, 1995, entre autres). Ces conclusions légitiment, de prime abord, les réglementations instaurées en France et dans de nombreux pays européens dans le secteur de la distribution. Néanmoins, plusieurs travaux de nature empirique ont ouvert la voie ces dernières années pour apporter un éclairage nouveau sur ces questions. Nous proposons dans cet article un modèle d’économétrie structurelle à même d’appréhender les déterminants des comportements des consommateurs et de mesurer le degré de concurrence rencontré par les distributeurs à une échelle locale (ex : agglomération, département). La modélisation adoptée repose sur l’observation de données individuelles, ainsi que sur la localisation géographique de l’ensemble des agents (consommateurs, points de vente). Nous suivons la littérature de la théorie des choix discrets pour décrire les comportements des consommateurs. Les primitives de notre modèle englobent les caractéristiques des points de vente, les préférences des consommateurs et une concurrence en prix à la Nash-Bertrand entre les établissements dans un environnement statique. Notre démarche s’inscrit dans la lignée des modèles de concurrence spatiale (Hotelling, 1929; Salop, 1979), au sens où la localisa2 tion des agents tient une place centrale dans notre modélisation. Toutefois, les points de vente sont supposés se concurrencer dans leur ensemble et non uniquement avec leurs plus proches voisins comme il est coutume dans ces modèles. L’étude des déterminants des choix des consommateurs va nous permettre de simuler, par la suite, un changement dans l’environnement concurrentiel, à travers l’entrée d’un nouveau concurrent. Nous pourrons ainsi évaluer les conséquences économiques, et ce pour di¤érentes con…gurations retenues. Au cours de ces dernières années, un nombre important de travaux empiriques ont souligné l’intérêt des modèles structurels pour étudier des marchés oligopolistiques dans un contexte de di¤érenciation des produits (Berry, Levinsohn, et Pakes, 1995; Nevo, 2001, par exemple) 1 . L’apport de notre travail vis-à-vis de cette littérature est double. Tout d’abord, l’observation des choix individuels nous permet de travailler avec les vraies distributions des consommateurs, tant du point de vue de leurs caractéristiques (âge, revenu, etc.) que de leur localisation spatiale. L’introduction de la dimension spatiale est une caractéristique qui n’a été introduite que récemment dans les modèles structurels de demande. Manuszak (2001), Thomadsen (2005a), Davis (2006) ont estimé des modèles structurels d’o¤re et de demande pour des produits di¤érenciés spatialement, appartenant au secteur de la vente au détail (station-service, restauration rapide et cinéma respectivement). L’aspect spatial est introduit à travers la prise en compte d’un coût de transport qui a¤ecte négativement l’utilité de fréquenter un lieu d’achat particulier, au regard de la distance parcourue par le consommateur 2 . Ce laps de temps avec les travaux précités peut s’expliquer par la di¢ culté de recueillir l’information adéquate, mais surtout par la complexité supplémentaire que demande l’introduction des interactions géographiques. Néanmoins, l’analyse du marché de la distribution ne peut se passer d’une telle information. Se positionner géographiquement dans un marché, c’est se positionner vis-à-vis de sa clientèle, mais aussi de ses concurrents. Deux grandes surfaces voisines, géographiquement parlant, seront considérées comme des substituts proches par les consommateurs. Le facteur espace sera ainsi partie-prenante des forces intervenant dans les formes de substitution, et par conséquent des élasticités. Pour le secteur de la grande distribution, la concurrence est fortement localisée. Deuxièmement, les données utilisées contiennent des informations relatives aux « second choix » des consommateurs, autrement dit l’ordonnancement des lieux de consommation fréquentés. Ce type de données est un atout supplémentaire pour estimer correctement les préférences des consommateurs, ainsi que les formes de substitution associées, car elles donnent une image directe 1 Pour un tour d’horizon sur les tenants et aboutissants des modèles structurels en Organisation Industrielle, voir Ackerberg, Benkard, Berry, et Pakes (2007). 2 Smith (2004, 2006), Chiou (2005) et McManus (2007) sont venus agrandir cette littérature depuis. 3 des forces de substitution entre les alternatives. A notre connaissance, seuls Berry, Levinsohn, et Pakes (2004) (BLP par la suite) ont intégré pleinement cette information dans leur modélisation. La suite de l’article est organisée comme suit. La section 1 décrit brièvement le secteur de la grande et moyenne distribution en France. Dans la section 2, nous présentons le cadre théorique de l’estimation. Les données utilisées et les hypothèses associées sont détaillées dans la section 3. La section 4 expose la méthode d’estimation utilisée, en particulier les moments spéci…ques imposés au modèle, ainsi que les di¤érents ensembles d’instruments retenus. Les résultats de l’estimation et le calcul des marges des acteurs pour di¤érentes situations de concurrence sont présentés dans la section 5. La section 6 expose les simulations de plusieurs scénarios relatifs à l’entrée d’un nouveau concurrent. En…n, la section 7 conclue et discute quelques extensions possibles. 1 Le secteur de la grande et moyenne distribution française Le visage de la France, de l’après-guerre au début du XXIe siècle, a fortement évolué dans de nombreux domaines (démographie, économie, culturel, etc.) ; et le commerce de détail n’a pas échappé à ce courant. Les années soixante ont vu l’apparition d’une nouvelle forme commerciale répondant à une demande croissante de distribution de biens produits en masse : les hypermarchés. Ces commerces d’une surface supérieure à 2 500m2 ont révolutionné le mode de consommation des Français, en proposant une gamme de produits très diversi…ée, à des prix compétitifs. Le bouleversement des habitudes est tel qu’aujourd’hui 33.5 % des achats alimentaires sont réalisés dans ce type de magasins 3 . Au …l des années et pro…tant d’un savoir-faire toujours plus grand, les propriétaires de ces hypermarchés se sont structurés en grands groupes commerciaux. Ils ont développé une gamme de magasins de plus en plus large (supermarché, maxidiscompte, supérette, mini libre service) dans le but d’accroître leur dominance sur le marché, en ciblant un maximum de consommateurs. L’ensemble de ces acteurs que l’on rassemble sous le vocable de la grande distribution constitue aujourd’hui une force économique de premier plan dans le tissu économique français. En 2004, les grandes surfaces ont réalisé un chi¤re d’a¤aires de 165 milliards d’euros, soit 80% du chi¤re d’a¤aires du commerce de détail à prédominance alimentaire ; et représentaient quelques 521 000 emplois. A titre d’exemple, le groupe Carrefour (second groupe mondial) réalise à lui seul 35.7 milliards d’euros de chi¤re d’a¤aires sur le territoire français 4 . 3 Source : INSEE –Le commerce en France 2005-2006. Pour une présentation plus détaillée du secteur de la distribution, le lecteur peut consulter Allain et Chambolle (2003). 4 4 De nos jours, 85% des ménages français fréquentent régulièrement une grande surface alimentaire et y e¤ectuent 60% de leurs achats alimentaires 5 . Au-delà de l’adhésion à ce format commercial, les chi¤res suggèrent que les ménages tendent en moyenne à minimiser le temps consacré à cette activité. On retrouve ce trait de comportement dans les critères de sélection retenus par les ménages pour expliquer leurs choix. Les aspects pratiques (proximité, facilité d’accès, etc.) l’emportent largement sur les questions de prix ou de qualité des produits. Tab. 1 Critère de choix de la grande surface principale (en %) Critère de choix de la grande surface principale La plus pratique Des prix moins élevés une seule 77 deux 66 trois et plus Ensemble Nombres de grandes surfaces fréquentées Le choix des produits La qualité des produits Ne sait pas Ensemble 11 8 3 1 100 17 12 5 0 100 54 22 16 7 1 100 67 16 11 5 1 100 Source : enquête mensuelle de Conjonture auprès des ménages, avril 1998, Insee La question du positionnement des établissements dans l’espace urbain est donc un aspect déterminant dans l’étude du fonctionnement du secteur de la grande distribution. Cependant, même si les consommateurs sont enclins à fréquenter le lieu commercial le plus proche (cf. Hotelling, 1929), ce n’est pas pour autant qu’ils restreignent leurs achats à un unique établissement. Parmi les clients des grandes surfaces, 35% font régulièrement leurs courses dans une seule grande surface, 40% en fréquentent deux, et 25% en fréquentent trois ou plus 6 . En…n plus l’étendue du choix est vaste, plus les consommateurs semblent être attentifs aux caractéristiques de l’o¤re (Tableau 1). Ce portrait condensé des comportements d’achat des consommateurs pour des biens alimentaires met en lumière deux caractéristiques principales du marché de la grande distribution alimentaire : la spatialisation et la di¤érenciation. Ces deux points résument parfaitement le dilemme rencontré par un distributeur désireux de s’installer dans un nouveau marché et devant faire face à une situation de concurrence. A savoir : où se positionner et sous quel format ? Cette décision n’est pas neutre, car elle génère de nombreuses externalités, tant du point de vue des consommateurs que des …rmes en place. Ce qui a conduit dans le passé l’Etat à légiférer sur la question de l’implantation des grandes surfaces 7 . Une troisième particularité de ce secteur, que l’on retrouve dans 5 Source : Chardon O., Dumartin S, 1998, « Fidélité des enseignes, …délité aux marques : le choix des consommateurs » , INSEE Première, N 609, Septembre 1998. 6 Ibidem. 7 Loi Royer (loi n 73-1193 du 27 Décembre 1973 d’orientation du commerce et de 5 une grande majorité des activités de commerce de détail, est le faible nombre d’acteurs qui se concurrencent. Quelle que soit la taille du marché (national ou local), une petite poignée de …rmes se partagent toujours une grande majorité des ventes. La nature oligopolistique du secteur de la grande distribution a été démontrée par Ellickson (2006) pour les Etats-Unis et Smith (2004) pour l’Angleterre. En France, les rapports Rey et Tirole (2000) et Canivet (2004) se sont fait l’écho de ce même constat. L’explication de cette structure particulière repose sur les nombreuses barrières que rencontrent les …rmes pour entrer sur le marché et sur la nature de la concurrence qui s’y exerce. Ce constat conduit les …rmes à adopter des comportements stratégiques, dont les leviers d’actions peuvent correspondre au choix des formats des points de vente, des produits vendus (marque nationale, marque de distributeur) ou à un emplacement géographique particulier, propices à la maximisation de leur pro…t. Ainsi, l’essence même du travail de l’économiste est d’avoir une connaissance des plus précises sur la nature de ces comportements, dans le but de prévoir la réaction des …rmes suite à une modi…cation de l’environnement concurrentiel. 2 Le modèle 2.1 Modélisation du comportement du consommateur On suppose l’observation de t = 1; :::; T marchés où les consommateurs choisissent parmi l’ensemble des établissements de grande et moyenne distribution, ou autrement dit l’ensemble des alternatives j = 0; :::; J. Un marché étant dé…ni comme une famille de produits alimentaires particulière (ex : fruits et légumes, épicerie, surgelés). Autrement dit, pour chaque famille de produits alimentaires, les consommateurs font un choix supposé indépendant des précédents d’un lieu d’achat 8 . Les préférences des consommateurs sont décrites dans l’espace des k caractéristiques (super…cie, station essence, etc.) des alternatives. Soit un individu i localisé en Li , la fonction d’utilité indirecte associée l’artisanat) et Loi Ra¤arin (loi n 96-603 du 5 Juillet 1996 relative au développement et à la promotion du commerce et de l’artisanat). 8 L’hypothèse de choix indépendants d’un lieu d’achat entre les di¤érentes familles de produits repose sur le comportement avéré des consommateurs à fréquenter plusieurs circuits de distribution pour ses achats alimentaires. Plus précisément, le CREDOC relève que les ménages fréquentent 3.9 circuits en moyenne sur les neuf recensés.De surcroît, l’institut note que ce chi¤re s’inscrit dans une tendance à la hausse au regard des enquêtes passées. Ce résultat souligne "[...] la capacité croissante des consommateurs à tirer pro…t de la diversité des prestations que leur proposent les di¤ érents circuits alimentaires"(Moati, Meublat, Pouquet, et Ranvier, 2005, p.40). 6 à l’alternative j, pour un marché t s’écrit : Uijt = jt + ijt + g (d (Li ; Lj ) ; ) + qij ' + "ijt (1) où jt = xjk k + jt représente l’utilité commune entre tous les consommateurs pour les k caractéristiques (prix inclus) et jt correspond à l’ensemble des caractéristiques inobservables des alternatives j (qualité, disposition du rayon, variétés proposées, publicité,...) 9 . L’ensemble des termes ijt + "ijt permet d’introduire l’hétérogénéité des goûts des consommateurs et génère des formes de substitution bien plus réalistes que celles introduites par un simple Multinomial Logit (MNL). En e¤et, la formulation du MNL suppose que chaque alternative est substituable à toutes les autres et que le degré de substituabilité est identique pour toutes. Seuls les niveaux moyens d’utilité ( ici), c’est-àdire l’utilité commune à tous les consommateurs, di¤érencient les produits. Ainsi, tout calcul d’élasticité ou de part de marché passe uniquement par ce paramètre. De même, l’hétérogénéité des consommateurs est prise en compte exclusivement dans le terme d’erreur ", ce qui limite fortement le cadre d’interactions possibles. Une façon de passer outre ces contraintes est d’introduire un terme supplémentaire (ici ) dans la fonction d’utilité indirecte, re‡étant les préférences propres à chaque consommateur vis-à-vis des caractéristiques des alternatives. On parle alors de Logit à coe¢ cients aléatoires ou encore Mixed logit. Les termes ijt + "ijt représentent une déviation hétéroscédastique de moyenne nulle par rapport à l’utilité moyenne jt , où "ijt est un paramètre de goût pour la diversité supposé i.i.d. selon une distribution des valeurs extrêmes de Type I (Gumbell). ijt comprend les termes d’interactions entre les caractéristiques démographiques observables des consommateurs zir (revenu, âge, taille du ménage, etc.), celles qui sont inobservables 10 ik , et les caractéristiques des alternatives xjk . Plus précisément : ijt = X o kr xjk zir + X xjk ik u k (2) k kr 9 Le terme est introduit dans les modèles structurels de façon à contrôler l’endogénéité du prix à la fois du côté de la demande, mais aussi de l’o¤re. Cette contrainte connue sous le terme de biais d’endogénéité est à l’origine de la technique d’estimation particulière mise en place par Berry (1994) et BLP(1995). La question du biais d’endogénéité est toutefois moins évidente dans le contexte de données individuelles. Nous renvoyons le lecteur vers Villas-Boas et Winer (1999) et Petrin et Train (2005) pour une discussion plus détaillée sur la persistance du biais d’endogénéité avec données individuelles, et donc sur le bien fondé de l’introduction de . 10 Les coe¢ cients associés à ces termes sont notés o et u . Les indices "o" et "u" correspondant respectivement à "observable" et "unobservable". La terminologie anglaise étant ici reprise. 7 où ik est supposé suivre une distribution normale multivariée 11 . La fonction d’utilité prend aussi en compte la distance entre le lieu de localisation du consommateur i, Li , et la localisation du point de vente Lj , soit d (Li ; Lj ). La fonction g ( ) est fonction de d (Li ; Lj ) et du paramètre , ce qui permet d’introduire une variété de coûts de transport 12 . L’introduction de la caractéristique spatiale soulève toutefois un biais potentiel d’endogénéité, tout comme la variable prix. Les paramètres estimés de la fonction (1) seront convergents s’il y a absence de corrélation entreh les caractéristiques inobseri h i vables et la distance moyenne parcourue, soit E j dj = 0 et E j dh = 0, 8 h 6= j. Or cette condition est loin d’être évidente. Par exemple, si l’on considère que correspond à la qualité des alternatives, certains points de vente à forte valeur pour sont en position de force pour accroître leur aire de marché i et se h positionner au plus proche des consommateurs, ce qui implique E j dj < 0. Inversement, les concurrents de moindre qualité seront contraint d’exercer leur pouvoir de marché à distance plus grande des consommateurs (en moyenne) dans l’objectif de pro…ter des e¤ets de niches h (e¤et i stratégique), synonyme de concurrence moins féroce. Dans ce cas E j dh > 0 et les estimateurs sont biaisés dansh les deux situations décrites. En réalité, on constate vite que l’hyi pothèse E j dj;h = 0 est fortement contredite. A…n de tenir compte de ce problème, il est naturel de poser l’hypothèse suivante. Hypothèse Le choix de la localisation est supposé antérieur au choix des caractéristiques inobservables et irrévocable. Par conséquent, les …rmes ne peuvent pas s’adapter spatialement au marché pour accentuer leur pouvoir de marché. On se situe de fait à l’étape 2 d’un jeu, où la première étape correspond au choix de la localisation, considéré ici comme exogène. Le terme qij ' prend quant à lui en considération l’e¤et de regroupement des achats pour une même alternative quel que soit le marché, ou autrement dit le phénomène de multipurpose shopping 13 . Le terme qij correspondant au nombre de familles de produits achetées par le consommateur i dans l’établissement j. La description du système de demande est complétée en permettant aux individus de ne pas acheter une famille de produits alimentaires parmi l’ensemble 11 De même pour simpli…er, on pose que ik et zir sont indépendants. Toutefois, dans l’estimation qui suit nous retenons l’hypothèse d’un coût de transport linéaire. 13 Le terme de multipurpose Shopping fait référence au comportement de regroupements des achats dans un même lieu, de manière à réduire le temps des achats et le trajet parcouru. Thill et Thomas (1987) font une revue de la littérature empirique et théorique de ce type de comportement. 12 8 des alternatives ou de ne pas en consommer du tout, ce qui se traduit par une "option extérieure" j = 0. La fonction d’utilité indirecte de cette alternative s’écrit : Ui0t = 0 + i0 + "i0t . L’utilité moyenne de l’option extérieure n’étant pas identi…able (sauf introduction d’hypothèses supplémentaires), il nous est impossible de déterminer les paramètres restants. On normalise alors 0 et i0 à zéro. La résultante de cet arbitrage conduit à ce que les coe¢ cients du modèle s’interprètent par rapport à cette option extérieure. De façon à synthétiser les notations, on pose = f 1 , 2 g,nle ovecteur contenant l’ensemble des paramètres du modèle à estimer. 1 = correspond aux u o paramètres linéaires et 2 = f kr ; k ; ; 'g aux paramètres non linéaires 14 . L’ensemble de ces hypothèses permet de dé…nir la part de marché pour une alternative j. Le consommateur est supposé fréquenter un seul établissement, à chaque trajet, qui lui procure la plus grande utilité : Uijt = max Uiht . h=0;:::;J En tenant compte des caractéristiques des alternatives (x; ) et de l’e¤et de regroupement des achats qij , l’ensemble des consommateurs qui choisissent l’alternative j, sont ceux dont les caractéristiques (zi ; i ; Li ; "ijt ) sont telles, que l’utilité de fréquenter l’alternative j est la plus élevée : Ajt pjt ; xj ; = f(zi ; i ; Li ; "ijt ) jUijt > Uiht ; h 6= jg jt ; Lj ; qj ; 2 (3) La part de marché de l’alternative j pour la famille de produits t s’obtient en agrégeant les choix individuels dans la région de Ajt , soit : sjt pjt ; xj ; jt ; Lj ; qj ; 2 = Z dP (z; ; L; ") = Z dP (z) dP ( ) dP (L) dP (") Ajt Ajt (4) où P ( ) correspond aux fonctions de distribution des populations. Le dernier membre de l’équation (4) se dérivant de l’hypothèse d’indépendance entre z, , L et ". A partir des hypothèses posées sur la distribution des caractéristiques des individus, et pour un ensemble de paramètres donné, on est à présent en mesure de déterminer soit analytiquement, soit numériquement, la valeur des parts de marché estimées. Les élasticités-prix directes et croisées de la demande s’écrivent : 8 > pj @sj ph < sj = R > @ph sj : pj sj R prix;i sijt (1 prix;i sijt siht dP sijt ) dP (z) dP ( ) dP (L) si h = j (z) dP ( ) dP (L) (5) sinon avec pj le prix de l’alternative j et prix;i la désutilité du prix pour l’individu i. Cette formulation traduit le fait que la variation du prix de l’alternative h 14 La raison de cette distinction devient apparente par la suite. 9 in‡ue plus fortement la demande des alternatives proches de h dans l’espace des caractéristiques, et ceci d’autant plus que les préférences des consommateurs rentrent de manière hétérogène dans le modèle. La ‡exibilité des formes de substitution entre les alternatives est donc très grande dans ce type de modèle. 2.2 La prise en compte de l’o¤re Nous dé…nissons maintenant le cadre de concurrence dans lequel opèrent les établissements, bien que cette partie du modèle n’entre en considération qu’indirectement comme nous l’expliquons ci-dessous. Toutefois, cet aspect du modèle est essentiel à la détermination des coûts marginaux des points de vente et donc de leur pouvoir de marché. On suppose que les F distributeurs choisissent leurs prix de façon à maximiser leur pro…t, dans un cadre statique. A chaque distributeur ne correspond qu’un sous-ensemble de l’ensemble des points de vente, soit Fj 15 . Le pro…t du distributeur f s’écrit alors : f = X (pj cj ) M sj (6) Cj j2Fj où cj est le coût marginal constant de production pour l’alternative j, Cj le coût …xe et M le nombre de consommateurs sur le marché étudié. Si les conditions nécessaires à l’existence d’un équilibre en stratégies pures sont réunies, il existe un unique prix d’équilibre pour des établissements agissant séparément de toutes considérations de réseau. Autrement dit, les distributeurs sont supposés n’avoir qu’un seul établissement. Les conditions de cet équilibre reposent sur le théorème de Caplin et Nalebu¤ (1991) qui impose trois contraintes sur la fonction d’utilité des consommateurs : (1) Les fonctions d’utilité des consommateurs sont linéaires (LRUM) pour les paramètres associés à leurs caractéristiques. (2) Les coûts de transports sont supposés quadratiques 16 . (3) La distribution de la fonction de densité des consommateurs f ( ) est -concave sur un support convexe B Rn , avec un volume positif : f( ) [(1 )f ( 0) 15 + f( 1) ] 1= ;0 1 A titre d’exemple, le groupe Carrefour englobe les hypermarchés Carrefour, les supermarchés Champion, les maxidiscomptes ED, les supérettes Shopi et les minilibres service 8 à huit. 16 Anderson, de Palma, et Thisse (1992) ont montré que le théorème peut être étendu pour des coûts linéaires et une fonction de densité des consommateurs non uniforme. 10 La spéci…cation des modèles structurels dont la partie demande repose sur un modèle de choix discrets respecte les deux premières contraintes. La dernière contrainte requiert simplement une forme particulière de la fonction de distribution des goûts des consommateurs. La plupart des densités multidimensionnelles (Normale, Type I, Beta, Gamma, exponentielle, Pareto) respectent l’hypothèse de -concavité, ce qui a pour conséquence de rendre quasi-concave les fonctions de pro…ts. Seulement comme le souligne Thomadsen (2005b), on a jusqu’à présent supposé à tort que l’introduction de la dimension spatiale dans les modèles de choix discrets ne remettait pas en cause les conclusions du théorème. Or, la prise en compte de la dimension spatiale induit des di¢ cultés nouvelles et ne peut être considérée comme une simple caractéristique supplémentaire. Thomadsen montre alors que sous l’hypothèse d’indépendance des points de vente (absence de structure de réseau), une condition su¢ sante à l’existence d’un équilibre unique en prix est que chaque alternative ne capture pas plus de 50% de part de marché à chaque point de l’espace. Sous cette condition, le prix de l’alternative j se détermine à l’aide des conditions de premier ordre : X (pr cr ) r2Ff @sr + sj = 0 @pj soit , (7) ! @sr p j = c r + sj (8) @pj Ces J équations peuvent être solutionnées pour chaque cr . On peut ainsi déterminer la marge unitaire pour chaque établissement. On dé…nit au préalable la matrice qui traduit la variation de la demande vis-à-vis de celle du prix en fonction de la structure du marché : jr = 8 > < > : @sj @pr si 9f : fr; jg 0 sinon Ff (9) Matriciellement, on peut écrire les marges unitaires de la manière suivante : p c= (p; x; ; L; q; 2) 1 s (p; x; ; L; q; 2) (10) où (p; x; ; L; q; 2 ) est une matrice J J. Si l’on dispose de données relatives aux prix d’achats (aux producteurs) et aux coûts de fonctionnement, sous contrainte de retenir une forme fonctionnelle adéquate, il est préférable de dé…nir le coût marginal en fonction de ces éléments et d’estimer simultanément cette équation et la partie demande du modèle. Dans le cas contraire, ces deux équations peuvent être estimées séparément. Une fois les coe¢ cients de la partie demande estimés, nous introduisons ces derniers dans l’équation (10), ce qui nous permet d’obtenir les coûts marginaux estimés. Di¤érentes 11 structures de marchés sont alors envisagées. L’objectif étant de déterminer la structure qui correspond le mieux aux comportements observés. La première structure retenue repose sur un comportement strictement individuel de chaque établissement. On suppose que les points de vente maximisent leur pro…t sans prendre en considération des e¤ets de réseau. La deuxième structure retient la situation inverse : chaque distributeur cherche à maximiser son pro…t en considérant l’ensemble de ses établissements a¢ liés 17 . La dernière structure est un cas particulier : l’ensemble des établissements agit conjointement dans le but de maximiser le pro…t global, comme le réaliserait un monopoleur. En reprenant l’idée de Nevo (2001), nous interpréterons les marges calculées de la première structure comme l’e¤et de la di¤érenciation entre les établissements. La di¤érence de marges entre la première et la deuxième structure correspond à l’e¤et de réseau. Et la di¤érence entre la deuxième et la troisième structure mesure l’e¤et d’un comportement de collusion sur le marché. 3 Données 3.1 L’aire urbaine de Montpellier et les caractéristiques des points de vente Le modèle est estimé pour l’aire urbaine (AU) de Montpellier (Population : 459 916, Recensement INSEE 1999 ), à partir de données collectées lors de l’enquête PACHA réalisée en 2000 (voir annexes), et de données complémentaires (Inventaire communal 18 , base LSA, etc.). L’échantillon utilisé correspond à 1 654 ménages résidant dans les cantons de l’AU de Montpellier 19 . L’enquête PACHA englobe 47 familles de produits, mais l’on restreint notre analyse aux 17 Cette structure fait référence à la notion de …rmes multi-produits ou multiétablissements, termes plus couramment utilisés dans la littérature. Nous supposons dans ce cas qu’il existe un équilibre en prix pour des …rmes multi-produits, tout comme BLP (1995) ou Nevo (2001). Bien que ce résultat ne soit pas formellement établi, en pratique ce raccourci ne pose pas fondamentalement de problème, (ibidem). 18 L’auteur remercie le Lasmas/Centre Quetelet qui lui a permis d’obtenir les enquêtes de l’INSEE. 19 Le zonage par aire urbaine reposant sur l’unité communale, nous avons sélectionné les cantons dont au moins une commune appartenait à l’AU de Montpellier. 12 seuls produits alimentaires, soit 12 familles de produits 20 ; 21 . L’attrait de cette base pour notre modèle est multiple. En premier lieu, on connaît pour chaque ménage les (éventuels) multiples lieux d’achats, et ce pour chaque famille de produits alimentaires. Cette information souvent peu présente dans d’autres études doit permettre d’améliorer sensiblement l’estimation des formes de substitution 22 . Deuxièmement, la mesure de la fréquentation de ces lieux étant renseignée, il est possible d’établir une hiérarchie entre eux. Cette mesure repose originalement non pas sur un barème quantitatif, mais sur une approche qualitative de la question. Pour chaque lieu d’achats cité, correspondant à une famille de produits, il a été demandé aux ménages d’associer une lettre représentative de leur fréquence d’achat : –« –« –« –« –« A» B» C» D» E» pour l’ensemble des achats pour les trois quarts des achats pour la moitié des achats pour un quart des achats pour des achats exceptionnels ou rares Détermination des parts de marché Les parts de marché des di¤érents lieux d’achats sont calculées en transformant le barème qualitatif précédent en quantitatif, soit A = 100 %, B = 75 %, C = 50 % et D = 25 %. Le tableau A.1 en annexes présente les parts de marché des alternatives regroupées par format pour les 12 familles de produits du secteur alimentaire. Bien sûr, ceci ne peut constituer qu’une approximation des vraies parts de marché, mais l’absence de données dans le secteur de la distribution, pour des raisons de con…dentialité et de dimension des acteurs opérants, nécessite le recours à une approximation. Néanmoins, les parts de marché estimées concordent fortement avec les parts de marché par format de l’enquête budget de famille (2000-2001) de l’INSEE, bien que cette information soit agrégée au niveau national. Tab. 2 Caractéristiques des lieux d’achats par format (en moyenne) Surface (en m 2 ) Pompes à essence Galerie marchande E¤ectif Hypermarché 6586 9 39 12 Supermarché 1407 4 2 30 Maxidiscompte 731 0 0 31 Supérette+ 637 1 0 7 Source : CCI Montpellier, base LSA, relevé in situ. Note : la variable Galerie marchande correspond au nombre de commerces. 20 Nous gardons toutefois à l’esprit que de nombreux facteurs de complémentarité jouent un rôle entre les familles de produits de di¤érents univers dans le choix d’un lieu de consommation et dont le modèle ne tient pas compte. 21 Pain, Pâtisserie, Fruits & légumes, Viandes & volailles, Charcuterie, Poisson & coquillages, Fromage, Autres produits laitiers, Epicerie, Surgelés & glaces, Boissons alcoolisées, Boissons non alcoolisées. 22 A l’exception, à notre connaissance, de BLP (2004) et Smith (2004, 2006). 13 Fig. 1. Distance parcourue - Fruits & Légumes Ensemble de choix et caractéristiques L’ensemble de choix se compose de 80 alternatives correspondant à la totalité des hypermarchés, supermarchés, maxidiscomptes et supérettes+ de l’AU de Montpellier 23 . L’option extérieure regroupe les ménages qui ne consomment pas la famille de produits en question, ainsi que les autres circuits du commerce de détail (magasin de proximité, commerce traditionnel, marché) 24 . Les caractéristiques des lieux d’achats ont été obtenues à l’aide de plusieurs sources d’informations : CCI de Montpellier, base LSA, Internet, relevé in situ. Les statistiques descriptives de ces caractéristiques sont répertoriées dans le tableau 2. Les caractéristiques des ménages mentionnées dans la base PACHA sont nombreuses : âge et CSP du chef de ménage, revenu du ménage, nombre de personnes dans le ménage, etc. Ces informations vont nous permettre d’étudier les nombreuses interactions entre les caractéristiques des lieux d’achats et celles des ménages. 23 Les supérettes+ correspondent à des points de vente a¢ liés à une enseigne de magasins de proximité et dont la surface de vente dépasse les 400m2 . Il nous est apparu important d’intégrer ces alternatives individuellement aux vues de leur part de marché. 24 Le nombre d’alternatives correspondant aux commerces traditionnels, ainsi qu’aux marchés, est si élevé (plus de 180) qu’il nous a été impossible de les différencier dans l’ensemble de choix. Par ailleurs, la faible part de marché pour un grand nombre d’entre elles compliquait d’autant plus l’estimation. 14 De façon à déterminer les distances parcourues par les ménages pour se rendre à leurs lieux d’achats, nous avons géocodé ces derniers dans un Système d’Information Géographique (SIG), ainsi que l’ensemble des communes et des quartiers de Montpellier. En posant l’hypothèse que l’ensemble des ménages réside au centroïde de leur commune ou quartier respectif, nous avons pu déterminer la distance euclidienne parcourue par chaque ménage pour se rendre à son lieu d’achats. La …gure 1 est un exemple de distribution des distances parcourues, selon l’ordre de préférence, pour la famille de produits des fruits et légumes. On constate que plus de 80% des ménages réalisent leurs achats dans un rayon de 4 Km pour leur premier choix. Les deuxième et troisième lieux d’achats sont plus sensibles à la distance, suggérant que pour ce type de produit les lieux secondaires jouent un rôle de "dépannage". 3.2 Singularité des données La connaissance du second choix est une information très intéressante dans l’optique d’appréhender correctement les formes de substitution entre les alternatives. On peut ainsi contraindre le modèle à épouser le mieux possible les formes de substitution "réelles". Le tableau en annexes (Tableau A.2) détaille les parts de marché par format et par produit pour les premiers et seconds choix. On constate que mise à part pour le pain et la pâtisserie, les ménages choisissent plus fréquemment un hypermarché pour leurs achats alimentaires, que ce soit en premier ou second choix. Si l’on restreint l’ensemble de choix au secteur de la distribution (nos 80 alternatives), les ménages ont une très forte probabilité de sélectionner un hypermarché comme second choix, quel que soit le format du premier choix. Il ne semble pas se dégager de corrélation particulière entre les di¤érents formats des lieux d’achats. Si un ménage fréquente un hypermarché en premier choix, ce n’est pas pour autant que ce format va disparaître de l’ensemble de choix au pro…t des autres formats pour un second choix, bien au contraire. Les premiers enseignements que nous pouvons formuler pour expliquer le choix d’un second lieu (dans notre ensemble de choix) sont : premièrement que ce choix est fortement contraint par la distance, deuxièmement que l’hypermarché tient une place majoritaire même si ce format a déjà été sélectionné en premier choix. Ce constat est à l’origine de la formulation de notre troisième ensemble de moments G3 (cf. supra). Une deuxième particularité de nos données repose sur l’invariance des caractéristiques de nos alternatives et de l’ensemble de choix. Nous avons vu précédemment qu’il était nécessaire d’observer un nombre important de variations dans les données a…n d’estimer ce type de modèle économétrique. Dans notre cas, les seules sources de variations dont nous disposons pour étudier 15 les formes de substitution sont : (i) les di¤érentes familles de produits alimentaires, (ii) la connaissance des seconds choix, (iii) l’observation directe des choix des consommateurs, soit l’in‡uence de leurs caractéristiques sur leur choix. A…n d’accroître les sources de variation, nous proposons d’utiliser les di¤érentes familles de produits comme autant de marchés indépendants. Ce choix permettant d’observer des variations dans les parts de marché et dans les prix pour chaque alternative. 3.3 Mise en place d’un indicateur de prix moyen La quantité d’information à notre disposition est très importante. Néanmoins, l’observation directe d’une variable clé est manquante, à savoir le prix correspondant au bien choisi par le ménage. La détermination du prix est une tâche relativement ardue pour ce qui est du secteur du commerce de détail, en particulier pour les produits alimentaires. Car même si l’on dispose du prix du bien acheté, il est quasiment impossible de connaître l’ensemble des prix des biens disponibles, tant l’o¤re est importante. A notre connaissance, peu de personnes ont proposé des solutions dans le cadre d’un modèle structurel où l’ensemble de choix est à la fois si grand et si varié. Smith (2004), par exemple, est confronté à ce même problème dans son étude du marché anglais de la distribution. Néanmoins, l’observation des coûts marginaux lui permet de passer outre cette di¢ culté en spéci…ant un modèle structurel où les prix sont intégrés comme une variable inobservable. A l’aide d’une procédure d’estimation en deux étapes (où dans une première étape, l’élasticité conditionnelle de la demande est supposée unitaire), il recouvre dans un second temps l’élasticité-prix de la demande (élasticité du choix du point de vente) en posant l’hypothèse discutable d’une tari…cation uniforme des magasins d’une même enseigne à l’intérieur de zones assimilables à des départements français. L’homogénéité des prix postulée peut convenir au marché anglais, mais ne peut être retenue pour la France pour deux raisons. Premièrement, on constate une hétérogénéité des prix entre grandes surfaces d’une même enseigne implantées dans une même ville. Deuxièmement, la présence d’indépendants dans certains groupes de distribution (Intermarché, Super U, etc.), plus libres de …xer leurs prix est aussi un facteur d’hétérogénéité. Pour pallier à ce problème, nous avons construit un indice de prix, par famille de produits, propre à chaque magasin, à partir d’un relevé de prix e¤ectué dans 27 grandes surfaces de la zone. 91 produits de marques nationales et "1 er prix " ont été sélectionnés 25 . Le choix des produits de marques nationales repose sur leur présence dans l’ensemble des magasins et s’explique par le besoin de travailler avec des variétés parfaitement homogènes (ex : pot de Nutella, 25 La liste des produits sélectionnés est disponible sur demande. 16 17 (.1126) 0.4201** (.1674) (.0971) 0.0395 (.1207) .72 0.1734 0.0822 .96 (.0050) -0.0018 0.0005 (.0030) (.0352) 0.1991*** 0.3394*** (.0291) (.0906) 4.4252*** Pâtisserie (.0791) 4.5418*** Pain .75 (.3355) 0.1805 (.1731) 0.1203 (.0074) -0.0032 (.0393) 0.3982*** (.0991) 4.5115*** Fruits & légumes .79 (.1897) -0.0479 (.0808) -0.0805 (.0049) 0.0035 (.0518) 0.1974*** (.1023) 4.6299*** Viandes, volailles .89 (.1958) 0.2161 (.1073) 0.1906* (.0040) -0.0048 (.0366) 0.3015*** (.0907) 4.4261*** Charcuterie .70 (.3189) -0.4581 (.1857) 0.1187 (.0168) -0.0122 (.0951) 0.3543*** (.2009) 4.9967*** Poisson .91 (.1506) 0.3078* (.0801) 0.1317 (.0034) -0.0012 (.0498) 0.2850*** (.0789) 4.4566*** Fromage .91 (.1070) 0.0523 (.0557) -0.0319 (.0034) 0.0022 (.0331) 0.2512*** (.0441) 4.5766*** Autres produits laitiers .91 (.0874) 0.0764 (.0673) 0.1137 (.0035) -0.0027 (.0226) 0.1808*** (.0475) 4.5582*** Epicerie .92 (.1971) -0.2355 (.0866) 0.1761* (.0036) 0.0007 (.0612) 0.2617*** (.0847) 4.5512*** Surgelés & glaces .95 (.0696) 0.1341* (.0400) 0.0843* (.0014) -0.0011 (.0222) 0.1483*** (.0385) 4.5212*** Boissons alcoolisées .81 (.2038) 0.4229* (.1358) 0.0032 (.0051) 0.0061 (.0355) 0.2582*** (.0906) 4.4418*** Boissons non alcoolisées b % de retraités parmi l’ensemble de la population de moins de 18 ans du canton. Notes : Les erreurs-type de White sont données entre paraenthèses. *** : signi…catif à 1% ; ** : signi…catif à 5% ; * : signi…catif à 10%. L’ensemble des résidus sont normaux. Les régressions incorporent aussi des e¤ets-…xes associés aux enseignes de distribution. a % d’activités présentes dans la commune sur les 57 recensées par la Nomenclature d’Activités Française de l’INSEE. R2 Retraités b Indice de variété a Nb de concurrents <0.5Km Supérettes+ Constante Variables Tab. 3: Régression hédonique des Log-prix 400g). Néanmoins, a…n de construire un indice qui englobe l’ensemble de la grande distribution et plus précisément les maxidiscomptes, le référencement de produits "1 er prix " paraissait incontournable. Soit pour un magasin j et une famille de produits t composée de i = 1; ::; k produits référencés : Ij;t = Pk Pi;j;t k i=1 (11) Le magasin dont le chi¤re d’a¤aires est le plus important de l’AU constitue la base 100 de l’indice (Carrefour #1 ). Les établissements référencés ont été sélectionnés de façon à constituer un échantillon couvrant l’ensemble des acteurs sur le marché, tant du point de vue de l’enseigne que de leur localisation géographique. Le relevé des prix a été réalisé sur une période de trois jours, évitant ainsi les problèmes de ‡uctuation de prix, en particulier sur le rayon des fruits et légumes. De façon à attribuer un indice à l’ensemble des établissements de la zone, on estime les indices non renseignés des grandes surfaces à l’aide d’une régression hédonique 26 . Le logarithme de l’indice de prix est régressé sur un ensemble de variables prenant en considération la concurrence rencontrée par une grande surface et des e¤ets …xes relatifs aux enseignes de distribution 27 (cf. Tableau 3). La construction de l’indice pour les maxidiscomptes a demandé un traitement particulier. Les enseignes de ce format tari…ant uniformément à l’intérieur des magasins, le recours à une régression n’est plus nécessaire. Les produits de grande marque et les produits non référencés dans les maxidiscomptes ont été retirés de la base, de manière à travailler sur des produits comparables. Le calcul des indices reprend ensuite la méthodologie précédente 28 . 26 Dans une approche similaire à la nôtre, et pour une étude sur le marché de la vente de DVD, Chiou (2005) utilise une régression hédonique pour attribuer un prix estimé à chaque alternative de l’ensemble de choix. 27 Les indices de prix estimés se déterminent de la façon suivante. Soit la régression hédonique ln I = X + ", avec N le nombre d’observations et k le nombre de variables indépendantes. L’équation précédente peut s’écrire I = exp (X + ") = exp (X ) exp ("), et E [IjX] = exp (X ) E [exp (")]. Pour des erreurs distribuées normalement, de variance 2 , alors E [exp (")] = exp 2 =2 . Ainsi, les indices de prix estimés sont calculés à l’aide de la formule suivante Ib = exp X b exp s2 =2 , P 2 où s2 = N k) et e correspond aux résidus de la régression hédonique. i=1 ei = (N 28 A l’exception de la famille "poissons, coquillages". Les maxidiscomptes ne proposant pas de rayon frais poissonnerie, l’indice de cette famille pour chaque magasin correspond à la moyenne des di¤érences pour chaque famille avec l’indice de base. 18 4 Procédure d’estimation et détails économétriques Les paramètres de la fonction d’utilité (1) sont estimés à l’aide de la technique développée par Berry (1994) et BLP (1995). La di¢ culté de l’estimation repose sur la nature endogène de la relation entre les caractéristiques inobservables et les prix, ainsi que sur le caractère non linéaire des variables (x; ) exprimées dans la fonction de demande agrégée s ( ). Sous l’hypothèse d’un ensemble de variables instrumentales Z = [z1 ; :::; zM ] corrélées avec les prix, mais non corrélées avec les caractéristiques inobservables , il est possible d’exploiter une condition sur le moment de l’échantillon, tel que E [Zj ] = 0, pour déterminer un estimateur de la Méthode des Moments Généralisés (Hansen, 1982) : 0 b = arg minG J;ns ( ) W GJ;ns ( ) (12) 2 où GJ;ns ( ) correspond aux moments empiriques, ns la taille de l’échantillon, W représente la matrice de pondération censée être un estimateur convergent de E [Z 0 0 Z], et représente l’ensemble des valeurs possibles des paramètres. Les sections suivantes présentent les moments utilisés, ainsi que l’ensemble des instruments retenus. Pour une description plus détaillée de la méthode, le lecteur est invité à consulter BLP(1995) et Nevo (2000b, 2001). 4.1 Les Moments Cette section détaille les moments GJ;ns ( ) introduits dans la fonction (12). BLP moment (1995) : Le premier ensemble de moments repose sur la condition suivante : les parts de marché estimées des alternatives égalisent celles observées. Pour des valeurs données des paramètres non linéaires 2 , on résout les niveaux moyens d’utilité (x; ; 1 ) qui égalisent les parts de marché estimées s (p; x; ; L; q; 2 ) avec celles observées s 29 : sj (p; x; ; L; q; 2) (13) = sj soit le moment G1J;ns ( ) = sj sj (p; x; ; L; q; 2) (14) Pour une modélisation de type MNL, les parts de marché estimées dépendent uniquement des niveaux moyens d’utilité . Sous l’hypothèse que les vecteurs du système (13) peuvent être inversés a…n que = s 1 (s ), alors la détermination de dépend uniquement des parts de marché, et peut s’écrire de 29 Berry (1994) a démontré l’existence et l’unicité du vecteur d’équation (13). 19 pour le système manière analytique : j = ln (sj ) (15) ln (s0 ) où s0 correspond à la part de marché de "l’option extérieure". Sachant que les niveaux moyens d’utilité sont décrits par j = xj + j , les résidus de l’équation j = ln (sj ) ln (s0 ) = xj + j correspondent aux caractéristiques inobservables j et s’écrivent en fonction des seuls paramètres linéaires 1 . Cet ensemble de moments permet de reformuler les caractéristiques inobservables de telle sorte qu’elles s’écrivent comme une fonction linéaire du prix et des caractéristiques observables. Cependant, pour un Logit à coe¢ cients aléatoires où l’hétérogénéité des consommateurs est introduite, le système d’équation (13) devient non linéaire. La détermination de nécessite le recours à une procédure algorithmique développée par BLP (1995) 30 : k j = k 1 j + ln sj ln sj p; x; k 1 ; L; q; 2 (16) Cette procédure est coûteuse en terme de calculs, car chaque itération nécessite de déterminer numériquement la valeur des parts de marché estimées sj ( ). La part de marché de l’alternative j pour un ensemble de vecteurs (z; ; L) et pour une valeur particulière de et 2 s’écrit : sj = Pr (y = jjz; ; L; ; 2 ) P P Z exp ( j + kr xjk zir okr + k xjk ik = P P P 1 + l exp ( l + kr xlk zir okr + k xlk (17) u k + g (d (Li ; Lj ) ; ) + qij ') dP (z; ; L) u ik k + g (d (Li ; Ll ) ; ) + qil ') Malheureusement, son estimation ne peut se faire analytiquement en raison des dimensions multiples des intégrales. Pour ce faire, on recourt aux avancées de McFadden (1989) et Pakes et Pollard (1989) dans le domaine de la simulation. Pour ns individus (ici ns = 1654), la simulation de l’intégrale précédente se détermine par : P P ns 1 X exp ( j + kr xjk zir okr + k xjk ik sj = P P P ns i=1 1 + l exp ( l + kr xlk zir okr + k xlk u k + g (d (Li ; Lj ) ; ) + qij ') u ik k + g (d (Li ; Ll ) ; ) + qil ') (18) Après convergence de l’algorithme, il devient possible de déterminer la valeur estimée de l’erreur structurelle : j ( ; s ; P ns ) j (s ; 2) xj (19) Cette erreur sera ensuite couplée à un ensemble d’instruments pour former le 30 Pour une démonstration de la convergence de l’algorithme, voir BLP (1995). 20 premier ensemble de moments : G1J;ns ( ) = Zj j ( ; s ; P ns ) (20) A noter, que nous n’utilisons pas exactement la dé…nition de l’erreur structurelle précédente. A…n d’améliorer l’estimation de notre modèle, on préfère retenir la dé…nition de Nevo (2000a, 2001). Ceci ne change en rien la dé…nition du moment G1 . Seule la détermination des paramètres requiert une procédure particulière. Nevo suggère de recourir, lorsque l’on dispose de données de panel, à l’utilisation de variables binaires propres à chaque alternative dans la construction des niveaux moyens d’utilité . A chaque alternative est ainsi associée une variable binaire censée capturer à la fois la qualité moyenne des caractéristiques observables xj qui ne varie pas par marché (ici nos familles de produits), et la moyenne sur l’ensemble des marchés des caractéristiques inobservables j . Au regard du nombre conséquent d’alternatives (80 grandes surfaces) et de la nature de nos données, nous préférons à la place incorporer des variables binaires relatives à chaque enseigne de distribution. Ce résumé dans l’information n’est possible que si la variation des caractéristiques par enseigne n’est pas trop grande. Ainsi, lorsqu’il s’est avéré nécessaire nous avons décomposé en plusieurs établissements une même enseigne, de façon à avoir des caractéristiques homogènes. Nous avons donc un nombre sensiblement supérieur de variables binaires que d’enseignes 31 . L’utilisation de ces variables procure un double avantage : (i) elles permettent de diminuer le problème d’endogénéité en contrôlant une partie de la qualité inobservable, (ii) et elles améliorent sensiblement la précision de l’estimation. Cependant, le terme d’erreur (19) s’en trouve modi…é dans sa dé…nition. Il correspond maintenant à une déviation propre au marché t des caractéristiques inobservables par rapport à la valeur de celle de l’enseigne : jt jt j . Les e¤ets …xes introduits (cf. variables binaires) contrôlent uniquement les termes j . On peut interpréter jt comme la "qualité" spéci…que à la famille de produits t du point de vente j par rapport à la "qualité" globale de l’enseigne (ex : disposition, assortiment,...). La déviation propre à chaque marché jt correspond alors à un terme d’erreur classique et nécessite par la suite l’utilisation d’un ensemble d’instruments adéquat (détaillé dans la section suivante) a…n d’estimer le modèle 32 . 31 Pour alléger la discussion, nous employons par la suite le terme de variables binaires des enseignes, bien que les variables binaires correspondent aussi à des points de vente particuliers. Lorsque cela est nécessaire, la distinction est précisée. 32 Pour être sûr que le lecteur comprenne bien. Les variables binaires jouent le rôle d’instrument, car elles prennent pleinement en compte la corrélation entre le prix et la qualité inobservable sur l’ensemble des marchés j . Nevo indique : "Using the brand dummy variables as IV’s is a nonparametric way to use all the information contained in the characteristics [...]"(Nevo, 2001, p.320). Sous la condition que les caractéristiques soient exogènes, les variables binaires sont des instruments valides pour eux-mêmes. 21 Un dernier point qu’il nous reste à éclaircir lorsque l’on recourt à ce type de variables binaires concerne la technique à employer pour retrouver les vraies valeurs des paramètres . A cette …n, Nevo (2000b, 2001) suggère d’utiliser la procédure de la "distance minimale" de Chamberlain (1982), exposée dans le cadre de données de panel. Les coe¢ cients estimés des variables binaires sont utilisés comme variables dépendantes dans une régression des Moindres Carrés Généralisés (MCG), dont les variables indépendantes correspondent aux caractéristiques des alternatives. Les estimateurs sont projetés dans un espace de dimension inférieure (égale au nombre de caractéristiques), sous la condition E [ jx] = 0 33 . Si l’on restreint l’identi…cation du modèle à cet unique ensemble de moments, alors l’estimation des paramètres repose seulement sur la variation des données entre les familles de produits (qui est ici faible). Une façon astucieuse d’utiliser l’information contenue dans l’enquête PACHA, sans recourir à une méthode du maximum de vraisemblance, est de contraindre l’estimation à reproduire les covariances entre les caractéristiques des alternatives et démographiques. Ceci correspond à notre deuxième ensemble de moments. BLP (2004) moment : Le deuxième ensemble de moments est identique à celui de BLP (2004). Il permet d’égaliser les covariances entre les caractéristiques des alternatives et des consommateurs. Le principe est …nalement assez proche de la technique dite des "macro-moments" utilisée par Davis (2001) et Petrin (2002). Petrin montre comment combiner des informations de niveau agrégé sur les caractéristiques démographiques avec les données du modèle. Néanmoins dans notre cas, il est préférable de parler de "micro-moments", car l’information supplémentaire que l’on intègre (PACHA) est de niveau individuel. Cette contrainte supplémentaire améliore sensiblement l’estimation des paramètres o (gain de l’erreur des paramètres de l’ordre de 2). Les moments empiriques se construisent en faisant interagir la moyenne des caractéristiques des ménages qui choisissent une alternative j avec les caractéristiques de cette alternative ; ceci étant fait en moyenne pour l’ensemble des alternatives. D’où le moment : G2J;ns ( 2 ) X nj j n xkj 8 < : nj 1 nj X ij=1 zij E [zjyi = j; 2] 9 = ; (21) La partie E [zjyi = j; 2 ] du moment ne peut se calculer précisément 34 . On réécrit ce terme à l’aide de la règle de Bayes pour approximer le résultat : 33 Chamberlain a proposé un test du 2 pour mesurer la "distance" qui sépare le modèle non contraint du modèle contraint, tel que = 0. 34 A noter que le terme n’apparaît plus pour alléger les notations, étant donné qu’il s’exprime comme une fonction de 2 . 22 E [zjyi = j; 2] = = Z zP (dzjy = j; Rz (22) 2) z Pr (y = jjz; 2 ) P (dz) Pr (y = j; 2 ) z Le numérateur de l’équation se simpli…e en faisant intervenir l’équation (17) : E [zjyi = j; 2] = R R R z L z Pr (y = jjz; ; L; 2 ) P (dz; d ; dL) Pr (y = j; 2 ) (23) Pour chaque valeur de 2 et eu égard à la détermination de ( ; 2 ) qui égalise (13), le dénominateur de cette équation correspond à sj . Néanmoins, le numérateur nécessite d’être simulé. On utilise pour ce faire le même tirage (zi ; i ; Li ) que pour le calcul de (18), ce qui donne : E [zjyi = j; 2] = (ns) 1 P r zr Pr (y = jjzi ; i ; Li ; sj 2) (24) Au …nal, on substitue (24) dans (21), ce qui nous donne notre deuxième ensemble de moments G2 , auquel on associe le terme d’erreur . Moment - second choix : Le troisième ensemble de moments repose sur la connaissance du second choix des ménages. Cette information nous étant connue, si l’on contraint l’estimation à respecter cette donnée, ceci doit nous permettre d’améliorer l’estimation. Précédemment, nous avons vu que le choix du second magasin a peu de liens, du point de vue des caractéristiques avec le premier choix, si ce n’est une certaine "proximité" au sens kilométrique. Nous contraignons donc simplement le modèle à tendre vers la probabilité de second choix, pour une alternative donnée, et ce sans corréler les caractéristiques des premiers et seconds choix comme l’ont fait BLP (2004). Soit l’ensemble des ménages dont le premier choix (y 1 ) est l’alternative j. La di¤érence entre le second choix (y 2 ) qui est reporté dans le questionnaire et celui prédit par le modèle s’écrit : 0 1 n Xn on o 1 X @ yi2 = h yi1 = j A nj i=1 h6=j 0 2 @E 4 Xn h6=j o yi2 = h jyi1 = j; 2 31 5A (25) où fyi2 = hg correspond au choix de l’alternative h en seconde position pour 23 le ménage i. Le moment G3 s’écrit : G3J;ns ( 2 ) 2 X nj X 6 4 j n h6=j R R R z 1 nj L Pn 2 1 i=1 fyi = hg fyi = jg Pr (y 2 = hjy 1 = j; z; ; L; 2) P 3 7 5 (dz; d ; dL) (26) La partie di¤érentielle de l’équation (26) se calcule à l’aide de la formulation standard d’une probabilité dérivée d’un MNL. En e¤et, Pr (y 2 = hjy 1 = j; z; ; L; se détermine tout comme l’équation (18), à l’exception des alternatives j et de l’option extérieure qui sont exclues de l’ensemble de choix 35 . Le calcul de l’intégrale s’opérant par simulation comme décrit précédemment. Au …nal, on note le terme d’erreur associé à G3 . 4.2 Instruments Une des clés de la réussite de l’utilisation de la Méthode des Moments Généralisés repose sur le choix judicieux d’un ensemble d’instruments. Chamberlain (1987) a montré qu’il existe un ensemble optimal d’instruments correspondant à l’espérance conditionnelle de la dérivée des moments conditionnels par rapport au vecteur des paramètres (évaluée à la vraie valeur des paramètres ), soit E [ ( ) jx] = 0. Autrement dit, les instruments optimaux sont ceux qui pondèrent plus fortement les moments conditionnels les plus sensibles au choix de . Malheureusement, il est souvent très di¢ cile de déterminer la valeur de cet ensemble. Faute de mieux, on recourt à la place à une approximation et/ou à d’autres ensembles soutenus par des considérations économiques. Rechercher des instruments pertinents consiste à trouver des variables qui réagissent avec le prix, mais restent indépendantes des chocs de demande. Le prix d’un produit s’expliquant en grande partie par les coûts de production, ces derniers constituent généralement de bons instruments au regard de leur faible corrélation avec les choix des consommateurs. Néanmoins là encore, il est souvent di¢ cile de disposer de telles données, et lorsque cela est possible, rares sont les variables de coût qui varient par alternative et par marché. L’observation de ces variables étant exclue dans notre cas, à l’exception du montant de la taxe professionnelle au niveau de la commune, nous utilisons à la place un premier ensemble d’instruments correspondant à la moyenne des prix des points de vente d’une même enseigne (hors point de vente concerné) pour un marché particulier. On interagit par la suite ce vecteur avec les variables bi35 D’un point de vue analytique, ceci correspond à la suppression au dénominateur de (18) du "1" et du j eme élément dans la sommation. 24 2) naires associées aux enseignes, ce qui nous donne au total 12 instruments 36 ; 37 . Cet ensemble est considéré comme valide puisqu’il re‡ète à la fois une certaine corrélation du coût marginal commun à l’ensemble des points de vente d’une même enseigne (ex : logistique, coût d’achat), tout en étant indépendant des considérations des caractéristiques inobservables propres à chaque point de vente jt (ex : publicité, marchandisage, etc.). Un autre ensemble d’instruments fréquemment utilisé dans la littérature consiste à retenir les caractéristiques des alternatives et de leurs concurrents, comme des instruments valides pour eux-mêmes (BLP, 1995). Sous l’hypothèse d’une localisation ex-ante des alternatives dans l’espace des caractéristiques, ces variables sont supposées corrélées avec le prix. La marge de chaque …rme dépendant de la distance avec son plus proche concurrent dans cet espace. Néanmoins, dans notre cas il est di¢ cile d’a¢ rmer que les caractéristiques d’un point de vente ne sont pas corrélées avec les caractéristiques inobservables de celui-ci. Par exemple, les maxidiscomptes souvent associés à une qualité moindre, sont facilement reconnaissables à travers leurs caractéristiques (super…cie, absence de station essence, etc.). De surcroît, ces e¤ets sont en grande partie captés par l’introduction des variables binaires. Par conséquent, nous retenons seulement comme instruments les caractéristiques des concurrents localisés dans un même canton. Si un point de vente est confronté à un environnement fortement concurrentiel, il y a de grandes chances pour que la tari…cation adoptée soit plus faible qu’en situation de monopole, sans que la qualité du produit vendue n’entre en ligne de compte. Dans cet esprit, on retient les variables suivantes : le nombre de Grande Surface Spécialisée (GSS) ou Grande et Moyenne Surface (GMS) dans un rayon de 1.5 km, le nombre de concurrents directs dans un rayon de 0.5km et 1.5km, l’indice de variété 38 . Ces variables correspondent à notre second ensemble d’instruments et traduisent très bien le niveau de concurrence présent dans une commune 39 . Un troisième ensemble d’instruments englobe les informations démographiques 36 Les maxidiscomptes ayant une tari…cation uniforme à l’intérieur d’une même enseigne, nous avons, dans ce cas précis, calculé la moyenne par format, hors enseigne concernée. Ce qui au total nous donne 12 instruments (11 enseignes + maxidiscompte). 37 L’interaction avec les variables binaires permet d’augmenter le nombre de conditions d’orthogonalité. Draganska et Jain (2005) et Villas-Boas (2007) sont des exemples de l’utilisation de cette technique. 38 L’indice de variété correspond au pourcentage d’activités présentes dans la commune sur les 57 recensées par la Nomenclature d’Activités Française (NAF) de l’INSEE. 39 Le recours à ces instruments présuppose que la localisation est une caractéristique exogène. 25 du canton où est implantée la grande surface, soit la population cantonale, le pourcentage de CSP "cadre", ainsi qu’un ensemble de variables binaires associées aux cantons positionnés au Sud de l’AU de Montpellier. La population cantonale traduit "l’e¤et de masse" : ceteris paribus, la demande d’un point de vente s’accroît avec le nombre de consommateurs potentiels dans la zone. Les variables restantes permettent de capter des e¤ets éventuels de discrimination par les prix. Le tableau (B.1) en annexes présente les résultats de la régression de ces instruments sur les prix. 4.3 Fonction objectif et convergence des estimateurs Les trois ensembles de moments G1 , G2 et G3 s’intègrent directement dans la fonction objectif (12). Les moments de la population sont supposés être nuls pour les vraies valeurs de : 2 1 6 GJ;ns ( )7 6 6 )] = E 6 G2J;ns ( 6 4 E [GJ;ns ( 3 7 7 =0 )7 7 G3J;ns ( ) (27) 5 La fonction objectif de la MMG est donnée par : GJ;ns ( )0 W GJ;ns ( ) (28) Si l’on dispose de plus d’instruments que de paramètres à estimer (sur-identi…cation), toutes les restrictions attachées aux moments ne peuvent plus être réalisées. La matrice W va permettre de pondérer l’importance de ces restrictions. W est un estimateur convergent de la matrice des variances-covariances asymptotiques des moments = V ar [GJ;ns ( )], de rang au moins égal à la dimension de . W est quali…ée d’optimale si on obtient avec la plus petite variance asymptotique. Intuitivement, on donne plus de poids aux moments conditionnels les moins incertains. Sous des conditions de régularités, la distribution asymptotique des estimateurs MMG s’écrit 40 : p d 1 0 1 J( ) ! N 0; ( 0 W ) W W ( 0W ) h 0 i avec = E GJ;ns ( ) GJ;ns ( ) la matrice des variances-covariances asymptotiques des moments empiriques et le gradient de la fonction objectif. Les 40 Les estimateurs convergent en probabilité vers les vraies valeurs de et McFadden, 1994). 26 , (Newey estimateurs sont alors asymptotiquement distribués selon une loi Normale autour des vraies valeurs de (Pakes et Pollard, 1989). On utilise une procédure des MMG en deux étapes au cours de laquelle la matrice de pondération va di¤érer. Puisqu’il est possible d’employer une matrice de pondération arbitraire sans perte de convergence, on retient W = (Z 0 Z) 1 au cours de la première étape de l’estimation 41 . Ceci donne des estimations convergentes, mais non e¢ caces, des paramètres. Dans un deuxième temps, on se sert des résidus estimés initialement pour recalculer la matrice de pondération = E [Z 0 0 Z]. Cette nouvelle matrice de pondération est utilisée dans le calcul de la matrice des variances-covariances des paramètres. 4.4 Optimisation Cette section a pour objectif de détailler les di¤érentes étapes du processus d’estimation. (1) Préparation des données : calcul des instruments et ns (ici ns = 1654) tirages aléatoires à partir de la distribution P ( ) des caractéristiques inobservables des ménages. (2) Estimation préliminaire des niveaux moyens d’utilité : pour un ensemble donné des valeurs de 2 , on détermine à l’aide d’un modèle MNL les niveaux moyens d’utilité . On utilise pour ce faire l’équation (15) et une procédure des doubles moindres carrés. (3) Calcul des parts de marché simulées à l’aide de (18). (4) Egaliser les parts de marché simulées avec celles observées. Le vecteur qui résout ce moment est déterminé à l’aide de la procédure itérative (16). La procédure est itérée jusqu’à l’obtention d’un niveau de tolérance k …xé à l’avance k+1 j j . (5) Détermination des paramètres 1 : la minimisation de la fonction objectif requiert de poser les conditions de premier ordre par rapport à et de réaliser une recherche non linéaire. Le temps de calcul nécessaire à cette tâche peut être réduit en écrivant 1 comme une fonction des paramètres 2 : 1 0 0 X 0 ZW Z 0 ( 2 ) 1 = (X ZW Z X) où X correspond au vecteur des caractéristiques des alternatives. Cette simpli…cation permet de restreindre la recherche non linéaire au seul paramètre 2 et fait ainsi gagner un temps de calcul conséquent. W = (Z 0 Z) 1 est la matrice de pondération optimale sous l’hypothèse d’erreurs homoscédastiques. 41 27 (6) Calcul du terme d’erreur structurelle (7) Détermination des résidus troisième moment (26). et . dans le calcul du deuxième (21) et (8) La valeur de la fonction objectif est calculée à l’aide de instruments. , , et des (9) On utilise la méthode du simplex de Nelder et Mead (1965) pour minimiser la fonction objectif. A chaque itération, on détermine de nouvelles valeurs pour 2 a…n de minimiser la fonction objectif. (10) Estimation de la matrice de pondération paramètres. et calcul des estimateurs des La procédure d’estimation est implémentée sous MATLAB. Le code est construit sur la base du code mis à disposition par Nevo (2000b) 42 . Il a été étendu de façon à inclure deux nouveaux ensembles de moments, ainsi que la prise en compte de la localisation des agents et du regroupement des achats. 5 Résultats 5.1 Résultats du Logit multinomial Nous avons souligné précédemment que le recours à une modélisation de type MNL ne permettait pas d’introduire, entre les alternatives, des formes de substitution pertinentes. Toutefois, il est utile dans une première approche de calculer les paramètres obtenus à l’aide de cette spéci…cation, a…n d’avoir une idée sur la nature des coe¢ cients et de tester la …abilité des instruments utilisés. Le modèle MNL s’estime en régressant ln (sj ) ln (s0 ) sur les prix et les caractéristiques observables présents dans la formulation de l’utilité moyenne de l’équation (1). Les modèles (i) et (ii) du tableau 5 correspondent à une régression par les Moindres Carrés Ordinaires (MCO). Le modèle (i) inclut le prix et les caractéristiques de l’établissement comme régresseurs, mais pas les variables binaires associées aux enseignes. Dans ce cas, l’erreur du modèle inclut les termes des caractéristiques inobservables jt + j . A l’inverse, le modèle (ii) introduit les variables binaires et contrôle de facto j . Tous les coe¢ cients sont de signes espérés, et sont statistiquement signi…catifs à l’exception de Galerie marchande. Le prix est bien ressenti comme une désutilité, bien que 42 Nevo a mis en ligne sur sa page personnelle, http ://www.faculty.econ.northwestern.edu/faculty/nevo/, un code écrit sous MATLAB pour estimer un modèle structurel de demande. 28 Tab. 4 Statistiques descriptives Variable Moyenne Ecart-type Min. Max. Surface 1.86 2.27 0.4 11.8 Surface2 8.57 23.23 0.16 139.24 Galerie marchande 0.20 0.40 0 1 Station essence 0.44 0.50 0 1 Note : Super…cie en m 2 /1000, Galerie marchande est une variable égale à 1 si le nombre de commerces dans la galerie marchande est supérieur à 4. le coe¢ cient soit assez faible. La surface, qui en un sens peut être assimilée à l’assortiment du point de vente, apparaît croissante à taux décroissant, ce qui concorde avec les résultats de travaux précédents (Smith, 2006 par exemple). Le contrôle des caractéristiques inobservables propres à chaque enseigne j , opéré à travers l’introduction des variables binaires, a un e¤et signi…catif sur le prix. La valeur du coe¢ cient étant plus du double de celle du modèle (i). Les modèles (iii) à (viii) sont estimés à l’aide des doubles moindres carrés, et ce pour plusieurs ensembles d’instruments. L’idée étant de tester la corrélation éventuelle entre le prix et les caractéristiques inobservables. Généralement, si l’on suppose que les caractéristiques inobservables peuvent être assimilées à une certaine mesure de la qualité, l’instrumentalisation du prix doit conduire à un coe¢ cient prix plus élevé en valeur absolue : les points de vente associés à des caractéristiques inobservables plus élevées (cf. qualité) tari…ent à un prix supérieur. Dans notre cas, le recours à une méthode instrumentale ne semble pas trop faire varier le coe¢ cient du prix. Le modèle (iii) soulève le problème mentionné par Nevo (2001), relatif à l’introduction des variables binaires des enseignes seulement comme instruments et non en tant que régresseurs. Le coe¢ cient du prix voit sa signi…cativité économique et statistique disparaître. Utilisées comme uniques instruments, les variables binaires semblent enfreindre l’hypothèse d’orthogonalité avec les caractéristiques inobservables. Un test de Hausman con…rme l’endogénéité du prix dans cette spéci…cation (p = 0:0003). Les enseignes de distribution sont trop fortement liées à j pour pouvoir contrôler de cette manière l’endogénéité du prix. Les modèles qui suivent incorporent à nouveau les variables binaires en régresseurs et contrôlent j . Le modèle (iv) utilise la moyenne des prix des points de vente d’une même enseigne pour un marché particulier comme instruments (cf. section instruments). Dans cette con…guration, le coe¢ cient du prix retrouve une signi…cativité économique et statistique. La qualité d’ajustement de ce modèle est très satisfaisante (R2 et test de Fisher, le Tableau B.1 en annexes présente les résultats de la première étape). Au regard du résultat du test de sur-identi…cation de Sargan, les instruments respectent l’hypothèse 29 30 — Nb voitures — — .44 p — — — — .40 0.01 165.61 (0.00) variables binaires — — — — (.1217) .94 0.12 5.74 (0.89) prix p — — — — — — — — (.0275) -0.1070*** (.3640) -2.0873*** (iv) .40 0.66 23.48 (0.05) autres p — — 0.95 0.18 28.87 (0.32) prix + autres p — — — (.0050) — 0.0308*** (.0051) — — — — (.0272) -0.1083*** (.3626) -2.1450*** (vi) 0.0305*** — — — — (.4268) -0.2960 (4.4886) -0.2403 (v) 0.2490*** (.0701) -0.5673*** (.0977) p 0.2556*** (.0769) -0.5947*** (.1083) p 0.95 0.19 22.84 (0.64) 0.95 0.65 32.75 (0.17) prix + autres (.3108) prix + autres 0.5773* (.3412) (.0048) 0.0189*** — — — — (.0351) -0.1295*** (.3764) -1.6766*** (viii) 0.7623** (.0055) 0.0186*** — — — — (.0267) -0.1105*** (.3535) -2.0246*** (vii) Test de Fisher (p— — 17.33 (0.00) 1629.23 (0.00) 12.28 (0.00) 715.18 (0.00) 686.96 (0.00) 540.25 (0.00) value) Notes : ln(sj ) ln(s0 ) correspond à la variable dépendante pour l’ensemble des estimations. Le nombre d’observations est de 960. Les erreurs-type de White sont données entre parenthèses : *** : signi…catif à 1% ; ** : signi…catif à 5% ; * : signi…catif à 10%. Tous les modèles incluent des variables binaires des enseignes, sauf pour les modèles (i) et (iii). De même, le modèle (viii) comprend comme régresseurs des variables binaires relatives aux marchés associés aux familles de produits frais et la famille du pain. Les ensembles d’instruments sont les suivants : "prix" interaction enseigne x moyenne des prix des points de vente d’une même enseigne, "autres" voir la description dans le texte. Echelle des variables : Indice de prix/10, Super…cie-m 2 /1000, Densité de population communale-100 hab./Km 2 . R2 1 ere étape Test d’endogéniété du prix (p-value) R2 ajusté / Test de Sargan (p-value) Instruments .40 — Nb pers./ménage Variables binaires — — — 0.1029 (.1157) 0.2162* 0.1583 (.2196) — (.0079) (.2139) 0.2339 (.0078) -0.0539*** -0.0528*** — (.1058) (.1039) — (.0337) (.0265) 0.9518*** 0.9813*** (.3744) 0.0531 (.4496) -0.1203*** (.2334) -0.0513*** (.0198) -7.6862*** -5.5473*** -6.6157*** (iii) 2MC (ii) (i) MCO Revenu > 3000 e Densité population Station essence Galerie marchande Surface2 Surface Prix Constante Variables Tab. 5: Résultats du MNL d’orthogonalité et constituent par conséquent, un ensemble d’instruments valide. Néanmoins, le coe¢ cient du prix en valeur absolue est plus faible que dans le modèle (ii). Ce résultat peut s’expliquer par une corrélation négative entre jt et les prix, telle que le coe¢ cient-prix des MCO soit légèrement biaisé à la hausse. Tout dépend de l’interprétation donnée à jt . On peut émettre l’hypothèse que jt traduit un certain degré de la concurrence localisée rencontré par l’alternative j pour la famille de produits t. Plus la concurrence est forte sur une famille de produits, plus les points de vente réduisent leur marge et tari…ent à la baisse. La spéci…cation du modèle (v) va dans ce sens et retient comme instruments les variables traduisant la dimension spatiale du problème (tous les instruments, sauf la moyenne des prix). Comme suggéré par Davis (2006), nous introduisons en régresseur une variable supplémentaire censée capter l’e¤et de la localisation de la population. Plus le nombre d’habitants résidant autour d’un point de vente est important, plus la part de marché de celui-ci tend à croître. Nous retenons à cet e¤et la densité de population communale. Le coe¢ cient du prix augmente sensiblement en valeur absolue, mais sou¤re d’une absence de signi…cativité statistique. Le modèle qui suit (modèle vi) intègre les deux ensembles d’instruments précédents. Le R2 et la statistique de Fisher de la première étape de la régression con…rment la pertinence de nos instruments. Le test de Sargan souligne le respect de la contrainte d’orthogonalité avec jt . Le coe¢ cient-prix reste toutefois inférieur en valeur absolue au modèle (ii) relatif aux MCO. L’ajout de variables démographiques (cf. modèle vii) augmente la sensibilité aux prix, tout en conservant la signi…cativité statistique des autres variables. Ceci traduit l’importance de l’hétérogénéité des consommateurs quant à la fréquentation des di¤érents formats du secteur de la distribution pour e¤ectuer leurs achats alimentaires. L’appréciation de ce circuit augmente avec le revenu du ménage et le nombre de personnes dans le ménage, mais décroît avec le nombre de voitures 43 . Cependant, de façon à mieux capter les formes de substitution entre les di¤érentes alternatives, il est préférable de mieux appréhender l’hétérogénéité des ménages pour divers formats de vente à l’aide d’un modèle de type MMNL. Le dernier modèle (viii) essaie de contrôler l’importance de "l’option extérieure" vis-à-vis de certaines familles de produits. Nous introduisons en régresseurs des variables binaires pour les marchés associés à des produits où la concurrence des autres circuits de vente est plus prononcée (produits frais et pain). Outre l’idée de contrôler la spéci…cité de ces familles de produits, ceci a pour avantage d’introduire une variation supplémentaire par marché. On 43 A notre avis, la variable Nb voitures traduit mieux le pouvoir d’achat du ménage que la variable Revenu > 3000 e. Cette dernière variable recouvre trop de situations familiales possibles (célibataire, marié, marié avec enfant) pour nous renseigner correctement sur le pouvoir d’achat du ménage lorsqu’elle est employée toute seule. 31 observe que la sensibilité au prix augmente avec cette dernière con…guration, tout en laissant inchangée la signi…cativité des autres variables. Le R2 et le test de Fisher de la première étape sont toujours satisfaisants. De même, le test de Sargan con…rme la validité de nos instruments. Bien que la spéci…cation de type Logit multinomial ne soit pas optimale d’un point de vue des formes de substitution, l’observation des élasticités-prix (Tableau B.3 en annexes) constitue là encore une approximation non dénuée de sens. La moyenne de la distribution des élasticités-prix directes pour les 960 observations est de -1.35 (la médiane -1.31) avec un écart-type de 0.29 ; et 7.7% des courbes de demande estimées sont inélastiques. 5.2 Résultats du Logit à coe¢ cients aléatoires L’estimation du Logit à coe¢ cients aléatoires décrite dans les sections précédentes est synthétisée dans le tableau 6. L’ensemble des instruments utilisés est identique au modèle (viii) de la section précédente. La spéci…cation du modèle complet fait référence à l’équation (1) et nous permet de faire varier selon chaque individu l’utilité marginale a¤ectée à chaque caractéristique. La moyenne des distributions des coe¢ cients est estimée à l’aide de la procédure de la "distance minimale" décrite précédemment. La lecture du test du 2 indique que le modèle contraint ( = 0) est rejeté. Autrement dit, il con…rme la faculté des caractéristiques xk à être de bons régresseurs pour les variables binaires associées aux enseignes. Les variables sont toutes de signes espérés et en adéquation avec les coe¢ cients obtenus dans le modèle (viii). Comme attendu, la désutilité du prix augmente sensiblement lorsque l’on passe d’un modèle de type MNL à un MMNL. En accord avec notre postulat de départ, le coe¢ cient de la variable achats groupés est positif et signi…catif. Ceci souligne l’importance des économies d’échelle retirées par la concentration des achats dans un même point de vente (gain de temps, économies de frais de transport, etc.). La surface est toujours positive et signi…cative, ce qui montre la valeur portée par les consommateurs à l’assortiment proposé par l’établissement. Plus précisément, l’utilité marginale de la surface de vente croît à taux décroissant, comme l’indique le coe¢ cient de la variable surface2 . Il apparaît que le consommateur moyen est sensible à la présence d’une station essence. Seule l’existence d’une galerie marchande d’au moins cinq commerces ne semble pas in‡uer le choix des consommateurs 44 . Concernant la dimension géographique du modèle, la distance parcourue par le consommateur pour se rendre à une grande surface est bien ressentie comme une désutilité. Il est possible de calculer à titre indicatif le coût marginal de transport associé à l’achat d’une famille de produits alimentaires, en rapport 44 Ce résultat est valable pour di¤érents seuils retenus ( 32 10 et 20). 33 minimale) 0.1018 (0.2757) 0.7690 (2.5380) 0.6528 (1.5852) 0.4939 (5.5419) 2.7185 (3.5053) -1.3904*** (0.2362) 2.3436*** (0.8525) -3.3123*** (0.7488) -0.5745 (1.3701) 1.8901** (0.7949) 15121 0.98 (0.3058) 0.6931** (3.1037) — — (3.1319) (0.9481) -6.9332** 0.7234 3.9750*** Ecart-type ( u) — — — — — (3.7428) -5.0681 (0.5933) 1.1698** — [20 - 29 ans] — — — — — — (0.6068) 0.8255 — [60 ans et +] — — — — — (2.8094) 3.1279 (1.0722) -0.1847 — Revenu [1500 3000e] Interactions avec les variables démographiques ( ) — — — — — — (0.7347) 0.7553 — Revenu > 3000e o — — — — — — (0.2488) -0.4138* — Nb pers./ménage — — — — — — — (1.7383) 3.1579* Nb voitures — — — — — (2.3561) 2.8425 — — Travail a Echelle des variables : Indice de prix/10, Super…cie-m 2 /1000, Distance-Km/10. b Estimé à partir de la procédure de distance minimale décrite précédemment. Notes : basé sur 960 observations. Toutes les régressions comprennent des variables binaires des enseignes (les coe¢ cients des variables binaires ne sont pas renseignés dans le tableau, mais disponibles sur demande). Les erreurs-type de White sont données entre parenthèses : *** : signi…catif à 1% ; ** : signi…catif à 5% ; * : signi…catif à 10%. 2 (distance R2 pondéré (distance minimale) Achats groupés Distance Station essenceb Galerie marchandeb Surface2b Surfaceb Prix Constante b Variables a Coe¢ cients moyens Tab. 6: Résultats du Logit à coe¢ cients aléatoires (modèle complet) Fig. 2. Distribution du coe¢ cient prix avec notre indice de prix. Celui-ci nous est donné par de prix/Km. 6:9332 1:3904 = 4:99 indice L’estimation des écarts aux coe¢ cients moyens ( u ) permet d’observer si l’hétérogénéité totale est bien expliquée par nos variables. L’ensemble des paramètres des écarts-types sont non signi…catifs, ce qui va dans le sens voulu. Inversement, la signi…cativité des paramètres des écarts-types pour les interactions démographiques est synonyme d’un choix pertinent dans la caractéristique des ménages pour expliquer l’hétérogénéité de la distribution du coe¢ cient moyen. L’interprétation des résultats est directe. Par exemple, la désutitilité du prix diminue d’autant plus que l’on se trouve dans les tranches d’âge [20 - 29 ans] et [60 ans et +]. A l’inverse, la sensibilité au prix augmente avec le nombre de personnes dans le ménage. La distribution de la sensibilité au prix est représentée dans la …gure 2. La forme de la distribution est di¤érente d’une loi normale 45 , ce qui s’explique par l’in‡uence des distributions empiriques des caractéristiques des ménages. Le recours à une modélisation de type Logit à coe¢ cients aléatoires permet d’appréhender de façon plus adéquate la ‡exibilité des formes de substitution entre les alternatives. Ce constat s’observe dans les élasticités-prix (Tableau B.4 en annexes), puisque à l’inverse de la modélisation MNL, les élasticitésprix croisées sont maintenant propres à chaque établissement. Les élasticitésprix présentées correspondent à la médiane des élasticités-prix pour les 12 45 Test de Kolmogorov-Smirnov rejeté à 1%. 34 familles de produits. Une lecture attentive du tableau permet de véri…er la bonne estimation du modèle. A titre d’exemple, nous avons intégré dans le tableau B.4 les deux plus grands hypermarchés de l’AU de Montpellier, à savoir Carrefour #1 et Auchan #1. Ces deux établissements sont distants d’un peu moins d’un kilomètre. On constate que les e¤ets de substitution entre eux sont bien traduits par le modèle, puisque les élasticités-prix croisées rapportées sont d’amplitudes élevées. De plus, il apparaît que l’hypermarché Auchan #1 attire des consommateurs plus sensibles aux prix des produits. La moyenne de la distribution des élasticités-prix directes pour les 960 observations est de -2.85 (la médiane -2.47) avec un écart-type de 1.98, et 9.1% des observations ont des demandes estimées inélastiques. 5.3 Estimation des marges par point de vente Une fois les paramètres de demande estimés, il nous est possible à l’aide de l’équation (10) de déterminer les marges des établissements sur le marché, et ceci pour di¤érentes con…gurations de concurrence. Le tableau 7 détaille les di¤érents taux de marge (pour les deux modèles estimés) pour les trois structures de marché retenues. Le taux de marge étant dé…ni comme (p c) =p. Les chi¤res correspondent à la médiane des taux de marge pour les 12 familles de produits. On constate que le modèle complet fournit des taux de marge inférieurs au modèle MNL pour les trois hypothèses de comportements concurrentiels retenues. L’introduction de la dimension spatiale, ainsi qu’une meilleure prise en compte de l’hétérogénéité des consommateurs permettent de mieux appréhender la ‡exibilité des formes de substitution, et par conséquent le degré de concurrence. La pertinence des résultats est discutée un peu plus loin. On observe que l’e¤et de réseau, c’est-à-dire la di¤érence entre la deuxième structure et la première structure, permet d’accroître le taux de marge moyen de plus de 5 points de pourcentage. Néanmoins, il est à noter que la structure de marché associée au cas d’un monopole donne des résultats anormaux. Un taux de marge supérieur à 100% conduit à ce que les coûts marginaux estimés soient négatifs ! Il nous est toutefois di¢ cile de formuler une explication à ce résultat. Le tableau 8 répartit les taux de marge estimés par format pour le modèle complet. Il est intéressant de voir que selon la stratégie adoptée, ce n’est pas le même format qui génère le taux de marge le plus élevé. Lorsque les points de vente déterminent leur politique tarifaire séparément, le format de vente des supermarchés est celui qui est le plus rentable, alors qu’à l’opposé l’hypermarché se classe en bas de l’échelle. Ce dernier point semble en accord avec la stratégie de ce format. Néanmoins, le modèle n’arrive pas à estimer correctement la marge des maxidiscomptes. Au regard des données de la profession, ce format de vente est traditionnellement celui qui génère le taux de marge 35 Tab. 7 Taux de marge médians pour le secteur alimentaire MNL (Tableau 5, modèle viii) Modèle complet (Tableau 6) Etablissement 78.52% 41.03% Distributeur 88.40% 46.28% Monopole 180.8% 123.98% Source : calculs de l’auteur le plus bas. Cette faiblesse dans l’estimation peut s’expliquer par une absence de données relatives aux coûts d’achats et de fonctionnement. En situation de monopole, l’hypermarché est le mieux à même de dégager une marge importante car il ne sou¤re plus d’une concurrence intense des autres formats. La concurrence en prix pénalise donc plus facilement l’hypermarché. Il est important de rappeler que ces résultats ne concernent que l’activité alimentaire des points de vente. De même, tous les distributeurs ne sont pas présents sur l’ensemble des formats. Ce qui conduit à nuancer la portée des résultats de la deuxième structure. Tab. 8 Taux de marge médians par format et par structure de marché Etablissement Distributeur Monopole Hypermarché 22.35% 27.99% 133.42% Supermarché 42.93% 48.30% 114.40% Maxidiscompte 33.91% 40.76% 109.37% Supérette+ 74.75% 78.43% 138.44% Source : calculs de l’auteur Les marges estimées semblent sensiblement supérieures aux résultats disponibles dans d’autres études, bien qu’il faille garder à l’esprit que nos résultats sont déterminés à partir de considérations locales, fortement dépendantes du degré de concurrence existant. A titre d’exemple, Smith (2004) estime des taux de marge de l’ordre de 10-14% pour le marché anglais de la distribution. Concernant le marché français, l’INSEE donne un taux de marge de 14.7% tous formats confondus 46 . Une raison susceptible d’expliquer ce biais repose sur le phénomène de double marginalisation. Le modèle est construit de telle sorte que nous ne faisons pas de distinction entre producteurs et distribu46 Source : INSEE Référence - Le commerce en France - Edition 2005-2006, p.77. 36 teurs. Autrement dit, les marges estimées englobent celles des producteurs et des distributeurs. Récemment, quelques travaux modélisent explicitement le rôle d’intermédiaire exercé par les distributeurs, entre producteurs et consommateurs dans un modèle structurel d’o¤re et de demande (Villas-Boas, 2007; Bonnet, Dubois, et Simioni, 2004 ; par exemple). Une telle spéci…cation permet d’envisager plusieurs relations verticales entre producteurs et distributeurs (tari…cation non linéaire avec ou sans prix de revente imposé, collusion, etc.). Néanmoins, ces études portent sur des produits particuliers. A notre niveau, il semble plus délicat d’évaluer la part des marges des producteurs et celles des distributeurs à la vue du nombre conséquent de producteurs en relation avec un distributeur. 5.4 Robustesse des résultats Plusieurs résultats intermédiaires ont été calculés a…n de véri…er la robustesse de nos résultats. Tout d’abord, nous avons déterminé les parts de marché prédites à partir des coe¢ cients reportés dans le tableau 6. Les résultats sont synthétisés dans le tableau 9. Tab. 9 Parts de marché observées et prédites (en %) Etablissement Part de marché observée Part de marché prédite Part de marché prédite jt = 0 Hyper U #1 0.30 0.30 0.33 Auchan #1 2.85 2.96 2.99 Carrefour #1 7.11 7.45 7.05 Carrefour #2 7.74 7.80 7.51 Carrefour #3 3.23 3.18 3.15 Carrefour #4 3.45 3.53 3.59 Intermarché #1 0.93 0.93 0.96 Intermarché #2 0.26 0.25 0.18 Leclerc #1 2.18 2.19 2.19 Géant Casino #1 1.75 1.73 3.16 Géant Casino #2 1.91 1.89 1.08 Hypermarché Inno #1 1.25 1.11 1.19 Supermarchés 12.17 11.19 10.82 Maxidiscomptes 4.50 4.28 4.31 Supérettes+ 0.80 0.72 0.79 Ensemble des alternatives 50.42 49.49 49.31 Note : Les données correspondent à la moyenne des 12 marchés. Source : PACHA et calculs de l’auteur. On constate une très bonne faculté du modèle à reproduire les parts de marché réelles. Une grande majorité des alternatives sont estimées avec précision, 37 Fig. 3. Distance associée au point de vente choisi (en Km) Note : le point de vente choisi correspond à la moyenne des probabilités pour les 12 familles de produits. ce qui conforte notre spéci…cation centrée sur les variables binaires pour appréhender les niveaux moyens d’utilité j . Ces derniers étant fonction des caractéristiques observables et inobservables, nous avons recalculé les parts de marché prédites en posant jt = 0. Ceci permet d’observer l’importance des caractéristiques inobservables de chaque famille de produits t du point de vente j par rapport à celles de l’enseigne (ou du point de vente le cas échéant). Les niveaux moyens d’utilité correspondent alors à j = xjk + t . On constate que les écarts dans les prédictions ne sont pas trop importants, ce qui laisse à penser que le modèle tend à égaliser les parts de marché réelles principalement à travers les caractéristiques observables (xjk ) et inobservables propres à l’enseigne j . Toujours dans l’idée d’évaluer l’importance des caractéristiques inobservables, nous avons réestimé le modèle en contraignant les caractéristiques démographiques inobservables associées à la constante, au prix et à la surface à une valeur nulle (vi = 0). Les coe¢ cients varient peu par rapport au modèle complet, ce qui indique que l’hétérogénéité inobservable pour ces caractéristiques n’a que peu d’in‡uence (voir Tableau B.2 en annexes). En d’autres termes, l’hétérogénéité observable introduite su¢ t à expliquer la variation dans les comportements observés. De la même façon, l’introduction des di¤érents ensembles de moments (G2 ,G3 ) a peu d’impact sur les coe¢ cients des caractéristiques des alternatives. La dimension spatiale étant un élément essentiel de notre modélisation, il faut 38 s’assurer que le modèle reproduise correctement les comportements de déplacement observés. La …gure 3 présente la distance parcourue par les consommateurs associée à la grande surface la plus fréquentée pour l’ensemble des 12 familles de produits. On observe que les distributions des distances parcourues réelles et prédites ont des formes similaires. 6 Localisation d’un nouvel entrant et conséquences économiques La robustesse de nos résultats étant établie, nous sommes à même d’estimer les conséquences d’une modi…cation de l’environnement concurrentiel. Deux scénarios sont ici envisagés et peuvent s’apparenter à deux situations liées à la localisation d’un nouveau point de vente. Le premier scénario considère l’entrée d’un nouveau concurrent, tandis que le deuxième scénario étudie le cas d’une relocalisation avec un changement dans les attributs du point de vente. Ces scénarios sont étudiés en posant l’hypothèse suivante : lorsqu’une modi…cation de l’o¤re intervient, nous supposons que les concurrents ne modi…ent pas en réponse leur prix ou bien les caractéristiques de leur établissement. Les comportements stratégiques des distributeurs sont ici absents des analyses menées. 6.1 Localisation d’un nouveau concurrent Le cas de l’AU de Montpellier est propice à la réalisation d’une simulation d’un nouveau concurrent. En e¤et, depuis quelques années, l’agglomération de Montpellier s’est lancée dans la construction d’un grand complexe commercial et ludique, à l’image des "malls" américains, nommé Odysseum 47 . Outre les espaces de loisirs, la partie commerciale du projet prévoit l’implantation d’un hypermarché du distributeur Casino, d’une surface de vente de 12 000m2 . Ce nouveau point de vente se positionnerait en tête des hypermarchés de l’AU au regard de sa surface. Cet exemple constitue un excellent cas de …gure pour étudier l’in‡uence d’un nouveau concurrent sur le marché de la distribution pour cette zone géographique. La simulation envisagée nécessite de recalculer les parts de marché de l’ensemble des alternatives à l’aide des coe¢ cients estimés précédemment (Tableau 6). Auparavant, il nous faut estimer les prix pour les di¤érentes familles de produits, ainsi que les caractéristiques inobservables j + jt du nouveau point de vente. Les prix sont déterminés à partir des coe¢ cients du tableau 3. La valeur de j correspond quant elle à l’estimation de j pour 47 Voir pour une description Les Echos, 24/04/2006. 39 l’enseigne Géant Casino obtenue lors des MCG. Le choix des caractéristiques inobservables d’un point de vente pour chaque famille de produits jt est plus délicat. Sachant que dans notre modèle une petite part de marché sera expliquée par une faible valeur de jt , les résultats sont très sensibles aux valeurs retenues pour . Rappelons que ce paramètre englobe des éléments jt tels que la qualité, l’assortiment, la publicité, propres à chaque famille de produits d’un point de vente. Nous retenons deux alternatives pour estimer nos parts de marché. La première consiste à retenir les mêmes valeurs pour jt que celles associées à l’hypermarché Géant Casino #1. Ce dernier étant le plus ressemblant en terme de caractéristiques parmi les deux hypermarchés Géant Casino présents sur l’AU de Montpellier. La deuxième option consiste à attribuer à jt les valeurs du plus grand hypermarché de l’AU (Carrefour #1 ), de façon à capter l’e¤et de taille propre à chaque famille de produits. Les résultats sont présentés dans le tableau 10. L’arrivée d’un nouveau concurrent d’une si grande importance de part sa taille, modi…e singulièrement les parts de marché (colonne "Nouvel entrant"). Le modèle reproduisant …dèlement le comportement spatial du consommateur, on constate logiquement que les hypermarchés situés les plus près de la localisation du nouveau concurrent (Carrefour #1, Auchan #1 et Inno #1 ) voient leur part de marché sensiblement évoluée. Les principaux concurrents que sont Carrefour #1 et Auchan #1 enregistrent des baisses de part de marché de l’ordre de 35.97% et 26.35%, respectivement, pour la deuxième hypothèse relative à jt . Cette dernière semble d’ailleurs la plus acceptable en raison des e¤ets concurrentiels engendrés. L’augmentation de la part de marché pour l’hypermarché Inno #1 reste toutefois di¢ cilement compréhensible, bien que ce point de vente et le nouveau concurrent se situent à l’opposé du spectre de ce format. Les hypermarchés localisés très loin de ce nouvel entrant ne sont que faiblement a¤ectés. Avec un indice de prix estimé d’une valeur de 102, le nouveau point de vente obtiendrait une part de marché comprise entre 1.35% et 3.99%, selon l’hypothèse retenue. Si Géant Casino Odysseum ambitionne une part de marché de l’ordre de 5% sur l’AU de Montpellier, il faudrait que la moyenne de ses prix pour les 12 familles de produits diminue de 3.3% par rapport à l’indice de prix précédent. 6.2 Repositionnement géographique d’un concurrent Le deuxième scénario étudié envisage le cas d’un transfert d’une grande surface vers un autre lieu géographique. En réalité, le nouvel hypermarché prévu dans le projet Odysseum correspond à une relocalisation du point de vente Géant 40 41 103.4 108.2 113.5 100.2 106.0 99.6 121.3 Carrefour #4 Intermarché #1 Intermarché #2 Leclerc #1 Géant Casino #1 Géant Casino #2 Inno #1 — 2.30 7.17 2.82 6.76 8.81 19.46 22.84 5.84 10.65 2.05 3.71 49.49 1.11 1.89 1.73 2.19 0.25 0.93 3.53 3.18 7.80 7.45 2.96 [50.53, 50.48] [1.25, 1.25] [1.90, 1.88] [1.59, 1.51] [2.16, 2.13] [0.26, 0.26] [0.93, 0.93] [3.45, 3.40] [3.18, 3.16] [7.59, 7.27] [6.44, 4.77] [2.68, 2.18] [0.30, 0.29] [+2.10, +2.00] [+12.61, +12.61] [+0.53, -0.53] [-8.01, -12.72] [-1.37, -2.74] [+4.00, +4.00] [0.00, 0.00] [-2.27, -3.68] [0.00, -0.63] [-2.70, -13.72] [-13.56, -35.97] [-9.45, -26.35] [0.00, -3.44] — [50.32, 50.27] [1.37, 1.37] [2.00, 1.97] — [2.17, 2.14] [0.26, 0.26] [0.93, 0.92] [3.45, 3.40] [3.64, 3.55] [7.82, 7.46] [6.54, 4.84] [2.76, 2.24] [0.33, 0.32] [1.35, 3.99] Nouvelle part de marché (%) [+1.68, +1.58] [+23.42, +23.42] [+5.82, +4.23] — [-0.91, -2.28] [+4.00, +4.00] [0.00 , -1.08] [-2.27, -3.68] [+14.47, +11.63] [+2.56, -4.36] [-12.21, -35.03] [-6.76, -24.32] [+10.00, +6.67] — Variation (%) Relocalisation (Géant Casino #1 - 12000m 2 ) [50.38, 50.78] [1.27, 1.09] [1.93, 1.68] — [2.18, 2.10] [0.26, 0.25] [0.93, 0.92] [3.45, 3.45] [3.36, 2.74] [7.74, 7.94] [7.13, 6.56] [2.88, 2.53] [0.30, 0.23] [1.47, 5.07] Nouvelle part de marché (%) [+1.80, +2.61] [+14.41, -1.80] [+2.12, -11.11] — [-0.46, -4.11] [+4.00, 0.00] [0.00 , -1.08] [-2.27, -2.27] [+5.66, -13.84] [-0.77, +1.79] [-4.30, -11.95] [-2.70, -14.53] [0.00, -23.33] — Variation (%) Relocalisation (Géant Casino #1 - 7525m 2 ) Notes : Les données correspondent à la moyenne des 12 marchés. Les valeurs à gauche entre crochets correspondent à jt pour le nouvel entrant identique à Géant Casino #1. Les valeurs à droite entre crochets correspondent à jt identiques à Carrefour #1. Source : PACHA et calculs de l’auteur. — 105.3 Carrefour #3 Ensemble des alternatives 100.7 100.0 Carrefour #1 Carrefour #2 104.7 0.30 Auchan #1 5.50 104.5 Principaux concurrents Hyper U #1 0 [1.35, 3.99] — 102.0 Variation (%) Nouvel entrant Nouvel entrant Part de marché prédite (%) Nouvelle part de marché (%) Distance avec le nouvel entrant (Km) Etablissement Indice de prix Tab. 10: Localisation d’un nouveau concurrent et relocalisation d’un point de vente Casino #1 avec une extension de sa surface de vente. Autrement dit, cela revient à considérer notre nouvel entrant du scénario précédent et à éliminer de l’ensemble de choix, l’alternative Géant Casino #1. Les parts de marché sont estimées de la même façon que précédemment. Les résultats sont présentés dans le tableau 10 (colonne "Relocalisation - 12 000m2 "). Les points de vente les plus proches de l’alternative éliminée (Inno #1 et Carrefour #3, situés à 2.5Km et 3.7Km, respectivement) voient leur part de marché singulièrement augmentée. De même, le second hypermarché Géant Casino #2 pro…te aussi de cette fermeture (5.9Km). Néanmoins, la disparition d’un concurrent n’in‡uence que très faiblement les résultats précédents pour les grandes surfaces situées à proximité du nouveau point de vente (cf. Carrefour #1, Auchan #1 ). A…n de déterminer l’in‡uence de l’e¤et de la localisation et de l’e¤et lié à l’augmentation de la surface de vente, nous avons recalculé les parts de marché en supposant que le nouveau point de vente ne change pas de surface (Tableau 10, colonne "Relocalisation - 7 525m2 ") 48 . Dans ce cas de …gure, l’hypothèse qui consiste à retenir les mêmes valeurs pour jt que celles associées à l’hypermarché Géant Casino #1 est préférable, puisque l’e¤et de taille n’est plus à prendre en considération. On observe que la variation de la surface in‡uence sensiblement les résultats. Les points de vente Carrefour #1 et Auchan #1 ont une diminution de la demande moins prononcée que précédemment. Au regard des variations, on constate que le modèle conduit à des e¤ets de substituabilité importants pour les points de vente de surface semblable. L’hypermarché Hyper U #1 en est un exemple. Lorsque le nouvel entrant s’implante avec une surface de vente plus petite, il concurrence plus fortement ce point de vente d’une surface équivalente. Le nombre d’attributs retenus pour décrire les points de vente étant limité, la surface occupe une grande place dans les formes de substitution. 7 Conclusion Le secteur de la grande distribution constitue une dimension centrale de l’activité économique française, et les dispositions réglementaires à venir 49 , incite à mieux appréhender les déterminants de la concurrence sur ce marché. Toutefois, la di¢ culté d’obtention de données …ables et étendues limite le nombre de travaux empiriques. Cet article s’intéresse plus précisément au secteur alimentaire de ce marché, et vise à quanti…er au niveau local les interactions concurrentielles entre distributeurs de format divers (i.e., hypermarché, supermarché, maxidiscompte, supérette). En recourant à un modèle structurel de demande où les goûts des consommateurs sont hétérogènes vis-à-vis des 48 Le prix toutefois reste celui estimé précédemment. Voir l’avis n 07-A-12 du Conseil de la Concurrence en date du 11 Octobre 2007 relatif à la législation relative à l’équipement commercial. 49 42 caractéristiques des lieux d’achat, nous avons estimé les di¤érentes formes de substitution qui sous-tendent les choix des consommateurs. L’estimation basée sur des données individuelles consiste a intégrer deux caractéristiques fondamentales de ce secteur : la spatialisation des agents et la di¤érenciation des points de vente. Sachant que 75% des achats sont réalisés dans un rayon de 15 min. autour du domicile 50 , la di¤érenciation spatiale apparaît comme un facteur primordial à la bonne compréhension de ce marché. Les déterminants des choix des consommateurs révélés ont montré que la dimension spatiale, ainsi que les comportements de regroupement des achats, tiennent une place prépondérante dans la décision du consommateur. A l’aide des paramètres de demande estimés, nous avons dans un second temps déterminé le degré de concurrence sur ce marché localisé, en intégrant les interactions stratégiques des distributeurs, puis évalué l’impact sur les acteurs du marché d’un changement de l’environnement concurrentiel, en l’occurrence l’entrée d’un nouveau concurrent. Au-delà des résultats obtenus, ce type de modélisation peut être enrichi et servir à l’avenir pour étudier plus …nement les répercussions d’un changement dans l’environnement concurrentiel. Un premier ra¢ nement du modèle consisterait à modéliser explicitement le comportement de fréquentation de plusieurs lieux d’achats (multistop shopping). Dans son étude sur le marché des boissons gazeuses, Dubé (2005) propose un modèle structurel d’o¤re et de demande où les consommateurs ne sont plus contraints par des choix mutuellement exclusifs. Par la suite, sur la base d’une meilleure prise en compte des coûts des distributeurs, ce qui permettrait d’a¢ ner les prédictions des coûts marginaux et donc des marges, il serait intéressant d’évaluer les conséquences sur le bienêtre de l’entrée d’un nouveau concurrent. Plusieurs travaux ont étudié l’e¤et sur le bien-être de l’introduction d’un nouveau produit dans le cadre d’un modèle structurel d’o¤re et de demande de produits di¤érenciés (Petrin, 2002; Hausman et Leonard, 2002). Néanmoins, à notre connaissance aucune étude n’a porté sur un marché où les agents sont localisés géographiquement 51 . 50 Source : Babayou P., Volatier J.-L., 1998, Prospective de la mobilité locale, n 186, CREDOC, (Collection des Rapports). 51 L’étude des e¤ets d’une modi…cation de l’environnement concurrentiel sur le bienêtre, s’est principalement orientée vers des changements de la structure du marché suite à des opérations de fusions (voir par exemple Smith, 2004; Ivaldi et Verboven, 2005). 43 Références Ackerberg, D., C. L. Benkard, S. Berry, et A. Pakes (2007) : “Econometric Tools for Analyzing Market Outcomes,” dans Handbook of Econometrics, ed. J. J. Heckman, et E. E. Leamer, vol. 6. North-Holland, New York. Allain, M.-L., et C. Chambolle (2003) : Economie de la Distribution. La Découverte, Paris. Anderson, S. P., A. de Palma, et Y. Nesterov (1995) : “Oligopolistic Competition and the Optimal Provision of Products,”Econometrica, 63(6), 1281–1301. Anderson, S. P., A. de Palma, et J.-F. Thisse (1992) : Discrete Choice Theory of Product Di¤erentiation. The MIT Press, Cambridge : MA. Berry, S. (1994) : “Estimating Discrete-Choice Models of Product Di¤erentiation,”RAND Journal of Economics, 25(2), 242–262. Berry, S., J. Levinsohn, et A. Pakes (1995) : “Automobile Prices in Market Equilibrium,”Econometrica, 63(4), 841–890. (2004) : “Di¤erentiated Products Demand Systems from a Combination of Micro and Macro Data : The New Car Market,”Journal of Political Economy, 112(1), 68–105. Bonnet, C., P. Dubois, et M. Simioni (2004) : “Two-Part Tari¤s versus Linear Pricing between Manufacturers and Retailers : Empirical Tests on Di¤erentiated Products Markets,” IDEI Working Papers 370, Institut d’Économie Industrielle (IDEI), Toulouse. Canivet, G. (2004) : Rapport du Groupe d’Experts Constitué sur les Rapports entre Industrie et Commerce. Assemblée Nationale. Caplin, A., et B. Nalebuff (1991) : “Aggregation and Imperfect Competition : On the Existence of Equilibrium,”Econometrica, 59(1), 25–59. Chamberlain, G. (1982) : “Multivariate Regression Models for Panel Data,” Journal of Econometrics, 18(1), 5–46. (1987) : “Asymptotic E¢ ciency in Estimation with Conditional Moment Restrictions,”Journal of Econometrics, 34(3), 305–334. Chamberlin, E. H. (1933) : The Theory of Monopolistic Competition. Harvard University Press, Cambridge : MA. Chiou, L. (2005) : “Empirical Analysis of Retail Competition : Spatial Di¤erentiation at Wal-Mart, Amazon.com, and Their Competitors,”Occidental Economics Working Papers 3, Occidental College, Department of Economics. Davis, P. J. (2001) : “Spatial Competition in Retail Markets : Movie Theaters,”mimeo, MIT Sloan School of Management. (2006) : “Spatial Competition in Retail Markets : Movie Theaters,” RAND Journal of Economics, Forthcoming. Draganska, M., et D. C. Jain (2005) : “Product-Line Length as a Competitive Tool,”Journal of Economics & Management Strategy, 14(1), 1–28. Dubé, J.-P. (2005) : “Product Di¤erentiation and Mergers in the Carbonated 44 Soft Drink Industry,”Journal of Economics & Management Strategy, 14(4), 879–904. Ellickson, P. B. (2006) : “Quality Competition in Retailing : A Structural Analysis,”International Journal of Industrial Organization, 24(3), 521–540. Hansen, L. P. (1982) : “Large Sample Properties of Generalized Method of Moments Estimators,”Econometrica, 50(4), 1029–1054. Hausman, J. A., et G. K. Leonard (2002) : “The Competitive E¤ects of a New Product Introduction : A Case Study,”Journal of Industrial Economics, L(3), 237–263. Hotelling, H. (1929) : “Stability in Competition,” Economic Journal, 39, 41–57. Ivaldi, M., et F. Verboven (2005) : “Quantifying the E¤ects from Horizontal Mergers in European Competition Policy,” International Journal of Industrial Organization, 23(9), 669–691. Manuszak, M. D. (2001) : “The Impact of Upstream Mergers on Retail Gasoline Markets,”mimeo, Carnegie Mellon University. McFadden, D. (1989) : “A Method of Simulated Moments for Estimation of Discrete Response Models Without Numerical Integration,”Econometrica, 57(5), 995–1026. McManus, B. (2007) : “Nonlinear Pricing in an Oligopoly Market : The Case of Specialty Co¤ee,”RAND Journal of Economics, forthcoming. Moati, P., O. Meublat, L. Pouquet, et M. Ranvier (2005) : “Enquête Commerce 2005. Comportements et Attitudes des Consommateurs à l’Egard du Commerce Alimentaire,” Document de Travail, CREDOC, Cahier de recherche 211. Nelder, J., et R. Mead (1965) : “A Simplex Method for Function Minimization,”Computer Journal, 7, 308–313. Nevo, A. (2000a) : “Mergers with Di¤erentiated Products : The Case of the Ready-to-Eat Cereal Industry,” RAND Journal of Economics, 31(3), 395– 421. (2000b) : “A Practitioner’s Guide to Estimation of RandomCoe¢ cients Logit Models of Demand,” Journal of Economics & Management Strategy, 9(4), 513–548. (2001) : “Measuring Market Power in the Ready-To-Eat Cereal Industry,”Econometrica, 69(2), 307–342. Newey, W., et D. McFadden (1994) : “Large Sample Estimation and Hypothesis Testing,”dans Handbook of Econometrics, ed. R. Engle, et D. McFadden, vol. IV. Elsevier Science B.V. Pakes, A., et D. Pollard (1989) : “Simulation and the Asymptotics of Optimization Estimators,”Econometrica, 57(5), 1027–1057. Petrin, A. (2002) : “Quantifying the Bene…ts of New Products : The Case of the Minivan,”Journal of Political Economy, 110(4), 705–729. Petrin, A., et K. Train (2005) : “Tests for Omitted Attributes in Di¤erentiated Product Models,”mimeo, University of Chicago, Graduate School of Business. 45 Rey, P., et J. Tirole (2000) : Régulation des Relations entre Fournisseurs et Distributeurs. La Documentation Française, Paris. Salop, S. C. (1979) : “Monopolistic Competition with an Outside Good,” Bell Journal of Economics, 10(1), 141–156. Smith, H. (2004) : “Supermarket Choice and Supermarket Competition in Market Equilibrium,”Review of Economic Studies, 71(1), 235–263. (2006) : “Store Characteristics in Retail Oligopoly,”RAND Journal of Economics, 37(2), 416–430. Spence, M. (1976) : “Product Selection, Fixed Costs, and Monopolistic Competition,”Review of Economic Studies, 43(2), 217–235. Thill, J.-C., et I. Thomas (1987) : “Towards Conceptualizing TripChaining Behavior : A Review,”Geographical Analysis, 19(1), 1–17. Thomadsen, R. (2005a) : “The E¤ect of Ownership Structure on Prices in Geographically Di¤erentiated Industries,”RAND Journal of Economics, 36(4), 908–929. (2005b) : “Existence of Pure Strategy Equilibria Among Geographically Dispersed Firms,”Economics Bulletin, 12(12), 1–4. Villas-Boas, J. M., et S. R. Winer (1999) : “Endogeneity in Brand Choice Models,”Management Science, 45(10), 1324–1338. Villas-Boas, S. (2007) : “Vertical Relationships Between Manufacturers and Retailers : Inference with Limited Data,” Review of Economics Studies, 74(2), 625–652. 46 Annexes A L’enquête PACHA L’enquête PACHA est une étude portant sur la consommation des ménages résidant dans le département de l’Hérault. Elle fût réalisée en 2000 par le diplôme universitaire "Traitement de la Recherche de l’Information Statistique" en partenariat avec la Chambre de Commerce et d’Industrie (CCI) de Montpellier. L’enquête a été administrée auprès de 2292 ménages résidant dans les circonscriptions des CCI de Montpellier et Sète (équivalent au 2/3 du département de l’Hérault), selon la méthodologie suivante 52 . L’échantillon est construit à l’aide de la méthode des quotas basée sur la répartition connue (recensement INSEE 1999) de la population du département par canton. Les variables de contrôle retenues sont la Catégorie SocioProfessionnelle (CSP) et l’âge du chef de ménage. La sélection des ménages à interroger repose quant à elle sur le principe de la méthode des itinéraires, les ménages étant interrogés à leur lieu de domicile. Cette méthodologie évite ainsi un grand nombre de biais rencontrés avec des échantillons construits sur la base du volontariat. Le questionnaire a été conçu de façon à connaître pour chaque ménage les lieux de consommation, ainsi que leur fréquence de visite, pour 47 familles de produits di¤érentes regroupées sous quatre univers : alimentation, équipement de la personne et hygiène-santé, équipement du ménage, culture-loisirs et services. Au …nal, la base de données se compose d’observations relatives aux divers formats des lieux d’achats (Centre ville, Village, Quartier Montpellier, Marché, Hypermarché, Galerie commerciale, Supermarché, Maxidiscompte, Supérette+, Supérette, Zone commerciale et Autres 53 ), ainsi qu’aux principales caractéristiques des ménages (CSP, âge, revenu, nombre de personnes, etc.). 52 Méthodologie développée par M. MONINO pour la CCI de Montpellier, voir LSA n 1563. 53 La classi…cation entre hypermarché, supermarché, maxidiscompte et supérette repose sur la nomenclature de l’INSEE. Cependant, nous avons décidé de séparer en deux classes les supérettes de telle manière à regrouper ensemble les magasins appartenant à une enseigne dite "supérette", mais dépassant la super…cie maximale de ce format, soit 400m2 . 47 48 33.00 39.55 43.46 41.18 43.17 44.16 44.55 Fromage Autres produits laitiers Epicerie Surgelés & glaces Boissons alcoolisées Boissons non alcoolisées 31.16 Viandes, volailles Poisson, coquillages 23.99 Fruits & légumes 32.91 10.71 Pâtisserie Charcuterie 7.58 Pain Hypermarché 16.64 14.99 14.60 16.05 16.37 15.25 11.30 12.03 11.23 9.74 3.31 4.12 Supermarché 6.90 3.87 5.40 6.64 6.82 5.95 2.19 4.70 4.69 4.43 0.62 0.83 Maxidiscompte 1.01 0.88 0.80 1.33 1.27 1.02 0.42 0.69 0.76 0.67 0.20 0.51 Supérette+ 1.57 0.31 0.17 3.91 3.63 8.86 13.07 7.80 12.83 24.44 0.48 1.11 Marché 13.26 4.58 7.68 18.78 16.64 15.23 15.43 16.42 27.38 28.96 53.91 80.23 Commerce de proximité Tab. A.1: Lieux d’achats des produits alimentaires par format (en %) 6.83 11.58 10.14 6.18 4.78 7.06 7.81 5.41 6.38 5.16 8.32 3.43 Autres 9.24 19.64 18.04 5.94 7.04 7.08 16.78 20.05 5.57 2.60 22.45 2.19 Non concerné 49 Boissons non alcoolisées Boissons alcoolisées Surgelés & glaces Epicerie Autres produits laitiers Fromage Poisson, coquillages Charcuterie Viandes, volailles Fruits & légumes Pâtisserie Pain 46.56 43.50 2 eme 54.85 2 eme 45.93 2 eme 47.79 2 eme choix 46.83 1 er choix choix 52.47 1 er choix choix 49.24 1 er choix choix 43.90 1 er choix choix 42.51 2 eme 45.36 2 eme choix 1 er choix 38.11 1 er choix 41.74 44.00 2 eme choix 2 eme choix 34.30 1 er choix 40.62 31.75 2 eme choix 1 er choix 27.86 1 er choix 47.11 43.15 2 eme choix 2 eme choix 12.84 1 er choix 37.23 35.47 2 eme choix 1 er choix 6.04 1 er choix Hypermarché 12.94 18.92 13.09 19.89 13.57 18.53 12.97 19.48 12.06 18.48 13.27 17.08 11.34 14.53 16.64 15.27 12.18 11.52 13.94 11.41 8.88 3.96 14.96 3.43 Supermarché 7.52 8.17 5.84 4.78 9.42 6.98 7.54 7.45 7.10 7.07 5.94 6.40 3.56 3.78 6.76 6.87 6.69 7.40 6.39 4.13 1.26 0.97 2.02 0.82 1.85 1.81 1.55 1.89 0.76 1.75 1.17 1.76 1.76 1.65 1.70 1.28 1.35 0.44 1.24 0.97 0.65 0.66 1.58 0.57 0.00 0.27 1.16 0.40 Maxidiscompte Supérette+ 4.56 1.53 0.84 0.32 0.64 0.18 6.95 3.79 10.52 3.89 15.72 9.67 16.29 15.64 14.04 10.30 14.15 14.36 23.84 26.10 1.14 0.65 3.03 1.03 Marché 15.78 14.76 10.80 6.73 7.94 8.94 23.03 17.56 17.80 18.93 17.04 17.71 11.88 19.28 12.15 21.59 17.10 26.25 17.43 25.27 34.68 71.36 36.35 85.23 Commerce de proximité Tab. A.2: Parts de marché par format pour les premiers et seconds choix (en %) 9.57 7.98 21.95 13.92 12.83 14.37 4.83 6.07 4.20 4.78 4.60 7.24 8.47 9.10 3.81 6.89 5.22 5.51 5.07 4.66 10.88 9.95 7.01 3.05 Autres B Tableaux Tab. B.1 Première étape des doubles moindres carrés modèle (vi) Variable modèle (vii) modèle (viii) coef. e.t. coef. e.t. coef. e.t. Constante 3.7686 1.8441 3.7823 1.8466 4.1461 1.7247 Nombre de GMS ou GSS < 1.5Km -0.0032 0.0017 -0.0030 0.0017 -0.0030 0.0017 Nombre de concurrents < 0.5Km -0.0231 0.0174 -0.0205 0.0177 -0.0208 0.0176 Nombre de concurrents < 1.5Km 0.0042 0.0030 0.0032 0.0032 0.0031 0.0033 Indice de variété 1.1727 0.2462 1.1541 0.2428 1.1513 0.2409 Taxe professionnelle (en %) -0.1675 0.3876 -0.0771 0.4032 -0.1062 0.4009 Pop. cantonale 0.0716 0.0499 0.0660 0.0478 0.0659 0.0475 Densité de pop. communale -0.0096 0.0093 -0.0073 0.0096 -0.0076 0.0095 % cadre dans le canton -0.0136 0.8453 -0.0861 0.8665 -0.0189 0.8591 Surface 0.0001 0.0000 0.0001 0.0000 0.0001 0.0000 Nb de places de parking -0.0003 0.0001 -0.0003 0.0001 -0.0003 0.0001 Nb de pompes à essence -0.0001 0.0081 0.0018 0.0084 0.0011 0.0083 Moyprix_enseigne1 0.5691 0.1012 0.5714 0.1011 0.5378 0.1029 Moyprix_enseigne2 1.4221 0.3973 1.4228 0.3979 1.3584 0.3717 Moyprix_enseigne3 0.8142 0.3709 0.8146 0.3716 0.7724 0.3704 Moyprix_enseigne4 1.2286 0.0851 1.2278 0.0848 1.1882 0.0871 Moyprix_enseigne5 0.9788 0.0463 0.9774 0.0469 0.9407 0.0477 Moyprix_enseigne6 0.7898 0.1061 0.7903 0.1054 0.7537 0.1051 Moyprix_enseigne7 0.8769 0.0651 0.8771 0.0659 0.8510 0.0643 Moyprix_enseigne8 1.0071 0.0353 1.0072 0.0355 0.9709 0.0370 Moyprix_enseigne9 0.5142 0.1691 0.5128 0.1691 0.4726 0.1577 Moyprix_enseigne10 1.2818 0.0642 1.2806 0.0636 1.2456 0.0643 Moyprix_enseigne11 (maxid.) 0.9865 0.0078 0.9863 0.0079 1.0046 0.0103 Moyprix_enseigne12 0.8277 0.0575 0.8286 0.0587 0.7979 0.0592 Canton 3 -0.3472 0.1375 -0.3079 0.1379 -0.3030 0.1377 Canton 8 -0.1254 0.0882 -0.1067 0.0863 -01086 0.0881 Canton 9 0.1183 0.1121 0.1317 0.1064 0.1315 0.1069 Canton 15 -0.0861 0.1319 -0.0690 0.1283 -0.0672 0.1262 Canton 17 0.0478 0.0602 -0.0004 0.0709 0.0074 0.0730 Caractéristiques concu. par canton R2 Test de Fisher (p-value) 0.95 0.95 0.95 715.18 (0.00) 686.96 (0.00) 540.25 (0.00) Note : les erreurs-type de White sont données à droite des coe¢ cients estimés (e.t.). Toutes les régressions comprennent aussi les variables exogènes détaillées dans le tableau 5. 50 Tab. B.2 Résultats supplémentaires du modèle complet Modèle complet (G1 ) Variable Constante Modèle complet (G1 , G2 ) Modèle complet (vi =0) coef. e.t coef. e.t coef. e.t 2.2347 1.6203 2.1628 1.4310 2.8472 0.3065 Constante v 0.7108 2.1005 0.7245 4.2528 — — Constante nb voiture 1.9380 2.4157 3.5719 2.3763 1.8263 1.1654 -1.2199 0.3657 -1.2425 0.5001 -0.9642 0.0836 Prix Prix v -0.1199 0.2116 -0.1044 0.3114 — — Prix [20 - 29 ans] 1.2798 0.7228 1.1975 0.6924 1.2951 0.1929 Prix [60 ans et +] 0.8887 0.7335 0.8082 0.9869 0.6630 0.2408 Prix revenu [1500 - 3000e] -0.0906 0.9058 -0.2739 0.6773 0.4090 0.1897 Prix revenu > 3000e 0.8398 0.5777 0.7872 0.3687 0.7380 0.1861 Prix nb pers./ménage -0.2651 0.2328 -0.3572 0.3218 -0.2192 0.0831 1.9375 0.8929 3.2554 0.9716 1.7466 0.4391 Surface Surface v -0.6327 2.0121 -0.7399 2.3163 — — Surface [20 - 29 ans] -6.5456 4.4758 -5.3756 3.0086 -6.3791 1.6711 Surface revenu [1500 - 3000e] 1.8262 2.7809 3.2050 1.6358 1.8330 0.8283 Surface travail 3.1930 1.4948 1.9725 2.2321 5.7386 1.1053 -3.0435 1.0463 -4.3544 1.0590 -5.2034 0.3893 0.6194 1.7601 0.6803 1.7847 0.6906 0.2427 -1.6372 1.2563 -0.5374 1.1820 -1.9655 0.8943 0.4496 5.1666 0.5172 5.5937 0.7103 1.1572 1.5260 0.7486 1.8356 0.7752 -0.0594 0.1732 2.3727 3.1889 2.8754 3.2260 3.7456 0.6919 -11.3186 3.3307 -6.6953 3.0225 -10.6240 1.5678 0.6444 0.3211 0.6599 0.3598 0.6081 0.0943 Surface2 Surface2 v Galerie marchande Galerie marchande v Station essence Station essence v Distance Achats groupés R2 pondéré (distance minimale) 0.915 0.68 Notes : les erreurs-type de White sont données à droite des coe¢ cients estimés (e.t.). Toutes les régressions comprennent aussi les variables binaires. 51 0.99 52 0 .0 0 0 3 0 .0 0 0 3 0 .0 0 0 3 0 .0 0 0 3 0 .0 0 0 3 Leader p ric e # 1 Inte rm a rch é #2 N e tto # 1 Ed #1 H yp er #1 0 .0 0 0 3 0 .0 0 0 3 0 .0 0 0 3 0 .0 0 0 3 0 .0 0 0 3 0 .0 0 0 3 Inte rm a rch é #3 M a rch é U #1 Inte rm a rch é #4 E c o m a rch é #1 C a rre fo u r #1 A u ch a n #1 0 .0 0 0 7 0 .0 0 0 7 0 .0 0 0 7 0 .0 0 0 7 0 .0 0 0 7 0 .0 0 0 7 0 .0 0 0 7 0 .0 0 0 7 0 .0 0 0 7 0 .0 0 0 7 0 .0 0 0 7 -1 .2 2 4 0 0 .0 0 0 7 0 .0 0 1 1 0 .0 0 1 1 0 .0 0 1 1 0 .0 0 1 1 0 .0 0 1 1 0 .0 0 1 1 0 .0 0 1 1 0 .0 0 1 1 0 .0 0 1 1 0 .0 0 1 1 -1 .3 7 2 4 0 .0 0 1 1 0 .0 0 1 1 0 .0 0 0 1 0 .0 0 0 1 0 .0 0 0 1 0 .0 0 0 1 0 .0 0 0 1 0 .0 0 0 1 0 .0 0 0 1 0 .0 0 0 1 0 .0 0 0 1 -1 .1 9 9 9 0 .0 0 0 1 0 .0 0 0 1 0 .0 0 0 1 Inte rm a rch é N e tto # 1 #2 0 .0 0 1 5 0 .0 0 1 5 0 .0 0 1 5 0 .0 0 1 5 0 .0 0 1 5 0 .0 0 1 5 0 .0 0 1 5 0 .0 0 1 5 -1 .0 9 2 5 0 .0 0 1 5 0 .0 0 1 5 0 .0 0 1 5 0 .0 0 1 5 Ed #1 0 .0 0 4 7 0 .0 0 4 7 0 .0 0 4 7 0 .0 0 4 7 0 .0 0 4 7 0 .0 0 4 7 0 .0 0 4 7 -1 .3 1 5 5 0 .0 0 4 7 0 .0 0 4 7 0 .0 0 4 7 0 .0 0 4 7 0 .0 0 4 7 H yp er #1 U 0 .0 0 3 4 0 .0 0 3 4 0 .0 0 3 4 0 .0 0 3 4 0 .0 0 3 4 0 .0 0 3 4 -1 .3 3 4 6 0 .0 0 3 4 0 .0 0 3 4 0 .0 0 3 4 0 .0 0 3 4 0 .0 0 3 4 0 .0 0 3 4 C h a m p io n #1 0 .0 0 6 5 0 .0 0 6 5 0 .0 0 6 5 0 .0 0 6 5 0 .0 0 6 5 -1 .3 0 9 0 0 .0 0 6 5 0 .0 0 6 5 0 .0 0 6 5 0 .0 0 6 5 0 .0 0 6 5 0 .0 0 6 5 0 .0 0 6 5 0 .0 0 1 7 0 .0 0 1 7 0 .0 0 1 7 0 .0 0 1 7 -1 .7 4 9 1 0 .0 0 1 7 0 .0 0 1 7 0 .0 0 1 7 0 .0 0 1 7 0 .0 0 1 7 0 .0 0 1 7 0 .0 0 1 7 0 .0 0 1 7 Inte rm a rch é M a rch é U #3 #1 L a c e llu le (i; j) s’inte rp rè te c o m m e la va ria tio n e n % d e la p a rt d e m a rch é d e i p o u r u n e va ria tio n d e 1 % d u p rix d e j. 0 .0 0 0 3 C h a m p io n #1 U -1 .3 7 5 1 Inte rm a rch é #1 Inte rm a rch é L e a d e r #1 p ric e # 1 0 .0 0 9 0 0 .0 0 9 0 0 .0 0 9 0 -1 .3 1 1 2 0 .0 0 9 0 0 .0 0 9 0 0 .0 0 9 0 0 .0 0 9 0 0 .0 0 9 0 0 .0 0 9 0 0 .0 0 9 0 0 .0 0 9 0 0 .0 0 9 0 0 .0 0 0 8 0 .0 0 0 8 -1 .8 1 1 8 0 .0 0 0 8 0 .0 0 0 8 0 .0 0 0 8 0 .0 0 0 8 0 .0 0 0 8 0 .0 0 0 8 0 .0 0 0 8 0 .0 0 0 8 0 .0 0 0 8 0 .0 0 0 8 Inte rm a rch é E c o m a rch é #4 #1 Tab. B.3: Médiane des élasticités-prix pour le modèle MNL (Echantillon) 0 .1 0 1 2 0 .1 0 1 2 0 .1 0 1 2 -1 .1 9 3 8 0 .1 0 1 2 . . . . . . . . . . . . 0 .1 0 1 2 . . . . . . 0 .1 0 1 2 . . . 0 .1 0 1 2 0 .1 0 1 2 . . . . . . 0 .1 0 1 2 . . . 0 .1 0 1 2 0 .1 0 1 2 . . . . . . 0 .1 0 1 2 C a rre fo u r #1 . . . . . . -1 .2 8 0 8 0 .0 4 3 6 0 .0 4 3 6 0 .0 4 3 6 0 .0 4 3 6 0 .0 4 3 6 0 .0 4 3 6 0 .0 4 3 6 0 .0 4 3 6 0 .0 4 3 6 0 .0 4 3 6 0 .0 4 3 6 0 .0 4 3 6 A u ch a n #1 53 0 .0 0 0 4 0 .0 0 0 4 0 .0 0 0 7 0 .0 0 0 7 0 .0 0 0 4 Leader p ric e # 1 Inte rm a rch é #2 N e tto # 1 Ed #1 H yp er #1 0 .0 0 1 6 0 .0 0 3 2 0 .0 0 1 5 0 .0 0 0 1 0 .0 0 0 1 0 .0 0 0 1 Inte rm a rch é #3 M a rch é U #1 Inte rm a rch é #4 E c o m a rch é #1 C a rre fo u r #1 A u ch a n #1 0 .0 0 0 1 0 .0 0 0 1 0 .0 0 0 1 0 .0 0 3 3 0 .0 0 1 3 0 .0 0 0 5 0 .0 0 3 7 0 .0 0 1 5 0 .0 1 5 7 0 .0 1 4 8 0 .0 0 7 8 -2 .6 8 9 6 0 .0 0 1 9 0 .0 0 0 1 0 .0 0 0 1 0 .0 0 0 1 0 .0 0 5 1 0 .0 1 9 2 0 .0 0 2 8 0 .0 1 2 2 0 .0 0 1 3 0 .0 1 5 6 0 .0 2 0 1 -2 .3 3 1 5 0 .0 1 1 3 0 .0 0 2 2 0 .0 0 0 1 0 .0 0 0 1 0 .0 0 0 1 0 .0 0 0 4 0 .0 0 3 0 0 .0 0 0 5 0 .0 0 0 6 0 .0 0 0 1 0 .0 0 3 6 -1 .8 7 7 2 0 .0 0 2 3 0 .0 0 2 1 0 .0 0 0 6 Inte rm a rch é N e tto # 1 #2 0 .0 0 0 1 0 .0 0 0 1 0 .0 0 0 1 0 .0 0 6 1 0 .0 0 2 1 0 .0 0 1 8 0 .0 0 8 6 0 .0 0 0 9 -1 .8 5 0 8 0 .0 4 0 1 0 .0 2 5 8 0 .0 2 1 9 0 .0 0 7 4 Ed #1 0 .0 0 6 6 0 .0 0 7 5 0 .0 0 0 1 0 .0 7 4 2 0 .0 0 2 7 0 .0 2 1 7 0 .1 3 0 6 -7 .9 2 4 7 0 .0 0 2 0 0 .0 0 2 1 0 .0 0 6 2 0 .0 0 9 0 0 .0 0 4 4 H yp er #1 U 0 .0 0 0 1 0 .0 0 0 1 0 .0 0 0 1 0 .2 1 2 6 0 .0 2 6 7 0 .0 7 3 1 -4 .2 0 8 4 0 .0 8 7 2 0 .0 1 4 8 0 .0 2 3 5 0 .0 3 3 3 0 .0 1 3 0 0 .0 4 8 3 C h a m p io n #1 0 .0 0 0 1 0 .0 0 0 1 0 .0 0 0 1 0 .0 2 6 7 0 .2 8 3 8 -3 .0 8 4 5 0 .1 6 3 6 0 .0 4 2 4 0 .0 1 0 7 0 .0 2 1 8 0 .0 1 9 9 0 .0 0 3 8 0 .0 2 7 8 0 .0 0 0 1 0 .0 0 0 1 0 .0 0 0 1 0 .0 0 0 1 -0 .6 5 6 6 0 .0 7 5 8 0 .0 1 1 5 0 .0 0 1 2 0 .0 0 1 3 0 .0 3 5 1 0 .0 3 1 1 0 .0 0 1 0 0 .0 2 3 8 Inte rm a rch é M a rch é U #3 #1 L a c e llu le (i; j) s’inte rp rè te c o m m e la va ria tio n e n % d e la p a rt d e m a rch é d e i p o u r u n e va ria tio n d e 1 % d u p rix d e j. 0 .0 0 6 7 C h a m p io n #1 U -1 .4 6 7 7 Inte rm a rch é #1 Inte rm a rch é L e a d e r #1 p ric e # 1 0 .0 0 0 1 0 .0 0 0 1 0 .0 0 0 1 -2 .1 9 5 7 0 .0 0 0 1 0 .0 3 6 7 0 .5 8 0 6 0 .1 3 3 7 0 .0 2 5 9 0 .0 2 6 6 0 .0 4 6 1 0 .0 2 8 6 0 .0 5 7 5 0 .0 0 0 1 0 .0 0 0 1 -0 .2 6 5 6 0 .0 0 0 1 0 .0 0 0 1 0 .0 0 0 1 0 .0 0 0 1 0 .0 0 0 1 0 .0 0 0 1 0 .0 0 0 1 0 .0 0 0 1 0 .0 0 0 1 0 .0 0 0 1 Inte rm a rch é E c o m a rch é #4 #1 Tab. B.4: Médiane des élasticités-prix pour le modèle complet (Echantillon) 0 .0 0 0 1 0 .0 0 0 5 0 .0 0 0 1 -4 .4 4 5 6 6 .4 5 2 7 . . . . . . . . . . . . 0 .1 9 1 0 . . . . . . 0 .0 0 0 1 . . . 0 .0 0 0 3 0 .0 0 0 1 . . . . . . 0 .0 0 0 1 . . . 0 .0 0 1 3 0 .0 0 0 1 . . . . . . 0 .0 0 0 1 C a rre fo u r #1 . . . . . . -8 .6 8 2 1 2 .6 3 7 7 0 .0 0 0 1 0 .0 0 0 3 0 .0 0 0 1 0 .0 0 0 3 0 .0 0 0 6 0 .0 6 8 4 0 .0 0 0 1 0 .0 0 0 1 0 .0 0 0 1 0 .0 0 0 1 0 .0 0 0 1 A u ch a n #1