Prix d`une voiture

Transcription

Prix d`une voiture
EXERCICE DE REGRESSION MULTIPLE
PRIX D’UNE VOITURE EN 1993
Le service Marketing d’un constructeur automobile souhaite construire un modèle de « prix
marché » d’une voiture. Pour cela 24 modèles de voiture ont été sélectionnés. On trouve dans
le tableau 1 les variables Prix, Puissance, Origine et Confort de ces 24 modèles.
Tableau 1 : Modèles 1993
Numéro
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
Modèle
Alfa Roméo 33 1.5 i.e.
BMW 318 is
Citroën ZX Furio 1.8i
Citroën XM Turbo CT
Fiat Uno 70 sx i.e.
Fiat Croma i.e.
Ford Escort 1.8 success
Ford Sierra 2.0i Ghia
Honda Civic 1.6 ES i
Honda Accord 2.0 EX
Lancia Dedra 1.8 i.e.
Mazda 626 1.8 GLX i
Mercedes 190 E 2.3
Mitsubishi Galant 2.0 GLS i
Nissan Primera 1.6 SLX
Opel Astra 1.6 i CD
Opel Vectra 2.0i GT 16v
Peugeot 106 XR 1.1
Peugeot 405 Sri
Renault Clio RT 1.7
Renault Safrane RT 2.2 Si
Toyota Corolla L/B 1.3 Gi
Volkswagen Golf GL 90
Volkswagen Passat GL 115
Prix
Puissance
Origine
87 600
97 Italie
158 300
140 Allemagne
89 000
103 France
193 200
145 France
71 000
71 Italie
119 900
115 Italie
87 300
105 Allemagne
118 800
125 Allemagne
108 166
125 Japon
119 160
111 Japon
107 700
110 Italie
120 990
105 Japon
184 600
132 Allemagne
118 000
108 Japon
99 900
95 Japon
99 600
100 Allemagne
137 800
129 Allemagne
65 000
60 France
118 300
121 France
83 800
92 France
172 000
140 France
96 450
88 Japon
101 250
90 Allemagne
130 100
115 Allemagne
Confort
Moyen
Très bon
Moyen
Très bon
Moyen
Moyen
Moyen
Bon
Moyen
Très bon
Très bon
Très bon
Très bon
Très bon
Très bon
Bon
Très bon
Moyen
Bon
Bon
Très bon
Bon
Bon
Très bon
Nous allons construire un modèle de régression reliant le prix d’un modèle à sa puissance, au
pays d’origine et au confort. Pour intégrer une variable qualitative dans un modèle de
régression, il faut tout d’abord associer à chacune de ses modalités la variable indicatrice de
cette modalité. Notons Alle, Fran, Ital, Japo les variables indicatrices des pays représentés et
Moy, Bien, TB les variables indicatrices des niveaux de confort. Le nouveau tableau associé
aux variables qualitatives apparaît dans le tableau 2.
On remarque tout d’abord que les variables indicatrices associées aux modalités d’une même
variable qualitative sont liées entre elles :
-
Alle + Fran + Ital + Japo = 1
Moy + Bon +TB = 1
Tableau 2 : Variables indicatrices associées aux variables qualitatives
MODELE
____________________
ALFA ROMEO 33
BMW 318
CITROEN ZX FURIO
CITROEN XM TURBO
FIAT UNO
FIAT CROMA
FORD ESCORT
FORD SIERRA
HONDA CIVIC
HONDA ACCORD
LANCIA DEDRA
MAZDA 626
MERCEDES 190
MITSUBISHI GALANT
NISSAN PRIMERA
OPEL ASTRA
OPEL VECTRA
PEUGEOT 106
PEUGEOT 405
RENAULT CLIO
RENAULT SAFRANE
TOYOTA COROLLA
VOLKSWAGEN GOLF
VOLSWAGEN PASSAT
ALLE
________
FRAN
________
ITAL
________
JAPO
________
MOY
________
BON
________
TB
________
0
1
0
0
0
0
1
1
0
0
0
0
1
0
0
1
1
0
0
0
0
0
1
1
0
0
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
0
0
0
1
0
0
0
1
1
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
0
1
0
1
1
0
0
0
0
0
0
1
0
0
1
0
1
0
1
1
1
0
1
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
1
0
0
1
1
0
1
1
0
0
1
0
1
0
0
0
0
0
1
1
1
1
1
1
0
1
0
0
0
1
0
0
1
Par conséquent on peut supprimer une variable indicatrice par variable qualitative sans perdre
d’information. Un modèle vérifiant Alle = Fran = Ital = 0 est japonaise. De même un modèle
vérifiant Bien = TB = 0 est d’un confort moyen. Nous décidons ici de supprimer les variables
indicatrices Japo et Moy.
Votre patron ne connaît rien en statistique, vous devez lui répondre avec des termes qu’il
comprend.
1.
2.
3.
4.
5.
6.
7.
Votre patron se rappelle de la régression simple et veut construire un modèle
expliquant le prix par la puissance. Etudier ce modèle (modèle (1) en annexe 1).
Etudiez maintenant le modèle complet : prix en fonction de puissance, Alle, Fran,
Ital, Bon et TB (modèle (2) en annexe 2).
En voyant les résultats du modèle (2) votre patron dit que les voitures françaises
sont plus chères que les autres. Pourquoi dit-il cela, et que devez vous lui
répondre ?
On applique la méthode pas à pas descendante (backward method). Les résultats
sont données en annexe 3 (modèle (3)). Expliquez ce qu’est la méthode pas à pas
descendante. Comparer les différents modèles (1, 2 et 3).
A partir du modèle (3) écrire les deux modèles correspondant aux voitures ayant
un confort moyen/bon d’une part et aux voitures ayant un confort TB d’autre part.
Tracer les deux droites correspondant à ces modèles sur la figure 1.
La figure 2 représente les deux droites de régression qui correspondent au confort
= moyen/bon et confort = TB. Expliquer pourquoi ces représentation suggèrent un
modèle de la forme : Prix = b0 + b1Puissance + b2TB + b3Puissance*TB +ε
Les résultats pour ce modèle sont donnés en annexe 4. Etudier le modèle et écrire
les modèles séparément pour les voitures de Confort = Moy/Bien et Confort = TB.
La Renault 19 RT a une puissance de 95cv et un bon confort. Calculer un
intervalle de prévision à 95% du prix de ce modèle. Le prix de vente de ce modèle
étant de 99 500 F, peut-on considérer qu’il a été vendu à un juste prix ?
ANNEXE 1
Etude du modèle (1)
Model
1
R
R Square
,881(a)
,776
Adjusted R
Square
,766
Std. Error of
the Estimate
16158,894
a Predictors: (Constant), Puissance
Coefficients(a)
Model
1
Standardize
d
Coefficients
Unstandardized
Coefficients
(Constant)
Puissance
B
-35535,110
Std. Error
17700,836
t
Sig.
Beta
-2,008
,057
8,723
,000
1388,543
159,184
,881
a Dependent Variable: Prix
Case Summaries(a)
Modèle
Prix
Unstandardized
Predicted Value
Standardized
Residual
1
Alfa Roméo 33 1.5 i.e.
87600
99153,52008
-0,71499
2
3
BMW 318 is
Citroën ZX Furio 1.8i
158300
89000
158860,851
107484,7756
-0,03471
-1,14394
4
5
Citroën XM Turbo CT
Fiat Uno 70 sx i.e.
193200
71000
165803,5639
63051,41304
1,69544
0,4919
6
7
Fiat Croma i.e.
Ford Escort 1.8 success
119900
87300
124147,2865
110261,8607
-0,26285
-1,421
8
9
Ford Sierra 2.0i Ghia
Honda Civic 1.6 ES i
118800
108166
138032,7123
138032,7123
-1,19022
-1,84831
10
11
Honda Accord 2.0 EX
Lancia Dedra 1.8 i.e.
119160
107700
118593,1162
117204,5736
0,03508
-0,58819
12
13
14
15
Mazda 626 1.8 GLX i
Mercedes 190 E 2.3
Mitsubishi Galant 2.0 GLS i
Nissan Primera 1.6 SLX
120990
184600
118000
99900
110261,8607
147752,5103
114427,4884
96376,43492
0,66392
2,28032
0,22109
0,21806
16
17
Opel Astra 1.6 i CD
Opel Vectra 2.0i GT 16v
99600
137800
103319,1478
143586,8826
-0,23016
-0,35812
18
19
Peugeot 106 XR 1.1
Peugeot 405 Sri
65000
118300
47777,44468
132478,542
1,06583
-0,87745
20
21
Renault Clio RT 1.7
Renault Safrane RT 2.2 Si
83800
172000
92210,80719
158860,851
-0,52051
0,81312
22
23
Toyota Corolla L/B 1.3 Gi
Volkswagen Golf GL 90
96450
101250
86656,63687
89433,72203
0,60607
0,73126
130100
124147,2865
0,36839
24
Volkswagen Passat GL 115
Total N
24
24
24
24
ANNEXE 2
Etude du modèle (2)
Model Summary(b)
Model
1
R
,929(a)
R Square
,863
Adjusted R
Square
,815
Std. Error of
the Estimate
14360,782
a Predictors: (Constant), TB, Alle, Ital, Puissance, Fran, Bon
b Dependent Variable: Prix
Model
1
Sum of Squares
22106068305,533
Regression
Residual
Total
df
6
Mean Square
3684344717,589
3505944989,801
17
206232058,224
25612013295,334
23
F
17,865
Sig.
,000(a)
a Predictors: (Constant), TB, Alle, Ital, Puissance, Fran, Bon
b Dependent Variable: Prix
Coefficients(a)
Unstandardized
Coefficients
Model
1
Standardized
Coefficients
(Constant)
B
-19286,854
Std. Error
18118,463
Puissance
1056,299
178,297
,670
Alle
7581,751
8354,981
Fran
12414,635
8822,265
Ital
5501,620
Bon
5944,407
TB
t
Sig.
Beta
-1,064
,302
5,924
,000
,109
,907
,377
,165
1,407
,177
10232,589
,063
,538
,598
8978,917
,079
,662
,517
,400
2,983
,008
26215,444
8787,250
a Dependent Variable: Prix
Modèle (2)
Modèle
Prix
1 Alfa Roméo 33 1.5 i.e.
87600
2 BMW 318 is
158300
3 Citroën ZX Furio 1.8i
89000
4 Citroën XM Turbo CT
193200
5 Fiat Uno 70 sx i.e.
71000
6 Fiat Croma i.e.
119900
7 Ford Escort 1.8 success
87300
8 Ford Sierra 2.0i Ghia
118800
9 Honda Civic 1.6 ES i
108166
10 Honda Accord 2.0 EX
119160
11 Lancia Dedra 1.8 i.e.
107700
12 Mazda 626 1.8 GLX i
120990
13 Mercedes 190 E 2.3
184600
14 Mitsubishi Galant 2.0 GLS i
118000
15 Nissan Primera 1.6 SLX
99900
16 Opel Astra 1.6 i CD
99600
17 Opel Vectra 2.0i GT 16v
137800
18 Peugeot 106 XR 1.1
65000
19 Peugeot 405 Sri
118300
20 Renault Clio RT 1.7
83800
21 Renault Safrane RT 2.2 Si
172000
22 Toyota Corolla L/B 1.3 Gi
96450
23 Volkswagen Golf GL 90
101250
24 Volkswagen Passat GL 115 130100
Total
24
24
Unstandardized
Predicted Value
88675,76527
162392,1954
101926,5738
172506,574
61211,99243
107689,1465
99206,28784
126276,674
112750,5155
124177,7743
128623,0958
117839,9806
153941,8038
121008,8774
107276,991
99869,20007
150772,9069
56505,71868
126884,362
96251,69227
167225,0793
79611,86119
89306,21052
135984,7215
24
Unstandardized Residual
-1075,765273
-4092,195413
-12926,57377
20693,42597
9788,007571
12210,85353
-11906,28784
-7476,673961
-4584,515535
-5017,77429
-20923,09583
3150,019443
30658,19623
-3008,877423
-7376,991002
-269,200073
-12972,9069
8494,281317
-8584,361983
-12451,69227
4774,920743
16838,13881
11943,78948
-5884,721525
24
ANNEXE 3
Méthode pas à pas descendante (modèle (3)
Model Summary(f)
Model
1
R
,929(a)
R Square
,863
Adjusted R
Square
,815
Std. Error of
the Estimate
14360,782
2
,928(b)
,861
,822
14074,329
3
,927(c)
,859
,829
13801,672
4
,923(d)
,851
,829
13795,329
5
,917(e)
,842
,827
13893,913
Coefficients(a)
Unstandardized
Coefficients
Model
1
2
(Constant)
B
-19286,854
Std. Error
18118,463
Puissance
1056,299
178,297
,670
Alle
7581,751
8354,981
Fran
12414,635
8822,265
Ital
5501,620
Bon
5944,407
TB
Beta
,302
,000
,109
,907
,377
,165
1,407
,177
10232,589
,063
,538
,598
8978,917
,079
,662
,517
26215,444
8787,250
,400
2,983
,008
(Constant)
-16503,408
17016,765
-,970
,345
Puissance
1060,955
174,534
,673
6,079
,000
Alle
5762,965
7487,141
,083
,770
,451
Fran
10260,704
4310,326
24422,206
7703,440
8280,366
7967,515
,136
,057
,372
1,332
,521
3,065
,199
,609
,007
(Constant)
-15160,742
16494,296
-,919
,370
Puissance
1061,760
171,146
,673
6,204
,000
Alle
6936,635
7001,274
,100
,991
,334
Fran
10928,901
7448,590
,145
1,467
,159
22433,950
-17960,281
1121,863
7550,683
6856,848
16242,997
159,961
6619,301
,342
,712
,100
3,272
-1,106
7,013
1,141
,004
,282
,000
,267
21103,092
6720,898
,322
3,140
,005
-17789,920
1143,526
19686,381
16358,381
159,965
6652,352
,725
,300
-1,088
7,149
2,959
,289
,000
,007
(Constant)
Puissance
Fran
TB
5
Sig.
5,924
TB
4
t
-1,064
Bon
TB
3
Standardized
Coefficients
(Constant)
Puissance
TB
a Dependent Variable: Prix
Figure 1 : représentation du modèle (3)
Confort
Moyen/bon
TB
200000
175000
Prix
150000
125000
100000
75000
75
100
Puissance
125
150
Figure 2 : droites de régression simple par sous-groupes
Confort
200000
Moyen/bon
TB
Moyen/bon
TB
175000
Prix
150000
125000
100000
75000
75
100
Puissance
125
150
ANNEXE 4
Régression du prix en fonction de puissance, TB et puissance*TB
Model
1
Regression
Residual
Total
Sum of Squares
23214722126,485
df
3
Mean Square
7738240708,829
2397291168,849
20
119864558,442
25612013295,334
23
F
64,558
Sig.
,000(a)
a Predictors: (Constant), puissTB, Puissance, TB
b Dependent Variable: Prix
Coefficients(a)
Unstandardized
Coefficients
Model
1
Standardized
Coefficients
t
Sig.
(Constant)
B
18406,093
Std. Error
16154,174
1,139
,268
Puissance
779,324
159,645
,494
4,882
,000
-89409,255
29810,469
-1,364
-2,999
,007
967,131
260,151
1,812
a Dependent Variable: Prix
3,718
,001
TB
puissTB
Modèle
Prix
1 Alfa Roméo 33 1.5 i.e.
2 BMW 318 is
3 Citroën ZX Furio 1.8i
4 Citroën XM Turbo CT
5 Fiat Uno 70 sx i.e.
6 Fiat Croma i.e.
7 Ford Escort 1.8 success
8 Ford Sierra 2.0i Ghia
9 Honda Civic 1.6 ES i
10 Honda Accord 2.0 EX
11 Lancia Dedra 1.8 i.e.
12 Mazda 626 1.8 GLX i
13 Mercedes 190 E 2.3
14 Mitsubishi Galant 2.0 GLS i
15 Nissan Primera 1.6 SLX
16 Opel Astra 1.6 i CD
17 Opel Vectra 2.0i GT 16v
18 Peugeot 106 XR 1.1
19 Peugeot 405 Sri
20 Renault Clio RT 1.7
21 Renault Safrane RT 2.2 Si
22 Toyota Corolla L/B 1.3 Gi
23 Volkswagen Golf GL 90
24 Volkswagen Passat GL 115
Total
24
Beta
Unstandardized
Predicted Value
Standardized Residual
87600
94000,53474
-0,584616225
158300
173500,4992
-1,38839313
89000
98676,47959
-0,883836616
193200
182232,7728
1,001731765
71000
73738,10707
-0,250095013
119900
108028,3693
1,084338765
87300
100235,1279
-1,181477163
118800
115821,6107
0,272042069
108166
115821,6107
-0,699253173
119160
122853,3123
-0,337342174
107700
121106,8576
-1,224564321
120990
112374,584
0,786920497
184600
159528,8614
2,289964038
118000
117613,9482
0,035261455
99900
94910,0368
0,45577652
99600
96338,50716
0,297900364
137800
154289,4973
-1,506128479
65000
65165,54151
-0,015120339
118300
112704,3141
0,511102413
83800
90103,91403
-0,57579102
172000
173500,4992
-0,137053577
96450
86986,61747
0,864372618
101250
88545,26575
1,16043332
130100
129839,1312
0,023827405
24
24
24