Prix d`une voiture
Transcription
Prix d`une voiture
EXERCICE DE REGRESSION MULTIPLE PRIX D’UNE VOITURE EN 1993 Le service Marketing d’un constructeur automobile souhaite construire un modèle de « prix marché » d’une voiture. Pour cela 24 modèles de voiture ont été sélectionnés. On trouve dans le tableau 1 les variables Prix, Puissance, Origine et Confort de ces 24 modèles. Tableau 1 : Modèles 1993 Numéro 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Modèle Alfa Roméo 33 1.5 i.e. BMW 318 is Citroën ZX Furio 1.8i Citroën XM Turbo CT Fiat Uno 70 sx i.e. Fiat Croma i.e. Ford Escort 1.8 success Ford Sierra 2.0i Ghia Honda Civic 1.6 ES i Honda Accord 2.0 EX Lancia Dedra 1.8 i.e. Mazda 626 1.8 GLX i Mercedes 190 E 2.3 Mitsubishi Galant 2.0 GLS i Nissan Primera 1.6 SLX Opel Astra 1.6 i CD Opel Vectra 2.0i GT 16v Peugeot 106 XR 1.1 Peugeot 405 Sri Renault Clio RT 1.7 Renault Safrane RT 2.2 Si Toyota Corolla L/B 1.3 Gi Volkswagen Golf GL 90 Volkswagen Passat GL 115 Prix Puissance Origine 87 600 97 Italie 158 300 140 Allemagne 89 000 103 France 193 200 145 France 71 000 71 Italie 119 900 115 Italie 87 300 105 Allemagne 118 800 125 Allemagne 108 166 125 Japon 119 160 111 Japon 107 700 110 Italie 120 990 105 Japon 184 600 132 Allemagne 118 000 108 Japon 99 900 95 Japon 99 600 100 Allemagne 137 800 129 Allemagne 65 000 60 France 118 300 121 France 83 800 92 France 172 000 140 France 96 450 88 Japon 101 250 90 Allemagne 130 100 115 Allemagne Confort Moyen Très bon Moyen Très bon Moyen Moyen Moyen Bon Moyen Très bon Très bon Très bon Très bon Très bon Très bon Bon Très bon Moyen Bon Bon Très bon Bon Bon Très bon Nous allons construire un modèle de régression reliant le prix d’un modèle à sa puissance, au pays d’origine et au confort. Pour intégrer une variable qualitative dans un modèle de régression, il faut tout d’abord associer à chacune de ses modalités la variable indicatrice de cette modalité. Notons Alle, Fran, Ital, Japo les variables indicatrices des pays représentés et Moy, Bien, TB les variables indicatrices des niveaux de confort. Le nouveau tableau associé aux variables qualitatives apparaît dans le tableau 2. On remarque tout d’abord que les variables indicatrices associées aux modalités d’une même variable qualitative sont liées entre elles : - Alle + Fran + Ital + Japo = 1 Moy + Bon +TB = 1 Tableau 2 : Variables indicatrices associées aux variables qualitatives MODELE ____________________ ALFA ROMEO 33 BMW 318 CITROEN ZX FURIO CITROEN XM TURBO FIAT UNO FIAT CROMA FORD ESCORT FORD SIERRA HONDA CIVIC HONDA ACCORD LANCIA DEDRA MAZDA 626 MERCEDES 190 MITSUBISHI GALANT NISSAN PRIMERA OPEL ASTRA OPEL VECTRA PEUGEOT 106 PEUGEOT 405 RENAULT CLIO RENAULT SAFRANE TOYOTA COROLLA VOLKSWAGEN GOLF VOLSWAGEN PASSAT ALLE ________ FRAN ________ ITAL ________ JAPO ________ MOY ________ BON ________ TB ________ 0 1 0 0 0 0 1 1 0 0 0 0 1 0 0 1 1 0 0 0 0 0 1 1 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 0 0 0 1 0 0 0 1 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 1 0 1 1 0 0 0 0 0 0 1 0 0 1 0 1 0 1 1 1 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 1 1 0 1 1 0 0 1 0 1 0 0 0 0 0 1 1 1 1 1 1 0 1 0 0 0 1 0 0 1 Par conséquent on peut supprimer une variable indicatrice par variable qualitative sans perdre d’information. Un modèle vérifiant Alle = Fran = Ital = 0 est japonaise. De même un modèle vérifiant Bien = TB = 0 est d’un confort moyen. Nous décidons ici de supprimer les variables indicatrices Japo et Moy. Votre patron ne connaît rien en statistique, vous devez lui répondre avec des termes qu’il comprend. 1. 2. 3. 4. 5. 6. 7. Votre patron se rappelle de la régression simple et veut construire un modèle expliquant le prix par la puissance. Etudier ce modèle (modèle (1) en annexe 1). Etudiez maintenant le modèle complet : prix en fonction de puissance, Alle, Fran, Ital, Bon et TB (modèle (2) en annexe 2). En voyant les résultats du modèle (2) votre patron dit que les voitures françaises sont plus chères que les autres. Pourquoi dit-il cela, et que devez vous lui répondre ? On applique la méthode pas à pas descendante (backward method). Les résultats sont données en annexe 3 (modèle (3)). Expliquez ce qu’est la méthode pas à pas descendante. Comparer les différents modèles (1, 2 et 3). A partir du modèle (3) écrire les deux modèles correspondant aux voitures ayant un confort moyen/bon d’une part et aux voitures ayant un confort TB d’autre part. Tracer les deux droites correspondant à ces modèles sur la figure 1. La figure 2 représente les deux droites de régression qui correspondent au confort = moyen/bon et confort = TB. Expliquer pourquoi ces représentation suggèrent un modèle de la forme : Prix = b0 + b1Puissance + b2TB + b3Puissance*TB +ε Les résultats pour ce modèle sont donnés en annexe 4. Etudier le modèle et écrire les modèles séparément pour les voitures de Confort = Moy/Bien et Confort = TB. La Renault 19 RT a une puissance de 95cv et un bon confort. Calculer un intervalle de prévision à 95% du prix de ce modèle. Le prix de vente de ce modèle étant de 99 500 F, peut-on considérer qu’il a été vendu à un juste prix ? ANNEXE 1 Etude du modèle (1) Model 1 R R Square ,881(a) ,776 Adjusted R Square ,766 Std. Error of the Estimate 16158,894 a Predictors: (Constant), Puissance Coefficients(a) Model 1 Standardize d Coefficients Unstandardized Coefficients (Constant) Puissance B -35535,110 Std. Error 17700,836 t Sig. Beta -2,008 ,057 8,723 ,000 1388,543 159,184 ,881 a Dependent Variable: Prix Case Summaries(a) Modèle Prix Unstandardized Predicted Value Standardized Residual 1 Alfa Roméo 33 1.5 i.e. 87600 99153,52008 -0,71499 2 3 BMW 318 is Citroën ZX Furio 1.8i 158300 89000 158860,851 107484,7756 -0,03471 -1,14394 4 5 Citroën XM Turbo CT Fiat Uno 70 sx i.e. 193200 71000 165803,5639 63051,41304 1,69544 0,4919 6 7 Fiat Croma i.e. Ford Escort 1.8 success 119900 87300 124147,2865 110261,8607 -0,26285 -1,421 8 9 Ford Sierra 2.0i Ghia Honda Civic 1.6 ES i 118800 108166 138032,7123 138032,7123 -1,19022 -1,84831 10 11 Honda Accord 2.0 EX Lancia Dedra 1.8 i.e. 119160 107700 118593,1162 117204,5736 0,03508 -0,58819 12 13 14 15 Mazda 626 1.8 GLX i Mercedes 190 E 2.3 Mitsubishi Galant 2.0 GLS i Nissan Primera 1.6 SLX 120990 184600 118000 99900 110261,8607 147752,5103 114427,4884 96376,43492 0,66392 2,28032 0,22109 0,21806 16 17 Opel Astra 1.6 i CD Opel Vectra 2.0i GT 16v 99600 137800 103319,1478 143586,8826 -0,23016 -0,35812 18 19 Peugeot 106 XR 1.1 Peugeot 405 Sri 65000 118300 47777,44468 132478,542 1,06583 -0,87745 20 21 Renault Clio RT 1.7 Renault Safrane RT 2.2 Si 83800 172000 92210,80719 158860,851 -0,52051 0,81312 22 23 Toyota Corolla L/B 1.3 Gi Volkswagen Golf GL 90 96450 101250 86656,63687 89433,72203 0,60607 0,73126 130100 124147,2865 0,36839 24 Volkswagen Passat GL 115 Total N 24 24 24 24 ANNEXE 2 Etude du modèle (2) Model Summary(b) Model 1 R ,929(a) R Square ,863 Adjusted R Square ,815 Std. Error of the Estimate 14360,782 a Predictors: (Constant), TB, Alle, Ital, Puissance, Fran, Bon b Dependent Variable: Prix Model 1 Sum of Squares 22106068305,533 Regression Residual Total df 6 Mean Square 3684344717,589 3505944989,801 17 206232058,224 25612013295,334 23 F 17,865 Sig. ,000(a) a Predictors: (Constant), TB, Alle, Ital, Puissance, Fran, Bon b Dependent Variable: Prix Coefficients(a) Unstandardized Coefficients Model 1 Standardized Coefficients (Constant) B -19286,854 Std. Error 18118,463 Puissance 1056,299 178,297 ,670 Alle 7581,751 8354,981 Fran 12414,635 8822,265 Ital 5501,620 Bon 5944,407 TB t Sig. Beta -1,064 ,302 5,924 ,000 ,109 ,907 ,377 ,165 1,407 ,177 10232,589 ,063 ,538 ,598 8978,917 ,079 ,662 ,517 ,400 2,983 ,008 26215,444 8787,250 a Dependent Variable: Prix Modèle (2) Modèle Prix 1 Alfa Roméo 33 1.5 i.e. 87600 2 BMW 318 is 158300 3 Citroën ZX Furio 1.8i 89000 4 Citroën XM Turbo CT 193200 5 Fiat Uno 70 sx i.e. 71000 6 Fiat Croma i.e. 119900 7 Ford Escort 1.8 success 87300 8 Ford Sierra 2.0i Ghia 118800 9 Honda Civic 1.6 ES i 108166 10 Honda Accord 2.0 EX 119160 11 Lancia Dedra 1.8 i.e. 107700 12 Mazda 626 1.8 GLX i 120990 13 Mercedes 190 E 2.3 184600 14 Mitsubishi Galant 2.0 GLS i 118000 15 Nissan Primera 1.6 SLX 99900 16 Opel Astra 1.6 i CD 99600 17 Opel Vectra 2.0i GT 16v 137800 18 Peugeot 106 XR 1.1 65000 19 Peugeot 405 Sri 118300 20 Renault Clio RT 1.7 83800 21 Renault Safrane RT 2.2 Si 172000 22 Toyota Corolla L/B 1.3 Gi 96450 23 Volkswagen Golf GL 90 101250 24 Volkswagen Passat GL 115 130100 Total 24 24 Unstandardized Predicted Value 88675,76527 162392,1954 101926,5738 172506,574 61211,99243 107689,1465 99206,28784 126276,674 112750,5155 124177,7743 128623,0958 117839,9806 153941,8038 121008,8774 107276,991 99869,20007 150772,9069 56505,71868 126884,362 96251,69227 167225,0793 79611,86119 89306,21052 135984,7215 24 Unstandardized Residual -1075,765273 -4092,195413 -12926,57377 20693,42597 9788,007571 12210,85353 -11906,28784 -7476,673961 -4584,515535 -5017,77429 -20923,09583 3150,019443 30658,19623 -3008,877423 -7376,991002 -269,200073 -12972,9069 8494,281317 -8584,361983 -12451,69227 4774,920743 16838,13881 11943,78948 -5884,721525 24 ANNEXE 3 Méthode pas à pas descendante (modèle (3) Model Summary(f) Model 1 R ,929(a) R Square ,863 Adjusted R Square ,815 Std. Error of the Estimate 14360,782 2 ,928(b) ,861 ,822 14074,329 3 ,927(c) ,859 ,829 13801,672 4 ,923(d) ,851 ,829 13795,329 5 ,917(e) ,842 ,827 13893,913 Coefficients(a) Unstandardized Coefficients Model 1 2 (Constant) B -19286,854 Std. Error 18118,463 Puissance 1056,299 178,297 ,670 Alle 7581,751 8354,981 Fran 12414,635 8822,265 Ital 5501,620 Bon 5944,407 TB Beta ,302 ,000 ,109 ,907 ,377 ,165 1,407 ,177 10232,589 ,063 ,538 ,598 8978,917 ,079 ,662 ,517 26215,444 8787,250 ,400 2,983 ,008 (Constant) -16503,408 17016,765 -,970 ,345 Puissance 1060,955 174,534 ,673 6,079 ,000 Alle 5762,965 7487,141 ,083 ,770 ,451 Fran 10260,704 4310,326 24422,206 7703,440 8280,366 7967,515 ,136 ,057 ,372 1,332 ,521 3,065 ,199 ,609 ,007 (Constant) -15160,742 16494,296 -,919 ,370 Puissance 1061,760 171,146 ,673 6,204 ,000 Alle 6936,635 7001,274 ,100 ,991 ,334 Fran 10928,901 7448,590 ,145 1,467 ,159 22433,950 -17960,281 1121,863 7550,683 6856,848 16242,997 159,961 6619,301 ,342 ,712 ,100 3,272 -1,106 7,013 1,141 ,004 ,282 ,000 ,267 21103,092 6720,898 ,322 3,140 ,005 -17789,920 1143,526 19686,381 16358,381 159,965 6652,352 ,725 ,300 -1,088 7,149 2,959 ,289 ,000 ,007 (Constant) Puissance Fran TB 5 Sig. 5,924 TB 4 t -1,064 Bon TB 3 Standardized Coefficients (Constant) Puissance TB a Dependent Variable: Prix Figure 1 : représentation du modèle (3) Confort Moyen/bon TB 200000 175000 Prix 150000 125000 100000 75000 75 100 Puissance 125 150 Figure 2 : droites de régression simple par sous-groupes Confort 200000 Moyen/bon TB Moyen/bon TB 175000 Prix 150000 125000 100000 75000 75 100 Puissance 125 150 ANNEXE 4 Régression du prix en fonction de puissance, TB et puissance*TB Model 1 Regression Residual Total Sum of Squares 23214722126,485 df 3 Mean Square 7738240708,829 2397291168,849 20 119864558,442 25612013295,334 23 F 64,558 Sig. ,000(a) a Predictors: (Constant), puissTB, Puissance, TB b Dependent Variable: Prix Coefficients(a) Unstandardized Coefficients Model 1 Standardized Coefficients t Sig. (Constant) B 18406,093 Std. Error 16154,174 1,139 ,268 Puissance 779,324 159,645 ,494 4,882 ,000 -89409,255 29810,469 -1,364 -2,999 ,007 967,131 260,151 1,812 a Dependent Variable: Prix 3,718 ,001 TB puissTB Modèle Prix 1 Alfa Roméo 33 1.5 i.e. 2 BMW 318 is 3 Citroën ZX Furio 1.8i 4 Citroën XM Turbo CT 5 Fiat Uno 70 sx i.e. 6 Fiat Croma i.e. 7 Ford Escort 1.8 success 8 Ford Sierra 2.0i Ghia 9 Honda Civic 1.6 ES i 10 Honda Accord 2.0 EX 11 Lancia Dedra 1.8 i.e. 12 Mazda 626 1.8 GLX i 13 Mercedes 190 E 2.3 14 Mitsubishi Galant 2.0 GLS i 15 Nissan Primera 1.6 SLX 16 Opel Astra 1.6 i CD 17 Opel Vectra 2.0i GT 16v 18 Peugeot 106 XR 1.1 19 Peugeot 405 Sri 20 Renault Clio RT 1.7 21 Renault Safrane RT 2.2 Si 22 Toyota Corolla L/B 1.3 Gi 23 Volkswagen Golf GL 90 24 Volkswagen Passat GL 115 Total 24 Beta Unstandardized Predicted Value Standardized Residual 87600 94000,53474 -0,584616225 158300 173500,4992 -1,38839313 89000 98676,47959 -0,883836616 193200 182232,7728 1,001731765 71000 73738,10707 -0,250095013 119900 108028,3693 1,084338765 87300 100235,1279 -1,181477163 118800 115821,6107 0,272042069 108166 115821,6107 -0,699253173 119160 122853,3123 -0,337342174 107700 121106,8576 -1,224564321 120990 112374,584 0,786920497 184600 159528,8614 2,289964038 118000 117613,9482 0,035261455 99900 94910,0368 0,45577652 99600 96338,50716 0,297900364 137800 154289,4973 -1,506128479 65000 65165,54151 -0,015120339 118300 112704,3141 0,511102413 83800 90103,91403 -0,57579102 172000 173500,4992 -0,137053577 96450 86986,61747 0,864372618 101250 88545,26575 1,16043332 130100 129839,1312 0,023827405 24 24 24