UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R.
Transcription
UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R.
UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2015 – 2016 L1 Économie Cours de B. Desgraupes Corrigé des exercices de Statistiques Descriptives Séance 11: Séries temporelles Corrigé ex. 1 : Accidents de la route La série mensuelle suivante qui indique les décès par accident de la route aux USA de 1973 à 1978 : 1973 9007 8106 8928 9137 10017 10826 11317 10744 9713 9938 9161 8927 Janv Fév Mars Avr Mai Juin Juil Aout Sept Oct Nov Déc 1974 7750 6981 8038 8422 8714 9512 10120 9823 8743 9129 8710 8680 1975 8162 7306 8124 7870 9387 9556 10093 9620 8285 8466 8160 8034 1976 7717 7461 7767 7925 8623 8945 10078 9179 8037 8488 7874 8647 1977 7792 6957 7726 8106 8890 9299 10625 9302 8314 8850 8265 8796 1978 7836 6892 7791 8192 9115 9434 10484 9827 9110 9070 8633 9240 a) Représentation graphique de la série. 7000 8000 9000 10000 11000 Décès par accident de la route aux USA (1973−1978) 1973 1974 1975 1976 1977 1978 1979 On observe une brusque diminution de la série en 1974 puis un regain en 1977. Il y a aussi clairement des variations saisonnières qui se reproduisent d’année en année. b) Trend de la série par régression linéaire. Il y a au total 72 observations (12 mois pendant six années). On désigne les mois successifs par un nombre entier x variant de 1 à 72. On cherche la droite de régression y = a x + b où y est le nombre d’accidents. Les formules pour calculer les coefficients de la droite de régression sont a = Cov(x, y) Var(x) b = ȳ − a x̄ Les moyennes sont respectivement ȳ = 8788.792 et x̄ = 36.5. On calcule Cov(x, y) = −3640.37 et Var(x) = 431.92. On en déduit : ( a = −8.43 b = 9096.43 c) Variations saisonnières. On doit commencer par soustraire le trend des données observées. Les valeurs ajustées sont définies par : ŷi = a xi + b = −8.43 xi + 9096.43 On trouve les valeurs ajustées suivantes : Janv Fév Mars Avr Mai Juin Juil Aout Sept Oct Nov Déc 1973 9088.00 9079.57 9071.14 9062.71 9054.29 9045.86 9037.43 9029.00 9020.57 9012.14 9003.72 8995.29 1974 8986.86 8978.43 8970.00 8961.57 8953.15 8944.72 8936.29 8927.86 8919.43 8911.00 8902.58 8894.15 1975 8885.72 8877.29 8868.86 8860.43 8852.00 8843.58 8835.15 8826.72 8818.29 8809.86 8801.43 8793.01 1976 8784.58 8776.15 8767.72 8759.29 8750.86 8742.44 8734.01 8725.58 8717.15 8708.72 8700.29 8691.87 1977 8683.44 8675.01 8666.58 8658.15 8649.72 8641.29 8632.87 8624.44 8616.01 8607.58 8599.15 8590.72 1978 8582.30 8573.87 8565.44 8557.01 8548.58 8540.15 8531.73 8523.30 8514.87 8506.44 8498.01 8489.58 On fait ensuite la différence avec les valeurs observées. On trouve les résidus suivants : 2 Janv Fév Mars Avr Mai Juin Juil Aout Sept Oct Nov Déc 1973 -81.00 -973.57 -143.14 74.29 962.71 1780.14 2279.57 1715.00 692.43 925.86 157.28 -68.29 1974 -1236.86 -1997.43 -932.00 -539.57 -239.15 567.28 1183.71 895.14 -176.43 218.00 -192.58 -214.15 1975 -723.72 -1571.29 -744.86 -990.43 535.00 712.42 1257.85 793.28 -533.29 -343.86 -641.43 -759.01 1976 -1067.58 -1315.15 -1000.72 -834.29 -127.86 202.56 1343.99 453.42 -680.15 -220.72 -826.29 -44.87 1977 -891.44 -1718.01 -940.58 -552.15 240.28 657.71 1992.13 677.56 -302.01 242.42 -334.15 205.28 1978 -746.30 -1681.87 -774.44 -365.01 566.42 893.85 1952.27 1303.70 595.13 563.56 134.99 750.42 Pour obtenir les variations saisonnières, on fait les moyennes mois par mois (autrement dit les moyennes des lignes du tableau précédent) : S1 -791.15 S7 1668.25 S2 -1542.89 S8 973.02 S3 -755.96 S9 -67.39 S4 -534.53 S10 230.88 S5 322.90 S11 -283.70 S6 802.33 S12 -21.77 On constate que la moyenne des coefficients saisonniers est quasiment nulle (ρ = −0.00083). Il n’est donc pas nécessaire de soustraire le coefficient correcteur ρ. d) Série corrigée des variations saisonnières. La série corrigée des variations saisonnières s’obtient en retirant les coefficients saisonniers de la série des observations : yt∗ = yt − Sj On obtient : Janv Fév Mars Avr Mai Juin Juil Aout Sept Oct Nov Déc 1973 -81.00 -973.57 -143.14 74.29 962.71 1780.14 2279.57 1715.00 692.43 925.86 157.28 -68.29 1974 -1236.86 -1997.43 -932.00 -539.57 -239.15 567.28 1183.71 895.14 -176.43 218.00 -192.58 -214.15 1975 -723.72 -1571.29 -744.86 -990.43 535.00 712.42 1257.85 793.28 -533.29 -343.86 -641.43 -759.01 3 1976 -1067.58 -1315.15 -1000.72 -834.29 -127.86 202.56 1343.99 453.42 -680.15 -220.72 -826.29 -44.87 1977 -891.44 -1718.01 -940.58 -552.15 240.28 657.71 1992.13 677.56 -302.01 242.42 -334.15 205.28 1978 -746.30 -1681.87 -774.44 -365.01 566.42 893.85 1952.27 1303.70 595.13 563.56 134.99 750.42 Décès par accident de la route aux USA (1973−1978) 7000 8000 9000 10000 11000 accidents CVS 1973 1974 1975 1976 1977 1978 1979 Données corrigées des variations saisonnières e) Représentation graphique le trend obtenu par moyennes échelonnées. Les moyennes échelonnées sont les moyennes de trois en trois mois. On obtient ainsi 24 valeurs correspondant aux mois d’indices 2, 5, 8. . . On trouve : 8680.33 9993.33 10591.33 9342.00 7589.67 8882.67 9562.00 8839.67 7864.00 8937.67 9332.67 8220.00 7648.33 8497.67 9098.00 8336.33 7491.67 8765.00 9413.67 8637.00 7506.33 8913.67 9807.00 8981.00 On obtient la courbe suivante : Décès par accident de la route aux USA (1973−1978) 7000 8000 9000 10000 11000 Accidents Moy .ech. 1973 1974 1975 1976 1977 Trend par moyennes échelonnées 4 1978 1979 Corrigé ex. 2 : Consommation de gaz en Grande-Bretagne La série suivante représente la consommation annuelle de gaz en Grande-Bretagne de 1960 à 1986 (en millions de thermies). 869.3 1010.1 1685.8 907.7 1581.7 1767.4 1381.6 1488.9 1203.8 1367.3 1032.6 1263.2 917.3 1096.6 1945.1 965.3 1588.1 1914.8 1472.8 1693.8 1359.1 1479.3 983.0 1423.2 a) Représentation graphique de la série et de son logarithme. 500 1000 1500 2000 2500 3000 Consommation de gaz en Grande−Bretagne (1960−1986) 1960 1965 1970 1975 1980 1985 6.5 7.0 7.5 8.0 Échelle logarithmique 1960 1965 1970 1975 5 1980 1985 933.3 1167.1 1965.9 On observe que la courbe de la consommation présente une progression de type exponentiel (au moins sur la période de 1960 à 1980) et que la courbe logarithmique est plus rectiligne. Cela suggère de travailler avec un modèle multiplicatif de la forme : yt = ft × St × εt Ce modèle peut se ramener à un modèle additif en prenant le logarithme des différents éléments : log(yt ) = log(ft ) + log(St ) + log(εt ) b) Trend du modèle multiplicatif par régression linéaire. On fait une régression linéaire sur la série Y = log(yt ). On cherche donc des coefficients a et b pour construire un modèle Y = a T + b. Les formules pour calculer les coefficients de la droite de régression sont : a = Cov(T, Y ) Var(T ) b = Ȳ − a T̄ Les moyennes sont respectivement Ȳ = 1350.52 et T̄ = 14. On calcule Cov(T, Y ) = 5841.82 et Var(T ) = 60.67. On en déduit : ( a = 96.29 b = 2.41 c) Les données trimestrielles sur les 5 dernières années sont données dans le tableau suivant : 1982 1983 1984 1985 1986 T1 925.30 917.30 989.40 1087.00 1163.90 T2 443.40 515.50 477.10 534.70 613.10 T3 214.50 224.10 233.70 281.80 347.40 T4 683.60 694.80 730.00 787.60 782.80 Le graphe de la série sur la période 1982-1986 a l’allure suivante : 6 200 400 600 800 1000 1200 Période 1982−1986 1982 1983 1984 1985 1986 Il ressemble plus, sur cette courte période, à un modèle additif. On va donc recalculer un trend de type additif. Les moyennes sont respectivement ȳ = 632.35 et x̄ = 10.5. On calcule Cov(x, y) = 186.68 et Var(x) = 33.25. On en déduit : ( a = 5.614 b = 573.40 On doit commencer par soustraire le trend des données observées. Les valeurs ajustées sont définies par : ŷi = a xi + b = 5.614 xi + 573.40 On trouve les valeurs ajustées suivantes : 1982 1983 1984 1985 1986 T1 579.01 601.47 623.93 646.39 668.84 T2 584.63 607.09 629.54 652.00 674.46 T3 590.24 612.70 635.16 657.61 680.07 T4 595.86 618.31 640.77 663.23 685.69 On fait la différence avec les valeurs observées. On trouve les résidus suivants : 1982 1983 1984 1985 1986 T1 346.29 315.83 365.47 440.61 495.06 T2 -141.23 -91.59 -152.44 -117.30 -61.36 7 T3 -375.74 -388.60 -401.46 -375.81 -332.67 T4 87.74 76.49 89.23 124.37 97.11 Pour obtenir les variations saisonnières, on fait les moyennes trimestre par trimestre (autrement dit les moyennes des colonnes du tableau précédent) : S1 392.65 S2 -112.78 S3 -374.86 S4 94.99 On constate que la moyenne des coefficients saisonniers est nulle (ρ = 0). Il n’est donc pas nécessaire de soustraire le coefficient correcteur ρ. Voici le graphique de la série corrigée des variations saisonnières : 1200 Période 1982−1986 200 400 600 800 1000 consommation CVS 1982 1983 1984 1985 1986 Données corrigées des variations saisonnières 8