UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R.

Transcription

UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R.
UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE
U.F.R. SEGMI
Année universitaire 2015 – 2016
L1 Économie
Cours de B. Desgraupes
Corrigé des exercices de Statistiques Descriptives
Séance 11: Séries temporelles
Corrigé ex. 1 : Accidents de la route
La série mensuelle suivante qui indique les décès par accident de la route aux USA
de 1973 à 1978 :
1973
9007
8106
8928
9137
10017
10826
11317
10744
9713
9938
9161
8927
Janv
Fév
Mars
Avr
Mai
Juin
Juil
Aout
Sept
Oct
Nov
Déc
1974
7750
6981
8038
8422
8714
9512
10120
9823
8743
9129
8710
8680
1975
8162
7306
8124
7870
9387
9556
10093
9620
8285
8466
8160
8034
1976
7717
7461
7767
7925
8623
8945
10078
9179
8037
8488
7874
8647
1977
7792
6957
7726
8106
8890
9299
10625
9302
8314
8850
8265
8796
1978
7836
6892
7791
8192
9115
9434
10484
9827
9110
9070
8633
9240
a) Représentation graphique de la série.
7000
8000
9000
10000
11000
Décès par accident de la route aux USA (1973−1978)
1973
1974
1975
1976
1977
1978
1979
On observe une brusque diminution de la série en 1974 puis un regain en 1977. Il
y a aussi clairement des variations saisonnières qui se reproduisent d’année en année.
b) Trend de la série par régression linéaire.
Il y a au total 72 observations (12 mois pendant six années). On désigne les mois
successifs par un nombre entier x variant de 1 à 72. On cherche la droite de régression
y = a x + b où y est le nombre d’accidents.
Les formules pour calculer les coefficients de la droite de régression sont


a = Cov(x, y)
Var(x)

b = ȳ − a x̄
Les moyennes sont respectivement ȳ = 8788.792 et x̄ = 36.5.
On calcule Cov(x, y) = −3640.37 et Var(x) = 431.92.
On en déduit :
(
a = −8.43
b = 9096.43
c) Variations saisonnières.
On doit commencer par soustraire le trend des données observées. Les valeurs ajustées sont définies par :
ŷi = a xi + b = −8.43 xi + 9096.43
On trouve les valeurs ajustées suivantes :
Janv
Fév
Mars
Avr
Mai
Juin
Juil
Aout
Sept
Oct
Nov
Déc
1973
9088.00
9079.57
9071.14
9062.71
9054.29
9045.86
9037.43
9029.00
9020.57
9012.14
9003.72
8995.29
1974
8986.86
8978.43
8970.00
8961.57
8953.15
8944.72
8936.29
8927.86
8919.43
8911.00
8902.58
8894.15
1975
8885.72
8877.29
8868.86
8860.43
8852.00
8843.58
8835.15
8826.72
8818.29
8809.86
8801.43
8793.01
1976
8784.58
8776.15
8767.72
8759.29
8750.86
8742.44
8734.01
8725.58
8717.15
8708.72
8700.29
8691.87
1977
8683.44
8675.01
8666.58
8658.15
8649.72
8641.29
8632.87
8624.44
8616.01
8607.58
8599.15
8590.72
1978
8582.30
8573.87
8565.44
8557.01
8548.58
8540.15
8531.73
8523.30
8514.87
8506.44
8498.01
8489.58
On fait ensuite la différence avec les valeurs observées. On trouve les résidus suivants :
2
Janv
Fév
Mars
Avr
Mai
Juin
Juil
Aout
Sept
Oct
Nov
Déc
1973
-81.00
-973.57
-143.14
74.29
962.71
1780.14
2279.57
1715.00
692.43
925.86
157.28
-68.29
1974
-1236.86
-1997.43
-932.00
-539.57
-239.15
567.28
1183.71
895.14
-176.43
218.00
-192.58
-214.15
1975
-723.72
-1571.29
-744.86
-990.43
535.00
712.42
1257.85
793.28
-533.29
-343.86
-641.43
-759.01
1976
-1067.58
-1315.15
-1000.72
-834.29
-127.86
202.56
1343.99
453.42
-680.15
-220.72
-826.29
-44.87
1977
-891.44
-1718.01
-940.58
-552.15
240.28
657.71
1992.13
677.56
-302.01
242.42
-334.15
205.28
1978
-746.30
-1681.87
-774.44
-365.01
566.42
893.85
1952.27
1303.70
595.13
563.56
134.99
750.42
Pour obtenir les variations saisonnières, on fait les moyennes mois par mois (autrement dit les moyennes des lignes du tableau précédent) :
S1
-791.15
S7
1668.25
S2
-1542.89
S8
973.02
S3
-755.96
S9
-67.39
S4
-534.53
S10
230.88
S5
322.90
S11
-283.70
S6
802.33
S12
-21.77
On constate que la moyenne des coefficients saisonniers est quasiment nulle (ρ =
−0.00083). Il n’est donc pas nécessaire de soustraire le coefficient correcteur ρ.
d) Série corrigée des variations saisonnières.
La série corrigée des variations saisonnières s’obtient en retirant les coefficients
saisonniers de la série des observations :
yt∗ = yt − Sj
On obtient :
Janv
Fév
Mars
Avr
Mai
Juin
Juil
Aout
Sept
Oct
Nov
Déc
1973
-81.00
-973.57
-143.14
74.29
962.71
1780.14
2279.57
1715.00
692.43
925.86
157.28
-68.29
1974
-1236.86
-1997.43
-932.00
-539.57
-239.15
567.28
1183.71
895.14
-176.43
218.00
-192.58
-214.15
1975
-723.72
-1571.29
-744.86
-990.43
535.00
712.42
1257.85
793.28
-533.29
-343.86
-641.43
-759.01
3
1976
-1067.58
-1315.15
-1000.72
-834.29
-127.86
202.56
1343.99
453.42
-680.15
-220.72
-826.29
-44.87
1977
-891.44
-1718.01
-940.58
-552.15
240.28
657.71
1992.13
677.56
-302.01
242.42
-334.15
205.28
1978
-746.30
-1681.87
-774.44
-365.01
566.42
893.85
1952.27
1303.70
595.13
563.56
134.99
750.42
Décès par accident de la route aux USA (1973−1978)
7000
8000
9000
10000
11000
accidents
CVS
1973
1974
1975
1976
1977
1978
1979
Données corrigées des variations saisonnières
e) Représentation graphique le trend obtenu par moyennes échelonnées.
Les moyennes échelonnées sont les moyennes de trois en trois mois. On obtient
ainsi 24 valeurs correspondant aux mois d’indices 2, 5, 8. . .
On trouve :
8680.33
9993.33
10591.33
9342.00
7589.67
8882.67
9562.00
8839.67
7864.00
8937.67
9332.67
8220.00
7648.33
8497.67
9098.00
8336.33
7491.67
8765.00
9413.67
8637.00
7506.33
8913.67
9807.00
8981.00
On obtient la courbe suivante :
Décès par accident de la route aux USA (1973−1978)
7000
8000
9000
10000
11000
Accidents
Moy .ech.
1973
1974
1975
1976
1977
Trend par moyennes échelonnées
4
1978
1979
Corrigé ex. 2 : Consommation de gaz en Grande-Bretagne
La série suivante représente la consommation annuelle de gaz en Grande-Bretagne
de 1960 à 1986 (en millions de thermies).
869.3
1010.1
1685.8
907.7
1581.7
1767.4
1381.6
1488.9
1203.8
1367.3
1032.6
1263.2
917.3
1096.6
1945.1
965.3
1588.1
1914.8
1472.8
1693.8
1359.1
1479.3
983.0
1423.2
a) Représentation graphique de la série et de son logarithme.
500
1000
1500
2000
2500
3000
Consommation de gaz en Grande−Bretagne (1960−1986)
1960
1965
1970
1975
1980
1985
6.5
7.0
7.5
8.0
Échelle logarithmique
1960
1965
1970
1975
5
1980
1985
933.3
1167.1
1965.9
On observe que la courbe de la consommation présente une progression de type
exponentiel (au moins sur la période de 1960 à 1980) et que la courbe logarithmique
est plus rectiligne. Cela suggère de travailler avec un modèle multiplicatif de la forme :
yt = ft × St × εt
Ce modèle peut se ramener à un modèle additif en prenant le logarithme des différents éléments :
log(yt ) = log(ft ) + log(St ) + log(εt )
b) Trend du modèle multiplicatif par régression linéaire.
On fait une régression linéaire sur la série Y = log(yt ). On cherche donc des
coefficients a et b pour construire un modèle Y = a T + b.
Les formules pour calculer les coefficients de la droite de régression sont :


a = Cov(T, Y )
Var(T )

b = Ȳ − a T̄
Les moyennes sont respectivement Ȳ = 1350.52 et T̄ = 14.
On calcule Cov(T, Y ) = 5841.82 et Var(T ) = 60.67.
On en déduit :
(
a = 96.29
b = 2.41
c) Les données trimestrielles sur les 5 dernières années sont données dans le tableau
suivant :
1982
1983
1984
1985
1986
T1
925.30
917.30
989.40
1087.00
1163.90
T2
443.40
515.50
477.10
534.70
613.10
T3
214.50
224.10
233.70
281.80
347.40
T4
683.60
694.80
730.00
787.60
782.80
Le graphe de la série sur la période 1982-1986 a l’allure suivante :
6
200
400
600
800
1000
1200
Période 1982−1986
1982
1983
1984
1985
1986
Il ressemble plus, sur cette courte période, à un modèle additif. On va donc recalculer un trend de type additif.
Les moyennes sont respectivement ȳ = 632.35 et x̄ = 10.5.
On calcule Cov(x, y) = 186.68 et Var(x) = 33.25.
On en déduit :
(
a = 5.614
b = 573.40
On doit commencer par soustraire le trend des données observées. Les valeurs ajustées sont définies par :
ŷi = a xi + b = 5.614 xi + 573.40
On trouve les valeurs ajustées suivantes :
1982
1983
1984
1985
1986
T1
579.01
601.47
623.93
646.39
668.84
T2
584.63
607.09
629.54
652.00
674.46
T3
590.24
612.70
635.16
657.61
680.07
T4
595.86
618.31
640.77
663.23
685.69
On fait la différence avec les valeurs observées. On trouve les résidus suivants :
1982
1983
1984
1985
1986
T1
346.29
315.83
365.47
440.61
495.06
T2
-141.23
-91.59
-152.44
-117.30
-61.36
7
T3
-375.74
-388.60
-401.46
-375.81
-332.67
T4
87.74
76.49
89.23
124.37
97.11
Pour obtenir les variations saisonnières, on fait les moyennes trimestre par trimestre
(autrement dit les moyennes des colonnes du tableau précédent) :
S1
392.65
S2
-112.78
S3
-374.86
S4
94.99
On constate que la moyenne des coefficients saisonniers est nulle (ρ = 0). Il n’est
donc pas nécessaire de soustraire le coefficient correcteur ρ.
Voici le graphique de la série corrigée des variations saisonnières :
1200
Période 1982−1986
200
400
600
800
1000
consommation
CVS
1982
1983
1984
1985
1986
Données corrigées des variations saisonnières
8