Modélisation et prévision Séries chronologiques

Transcription

Modélisation et prévision Séries chronologiques
Cours SG042
Modélisation et
prévision
Modélisation et
prévision
Séance 3
F. Sur - ENSMN
F. Sur - ENSMN
Box-Jenkins
Modélisation et prévision
Séries chronologiques - Séance 3
Compléments sur ARIMA,
processus SARIMA
Box-Jenkins
Rappels
Prévision
Transformation et
prévision
1
Processus
SARIMA
Quelques
règles Conclusion
Rappels
Prévision
Transformation et
prévision
Processus
SARIMA
Quelques
règles Conclusion
Frédéric Sur
2
Processus SARIMA
3
Quelques
4
Conclusion
École des Mines de Nancy
www.loria.fr/∼sur/enseignement/modprev/
règles 2/24
1/24
Modélisation des chroniques par (S)ARIMA
proc arima
Modélisation et
prévision
Prévision avec modèle ARIMA(p,d,q) (1)
F. Sur - ENSMN
1
Transformation (éventuelle) de la chronique
(généralement log) pour stabiliser la variance.
Box-Jenkins
2
Identification des paramètres p, d, q.
→ identify : identification des ordres p et q avec ACF
et PACF de la chronique, éventuellement différentiée à
l’ordre d.
Processus
SARIMA
3
3/24
Box-Jenkins
Rappels
Prévision
Transformation et prévision
F. Sur - ENSMN
Box-Jenkins
Rappels
Prévision
Transformation et
prévision
Validation du modèle.
→ estimate : significativité, ACF, PACF et graphe des
résidus, Portmanteau, AIC, SBC, σ.
5
Prévision du futur.
→ forecast : prévisions.
Idée de la prévision. . .
Φ(B)(1 − B)d Xt = Θ(B)εt
Quelques
règles ou :
Conclusion
Ψ(B)Xt = Θ(B)εt
Estimation des θj , φi , µ (ou constant) et σ.
→ estimate : estimation des paramètres.
4
Modélisation et
prévision
On connaı̂t (Xt ) jusque la date t = T ,
on cherche une prévision XbT (h) de X à un horizon de h
après l’instant T .
4/24
Rappels
Prévision
Transformation et
prévision
Processus
SARIMA
Quelques
règles Conclusion
Prévision avec modèle ARIMA(p,d,q) (2)
Modélisation et
prévision
Prévision avec modèle ARIMA(p,d,q) (3)
F. Sur - ENSMN
XT +h =
Box-Jenkins
On écrit XT +h sous la forme :
p+d
q
X
X
XT +h =
ψi XT +h−i + εT +h −
θj εT +h−j
i=1
i=1
Rappels
Prévision
Transformation et
prévision
Donc :
XbT (h) =
Processus
SARIMA
(∗)
j=1
Quelques
règles ψi XT +h−i + εT +h −
p+d
X
i=1
ψi XbT (h − i) −
q
X
q
X
F. Sur - ENSMN
θj εT +h−j
(∗)
j=1
θj εT +h−j
(∗∗)
j=h
(εT +h−j ∈ Vect(Xt )t6T si j > h et (εt ) non corrélés).
Conclusion
Quelques
règles Conclusion
→ formule d’actualisation avec l’estimation des ψi , θj , εt :
On remarque : Xbt (h) = Xt+h si h 6 0. (heureusement. . .)
bT (1) =
X
p+d
X
i=1
ψi XT +1−i −
bT (2) = ψ1 X
bT (1) +
X
...
6/24
5/24
Modélisation et
prévision
p+d
X
i=2
q
X
θj εT +1−j
j=h
ψi XT +2−i −
q
X
θj εT +2−j
j=2
SAS : I.C. pour XbT +h sous hypothèse de normalité des εt .
Passage au log
F. Sur - ENSMN
Modélisation et
prévision
F. Sur - ENSMN
Exemple : logarithme de la chronique airline
Box-Jenkins
Rappels
Prévision
Transformation et
prévision
Box-Jenkins
Rappels
Prévision
Transformation et
prévision
Processus
SARIMA
Processus
SARIMA
Quelques
règles Quelques
règles Conclusion
Conclusion
→ modèle additif avec tendance, variance de la composante
aléatoire stabilisée.
→ passage au log. . .
7/24
Processus
SARIMA
Remarque : avec (∗) et (∗∗), Xt+1 − Xbt (1) = εt+1 .
( meilleure approximation de XT +h par comb. lin. des (Xt )t6T )
Exemple : chronique airline
Box-Jenkins
Rappels
Prévision
Transformation et
prévision
car E(εT +h−j |(Xt )t6T ) = εT +h−j si j > h et = 0 sinon.
Soit ∀h, XbT (h) = E(XT +h |(Xt )t6T ).
Remarque : transformation de (Xt ). . .
p+d
X
Modélisation et
prévision
8/24
Étude de Yt = log(Xt )
Hypothèse : Yτ ∼ N (Ybτ , σ
bτ2 ) (τ > T )
forecast : prévision Ybτ + int. de conf. [Lτ , Uτ ] à 95%
(centré sur Ybτ ).
Question : intervalle et prévision pour Xτ = exp(Yτ ) ?
Comme exp est croissante :
Pr(exp(Yτ ) ∈ [exp(Lτ ), exp(Uτ )]) 6 95%.
Donc intervalle de confiance à 95% :
[exp(Lτ ), exp(Uτ )]).
Modélisation et
prévision
F. Sur - ENSMN
Box-Jenkins
Rappels
Prévision
Transformation et
prévision
Ybτ = 0,
0.4
σ
bτ = 1.
F. Sur - ENSMN
Box-Jenkins
Rappels
Prévision
Transformation et
prévision
0.7
0.35
0.6
0.3
Processus
SARIMA
0.5
Processus
SARIMA
0.25
0.4
Quelques
règles 0.3
Quelques
règles 0.2
Conclusion
0.2
0.15
Conclusion
0.1
0.1
0.05
0
−5
0
−4
−3
−2
−1
0
1
2
3
4
5
0
loi de Yτ (normale)
Prévision ?
Naı̈f : Xbτ = exp(Ybτ )
Mieux : Xbτ = E (Xτ ) = exp(Ybτ + σ
bτ2 /2)
car Xτ suit une loi log-normale.
Remarque :
E (Xτ ). . .
Modélisation et
prévision
Illustration : Yt = log(Xt )
0.5
1
1.5
2
2.5
3
3.5
4
4.5
5
loi de Xτ (log-normale)
Ici : Ybτ = 0, I.C. 95% : [−1.96, 1.96].
Prévision sur Xτ : I.C. 95% : [0.14, 7.1]
exp(Ybτ ) = 1
Xbτ = exp(Ybτ + σ 2 /2) = 1.6
intervalle de confiance non centré sur
Remarque : bien sûr, correction négligeable si σ
bτ2 /2 << Ybτ
10/24
9/24
Modélisation et
prévision
Séance 3
Cas des chroniques périodiques
F. Sur - ENSMN
Box-Jenkins
1
Box-Jenkins
Rappels
Prévision
Transformation et prévision
Rappels
Prévision
Transformation et
prévision
Processus
SARIMA
Quelques
règles F. Sur - ENSMN
Remarque 1 : un comportement saisonnier (période τ ) peut
être présent dans la chronique Xt
→ corrélations / corrélations partielles aux décalages de τ ,
2τ , 3τ , etc.
D’où le modèle ARMA saisonnier :
φ(B τ )Xt = θ(B τ )εt
Conclusion
2
Processus SARIMA
3
Quelques
4
Conclusion
règles
Remarque 2 : Xt peut aussi ne pas être stationnaire à cause
d’un comportement du type :
Xt = Xt−τ + ut
(cf marche aléatoire)
→ on peut stationnariser et étudier (1 − B τ )Xt .
11/24
Modélisation et
prévision
12/24
Box-Jenkins
Rappels
Prévision
Transformation et
prévision
Processus
SARIMA
Quelques
règles Conclusion
Modélisation et
prévision
Les processus SARIMA
Modélisation et
prévision
Exemples
F. Sur - ENSMN
Définition : processus SARIMA(p, d, q)(P, D, Q)τ
Box-Jenkins
d
Box-Jenkins
Rappels
Prévision
Transformation et
prévision
Ce sont les processus (Xt ) du type :
τ
F. Sur - ENSMN
τ D
τ
Φp (B)ΦP (B )(1 − B) (1 − B ) Xt = θ0 + Θq (B)ΘQ (B )εt
Processus
SARIMA
où p, d, q, P, D, Q > 0, τ est la période de la saisonnalité et
(εt ) est un bruit blanc.
Quelques
règles 1
processus SARIMA(1, 0, 2)(1, 1, 0)4 :
(chronique trimestrielle, période annuelle)
(1−φ1 B)(1−φ01 B 4 )(1−B 4 )Xt = θ0 +(1−θ1 B −θ2 B 2 )εt
Conclusion
2
Intérêt : traiter les chroniques non-stationnaires, avec
tendance et saisonnalité ou comportement style marche
aléatoire .
Rappels
Prévision
Transformation et
prévision
Processus
SARIMA
Quelques
règles Conclusion
processus SARIMA(0, 1, 1)(1, 0, 0)12 :
(chronique mensuelle, période annuelle)
(1 − φ01 B 12 )(1 − B)Xt = θ0 + (1 − θ1 B)εt
Remarque : SARIMA = ARIMA particulier, mais la
factorisation limite le nombre de coefficients à estimer.
(cf parcimonie, rasoir d’Ockham)
13/24
14/24
Modélisation et
prévision
Identification des modèles
ACF et PACF pour (S)AR(1) et (S)MA(1)
F. Sur - ENSMN
Modélisation et
prévision
F. Sur - ENSMN
TP précédent : identification des ordres des processus
ARIMA selon ACF et PACF.
Box-Jenkins
TP aujourd’hui : identification des ordres des processus
SARIMA : regarder aussi les pics 12 et 24 de l’ACF et du
PACF (pour saisonnalité 12).
Processus
SARIMA
Processus
SARIMA
Quelques
règles Quelques
règles Important : on cherche des modèles simples. . .
Conclusion
Conclusion
Modèle
Rappels
Prévision
Transformation et
prévision
s
Remarque : on commence par regarder ACF/PACF pour
petits décalages (h 6 6), puis pour h = 12, 24, 36.
(pour se débarrasser de l’influence des corrélations
termes sur la composante saisonnière)
MA(1)
court
En effet : si par exemple Xt = (1 − θ1 B)(1 − θ10 B 12 )εt
alors : Xt = εt − θ1 εt−1 − θ10 εt−12 + θ1 θ10 εt−13
(influence des corrélations
15/24
court termes sur le
Corrélogramme
Corrélogramme partiel
AR(1)
long terme )
16/24
2s
3s
4s
s
Box-Jenkins
Rappels
Prévision
Transformation et
prévision
Modélisation et
prévision
Séance 3
F. Sur - ENSMN
Quelques règles complémentaires :
différentiation
Box-Jenkins
1
ordre de différentiation saisonnière : 0 ou 1.
Processus
SARIMA
ordre de différentiation totale (saisonnière & non
saisonnière) : d + D 6 2.
Quelques
règles Conclusion
2
Processus SARIMA
si la décroissance de l’ACF est lente, penser à
différentier plutôt qu’introduire un AR.
3
Quelques
(cf chronique magnesium)
4
Conclusion
règles Rappels
Prévision
Transformation et
prévision
Processus
SARIMA
Quelques
règles Conclusion
si le premier pic de l’ACF est < à -0.5, la chronique est
trop différentiée. Enlever un ordre de dérivation plutôt
qu’introduire un MA.
18/24
17/24
Pourquoi éviter de trop différentier ?
Modélisation et
prévision
F. Sur - ENSMN
→ intervalles de confiance de la prévision. . .
Exemple : chronique Y1 (exercice 1 séance 2)
Quelques règles complémentaires :
la constante
Box-Jenkins
F. Sur - ENSMN
Rappels
Prévision
Transformation et
prévision
Φp (B)ΦP (B τ )(1 − B)d (1 − B τ )D Xt = θ0 + Θq (B)ΘQ (B τ )εt
Quelques
règles chronique différentiée à l’ordre 1 :
constante = pente de la tendance.
On peut avoir une constante nulle
Conclusion
(ex : marche aléatoire)
ou pas. (ex : ax + b)
(1 − 0.805B)(Yt − 2.02) = εt
(σ = 1.002)
Modélisation et
prévision
Box-Jenkins
Rappels
Prévision
Transformation et
prévision
Processus
SARIMA
19/24
F. Sur - ENSMN
Box-Jenkins
Rappels
Prévision
Transformation et
prévision
Box-Jenkins
Rappels
Prévision
Transformation et prévision
Modélisation et
prévision
chronique différentiée à l’ordre 2 (la pente varie) :
constante = coef du terme quadratique.
(tendance quadratique rare, donc constante nulle)
(1 − B)Yt + 0.011 = εt
(σ = 1.052)
20/24
Processus
SARIMA
Quelques
règles Conclusion
Quelques
règles complémentaires : divers
Modélisation et
prévision
Exemple : chronique SNCF
F. Sur - ENSMN
F. Sur - ENSMN
Box-Jenkins
Box-Jenkins
Rappels
Prévision
Transformation et
prévision
éviter de mélanger SAR et SMA.
les termes en AR et MA peuvent se compenser.
Ex : si ARIMA(2,d,1) identifié,
on peut essayer ARIMA(1,d,0)
(cas où les racines de AR et MA se
Rappels
Prévision
Transformation et
prévision
Processus
SARIMA
Processus
SARIMA
Quelques
règles Quelques
règles Conclusion
Exemple du polycopié, sous SAS. . .
22/24
Modélisation et
prévision
Séance 3
F. Sur - ENSMN
Tous les modèles sont faux . . .
mais certains sont utiles !
Box-Jenkins
Box-Jenkins
Rappels
Prévision
Transformation et prévision
Processus
SARIMA
“Remember that all models are wrong ; the practical
question is how wrong do they have to be to not be useful.”
Processus SARIMA
George E. P. Box, Norman R. Draper
3
Quelques
4
Conclusion
23/24
règles F. Sur - ENSMN
Rappels
Prévision
Transformation et
prévision
Processus
SARIMA
Quelques
règles Modélisation et
prévision
Box-Jenkins
Rappels
Prévision
Transformation et
prévision
Conclusion
2
Conclusion
compensent ).
21/24
1
Modélisation et
prévision
Empirical Model-Building and Response Surface,
Wiley, 1987.
24/24
Quelques
règles Conclusion