Modélisation et prévision Séries chronologiques
Transcription
Modélisation et prévision Séries chronologiques
Cours SG042 Modélisation et prévision Modélisation et prévision Séance 3 F. Sur - ENSMN F. Sur - ENSMN Box-Jenkins Modélisation et prévision Séries chronologiques - Séance 3 Compléments sur ARIMA, processus SARIMA Box-Jenkins Rappels Prévision Transformation et prévision 1 Processus SARIMA Quelques règles Conclusion Rappels Prévision Transformation et prévision Processus SARIMA Quelques règles Conclusion Frédéric Sur 2 Processus SARIMA 3 Quelques 4 Conclusion École des Mines de Nancy www.loria.fr/∼sur/enseignement/modprev/ règles 2/24 1/24 Modélisation des chroniques par (S)ARIMA proc arima Modélisation et prévision Prévision avec modèle ARIMA(p,d,q) (1) F. Sur - ENSMN 1 Transformation (éventuelle) de la chronique (généralement log) pour stabiliser la variance. Box-Jenkins 2 Identification des paramètres p, d, q. → identify : identification des ordres p et q avec ACF et PACF de la chronique, éventuellement différentiée à l’ordre d. Processus SARIMA 3 3/24 Box-Jenkins Rappels Prévision Transformation et prévision F. Sur - ENSMN Box-Jenkins Rappels Prévision Transformation et prévision Validation du modèle. → estimate : significativité, ACF, PACF et graphe des résidus, Portmanteau, AIC, SBC, σ. 5 Prévision du futur. → forecast : prévisions. Idée de la prévision. . . Φ(B)(1 − B)d Xt = Θ(B)εt Quelques règles ou : Conclusion Ψ(B)Xt = Θ(B)εt Estimation des θj , φi , µ (ou constant) et σ. → estimate : estimation des paramètres. 4 Modélisation et prévision On connaı̂t (Xt ) jusque la date t = T , on cherche une prévision XbT (h) de X à un horizon de h après l’instant T . 4/24 Rappels Prévision Transformation et prévision Processus SARIMA Quelques règles Conclusion Prévision avec modèle ARIMA(p,d,q) (2) Modélisation et prévision Prévision avec modèle ARIMA(p,d,q) (3) F. Sur - ENSMN XT +h = Box-Jenkins On écrit XT +h sous la forme : p+d q X X XT +h = ψi XT +h−i + εT +h − θj εT +h−j i=1 i=1 Rappels Prévision Transformation et prévision Donc : XbT (h) = Processus SARIMA (∗) j=1 Quelques règles ψi XT +h−i + εT +h − p+d X i=1 ψi XbT (h − i) − q X q X F. Sur - ENSMN θj εT +h−j (∗) j=1 θj εT +h−j (∗∗) j=h (εT +h−j ∈ Vect(Xt )t6T si j > h et (εt ) non corrélés). Conclusion Quelques règles Conclusion → formule d’actualisation avec l’estimation des ψi , θj , εt : On remarque : Xbt (h) = Xt+h si h 6 0. (heureusement. . .) bT (1) = X p+d X i=1 ψi XT +1−i − bT (2) = ψ1 X bT (1) + X ... 6/24 5/24 Modélisation et prévision p+d X i=2 q X θj εT +1−j j=h ψi XT +2−i − q X θj εT +2−j j=2 SAS : I.C. pour XbT +h sous hypothèse de normalité des εt . Passage au log F. Sur - ENSMN Modélisation et prévision F. Sur - ENSMN Exemple : logarithme de la chronique airline Box-Jenkins Rappels Prévision Transformation et prévision Box-Jenkins Rappels Prévision Transformation et prévision Processus SARIMA Processus SARIMA Quelques règles Quelques règles Conclusion Conclusion → modèle additif avec tendance, variance de la composante aléatoire stabilisée. → passage au log. . . 7/24 Processus SARIMA Remarque : avec (∗) et (∗∗), Xt+1 − Xbt (1) = εt+1 . ( meilleure approximation de XT +h par comb. lin. des (Xt )t6T ) Exemple : chronique airline Box-Jenkins Rappels Prévision Transformation et prévision car E(εT +h−j |(Xt )t6T ) = εT +h−j si j > h et = 0 sinon. Soit ∀h, XbT (h) = E(XT +h |(Xt )t6T ). Remarque : transformation de (Xt ). . . p+d X Modélisation et prévision 8/24 Étude de Yt = log(Xt ) Hypothèse : Yτ ∼ N (Ybτ , σ bτ2 ) (τ > T ) forecast : prévision Ybτ + int. de conf. [Lτ , Uτ ] à 95% (centré sur Ybτ ). Question : intervalle et prévision pour Xτ = exp(Yτ ) ? Comme exp est croissante : Pr(exp(Yτ ) ∈ [exp(Lτ ), exp(Uτ )]) 6 95%. Donc intervalle de confiance à 95% : [exp(Lτ ), exp(Uτ )]). Modélisation et prévision F. Sur - ENSMN Box-Jenkins Rappels Prévision Transformation et prévision Ybτ = 0, 0.4 σ bτ = 1. F. Sur - ENSMN Box-Jenkins Rappels Prévision Transformation et prévision 0.7 0.35 0.6 0.3 Processus SARIMA 0.5 Processus SARIMA 0.25 0.4 Quelques règles 0.3 Quelques règles 0.2 Conclusion 0.2 0.15 Conclusion 0.1 0.1 0.05 0 −5 0 −4 −3 −2 −1 0 1 2 3 4 5 0 loi de Yτ (normale) Prévision ? Naı̈f : Xbτ = exp(Ybτ ) Mieux : Xbτ = E (Xτ ) = exp(Ybτ + σ bτ2 /2) car Xτ suit une loi log-normale. Remarque : E (Xτ ). . . Modélisation et prévision Illustration : Yt = log(Xt ) 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 loi de Xτ (log-normale) Ici : Ybτ = 0, I.C. 95% : [−1.96, 1.96]. Prévision sur Xτ : I.C. 95% : [0.14, 7.1] exp(Ybτ ) = 1 Xbτ = exp(Ybτ + σ 2 /2) = 1.6 intervalle de confiance non centré sur Remarque : bien sûr, correction négligeable si σ bτ2 /2 << Ybτ 10/24 9/24 Modélisation et prévision Séance 3 Cas des chroniques périodiques F. Sur - ENSMN Box-Jenkins 1 Box-Jenkins Rappels Prévision Transformation et prévision Rappels Prévision Transformation et prévision Processus SARIMA Quelques règles F. Sur - ENSMN Remarque 1 : un comportement saisonnier (période τ ) peut être présent dans la chronique Xt → corrélations / corrélations partielles aux décalages de τ , 2τ , 3τ , etc. D’où le modèle ARMA saisonnier : φ(B τ )Xt = θ(B τ )εt Conclusion 2 Processus SARIMA 3 Quelques 4 Conclusion règles Remarque 2 : Xt peut aussi ne pas être stationnaire à cause d’un comportement du type : Xt = Xt−τ + ut (cf marche aléatoire) → on peut stationnariser et étudier (1 − B τ )Xt . 11/24 Modélisation et prévision 12/24 Box-Jenkins Rappels Prévision Transformation et prévision Processus SARIMA Quelques règles Conclusion Modélisation et prévision Les processus SARIMA Modélisation et prévision Exemples F. Sur - ENSMN Définition : processus SARIMA(p, d, q)(P, D, Q)τ Box-Jenkins d Box-Jenkins Rappels Prévision Transformation et prévision Ce sont les processus (Xt ) du type : τ F. Sur - ENSMN τ D τ Φp (B)ΦP (B )(1 − B) (1 − B ) Xt = θ0 + Θq (B)ΘQ (B )εt Processus SARIMA où p, d, q, P, D, Q > 0, τ est la période de la saisonnalité et (εt ) est un bruit blanc. Quelques règles 1 processus SARIMA(1, 0, 2)(1, 1, 0)4 : (chronique trimestrielle, période annuelle) (1−φ1 B)(1−φ01 B 4 )(1−B 4 )Xt = θ0 +(1−θ1 B −θ2 B 2 )εt Conclusion 2 Intérêt : traiter les chroniques non-stationnaires, avec tendance et saisonnalité ou comportement style marche aléatoire . Rappels Prévision Transformation et prévision Processus SARIMA Quelques règles Conclusion processus SARIMA(0, 1, 1)(1, 0, 0)12 : (chronique mensuelle, période annuelle) (1 − φ01 B 12 )(1 − B)Xt = θ0 + (1 − θ1 B)εt Remarque : SARIMA = ARIMA particulier, mais la factorisation limite le nombre de coefficients à estimer. (cf parcimonie, rasoir d’Ockham) 13/24 14/24 Modélisation et prévision Identification des modèles ACF et PACF pour (S)AR(1) et (S)MA(1) F. Sur - ENSMN Modélisation et prévision F. Sur - ENSMN TP précédent : identification des ordres des processus ARIMA selon ACF et PACF. Box-Jenkins TP aujourd’hui : identification des ordres des processus SARIMA : regarder aussi les pics 12 et 24 de l’ACF et du PACF (pour saisonnalité 12). Processus SARIMA Processus SARIMA Quelques règles Quelques règles Important : on cherche des modèles simples. . . Conclusion Conclusion Modèle Rappels Prévision Transformation et prévision s Remarque : on commence par regarder ACF/PACF pour petits décalages (h 6 6), puis pour h = 12, 24, 36. (pour se débarrasser de l’influence des corrélations termes sur la composante saisonnière) MA(1) court En effet : si par exemple Xt = (1 − θ1 B)(1 − θ10 B 12 )εt alors : Xt = εt − θ1 εt−1 − θ10 εt−12 + θ1 θ10 εt−13 (influence des corrélations 15/24 court termes sur le Corrélogramme Corrélogramme partiel AR(1) long terme ) 16/24 2s 3s 4s s Box-Jenkins Rappels Prévision Transformation et prévision Modélisation et prévision Séance 3 F. Sur - ENSMN Quelques règles complémentaires : différentiation Box-Jenkins 1 ordre de différentiation saisonnière : 0 ou 1. Processus SARIMA ordre de différentiation totale (saisonnière & non saisonnière) : d + D 6 2. Quelques règles Conclusion 2 Processus SARIMA si la décroissance de l’ACF est lente, penser à différentier plutôt qu’introduire un AR. 3 Quelques (cf chronique magnesium) 4 Conclusion règles Rappels Prévision Transformation et prévision Processus SARIMA Quelques règles Conclusion si le premier pic de l’ACF est < à -0.5, la chronique est trop différentiée. Enlever un ordre de dérivation plutôt qu’introduire un MA. 18/24 17/24 Pourquoi éviter de trop différentier ? Modélisation et prévision F. Sur - ENSMN → intervalles de confiance de la prévision. . . Exemple : chronique Y1 (exercice 1 séance 2) Quelques règles complémentaires : la constante Box-Jenkins F. Sur - ENSMN Rappels Prévision Transformation et prévision Φp (B)ΦP (B τ )(1 − B)d (1 − B τ )D Xt = θ0 + Θq (B)ΘQ (B τ )εt Quelques règles chronique différentiée à l’ordre 1 : constante = pente de la tendance. On peut avoir une constante nulle Conclusion (ex : marche aléatoire) ou pas. (ex : ax + b) (1 − 0.805B)(Yt − 2.02) = εt (σ = 1.002) Modélisation et prévision Box-Jenkins Rappels Prévision Transformation et prévision Processus SARIMA 19/24 F. Sur - ENSMN Box-Jenkins Rappels Prévision Transformation et prévision Box-Jenkins Rappels Prévision Transformation et prévision Modélisation et prévision chronique différentiée à l’ordre 2 (la pente varie) : constante = coef du terme quadratique. (tendance quadratique rare, donc constante nulle) (1 − B)Yt + 0.011 = εt (σ = 1.052) 20/24 Processus SARIMA Quelques règles Conclusion Quelques règles complémentaires : divers Modélisation et prévision Exemple : chronique SNCF F. Sur - ENSMN F. Sur - ENSMN Box-Jenkins Box-Jenkins Rappels Prévision Transformation et prévision éviter de mélanger SAR et SMA. les termes en AR et MA peuvent se compenser. Ex : si ARIMA(2,d,1) identifié, on peut essayer ARIMA(1,d,0) (cas où les racines de AR et MA se Rappels Prévision Transformation et prévision Processus SARIMA Processus SARIMA Quelques règles Quelques règles Conclusion Exemple du polycopié, sous SAS. . . 22/24 Modélisation et prévision Séance 3 F. Sur - ENSMN Tous les modèles sont faux . . . mais certains sont utiles ! Box-Jenkins Box-Jenkins Rappels Prévision Transformation et prévision Processus SARIMA “Remember that all models are wrong ; the practical question is how wrong do they have to be to not be useful.” Processus SARIMA George E. P. Box, Norman R. Draper 3 Quelques 4 Conclusion 23/24 règles F. Sur - ENSMN Rappels Prévision Transformation et prévision Processus SARIMA Quelques règles Modélisation et prévision Box-Jenkins Rappels Prévision Transformation et prévision Conclusion 2 Conclusion compensent ). 21/24 1 Modélisation et prévision Empirical Model-Building and Response Surface, Wiley, 1987. 24/24 Quelques règles Conclusion