Modélisation et prévision Séries chronologiques - Séance 1
Transcription
Modélisation et prévision Séries chronologiques - Séance 1
Modélisation et prévision Cours SG042 Qu’est-ce qu’une série chronologique ? F. Sur - ENSMN F. Sur - ENSMN Introduction Modélisation et prévision Séries chronologiques - Séance 1 Décomposition d’une chronique Modélisation et prévision Introduction Séries temporelles / Chroniques / Time Series → suite d’observations d’une grandeur au cours du temps. Modèles de décomposition Les trois composantes Tendance Composante saisonnière Composante résiduelle Exemples : économétrie (taux de chômage), Décomposition finance (cours d’action), Typologie Modèles paramétriques Filtrage Décomposition Conclusion démographie (population), Frédéric Sur Les trois composantes Tendance Composante saisonnière Composante résiduelle Typologie Modèles paramétriques Filtrage écologie (pollution), Conclusion Modèles de décomposition météorologie (relevé de températures), École des Mines de Nancy astronomie (fluctuations de la magnitude d’un astre). . . www.loria.fr/∼sur/enseignement/modprev/ Modèle sous-jacent inconnu liant les observations. 1/34 2/34 Exemple de série chronologique Modélisation et prévision Modélisation et prévision Dans le modèle. . . F. Sur - ENSMN F. Sur - ENSMN Introduction Introduction Modèles de décomposition Modèles de décomposition Les trois composantes Tendance Composante saisonnière Composante résiduelle Les trois composantes Tendance Composante saisonnière Composante résiduelle Perturbations ponctuelles : variations forte amplitude. Décomposition Typologie Modèles paramétriques Filtrage (grève, krach boursier, attentats, mesure aberrante. . .) → À traiter en premier. Cf Conclusion modèles d’intervention . Tendance Tt : évolution globale. Variations saisonnières St : fluctuations périodiques. Cf 3/34 données corrigées des variations saisonnières . Trafic aérien aux USA de 1990 à 2004. → moyenne nulle sur une période. But du cours : décrire l’évolution des chroniques à l’aide de modèles basés sur des propriétés statistiques. Composante résiduelle (irrégulière) ut : fluctuations irrégulières imprévisibles de faible amplitude. → moyenne nulle. 4/34 Décomposition Typologie Modèles paramétriques Filtrage Conclusion Pourquoi étudier les chroniques ? Modélisation et prévision À faire avant chaque séance. . . F. Sur - ENSMN Description / explication d’un phénomène. chômage : variation tendancielle ou fluctuation saisonnière ? Prévision. consommation d’électricité, démographie, restauration rapide. . . Étude de la dynamique. cours d’actions. Impact d’un événement sur une variable. sécurité routière : F. Sur - ENSMN Polycopié du cours : chaque chapitre correspond à une séance Introduction Modèles de décomposition −→ à lire avant le cours ! ( pour en savoir plus optionnel) Les trois composantes Tendance Composante saisonnière Composante résiduelle Décomposition Introduction Modèles de décomposition Les trois composantes Tendance Composante saisonnière Composante résiduelle Décomposition Données : fichier chroniques.zip sur Arche. Typologie Modèles paramétriques Filtrage Conclusion Typologie Modèles paramétriques Filtrage Conclusion Pour approfondir : mesure de l’impact d’une nouvelle loi. bibliographie du polycopié disponible à la bibliothèque. www.loria.fr/~sur/enseignement/modprev/ SG042 : techniques statistiques, aspects temporels. → exercices à traiter en TP ; → slides + chapitres du polycopié à lire ; → suggestions de lectures complémentaires. Autres points de vue : aspects fréquentiels, traitement du signal. → cf cours électifs. 5/34 6/34 Séance 1 Modélisation et prévision Modèles de décomposition F. Sur - ENSMN 1 Introduction Modèle additif : Xt = Tt + St + ut Modèle multiplicatif : Xt = Tt · St · ut Modèle mixte : Xt = Tt · St + ut Introduction Modèles de décomposition 2 Modèles de décomposition Les trois composantes Tendance Composante saisonnière Composante résiduelle Les trois composantes Tendance Composante saisonnière Composante résiduelle Décomposition 3 Décomposition Typologie Modèles paramétriques Filtrage 4 Conclusion Modélisation et prévision F. Sur - ENSMN Introduction Modèles de décomposition Les trois composantes Tendance Composante saisonnière Composante résiduelle Décomposition Typologie Modèles paramétriques Filtrage Typologie Modèles paramétriques Filtrage Conclusion 7/34 Modélisation et prévision Conclusion 8/34 Exemple de décomposition Modélisation et prévision Exemple de décomposition F. Sur - ENSMN Modélisation et prévision F. Sur - ENSMN Introduction Introduction Modèles de décomposition Modèles de décomposition Les trois composantes Tendance Composante saisonnière Composante résiduelle Les trois composantes Tendance Composante saisonnière Composante résiduelle Décomposition Décomposition Typologie Modèles paramétriques Filtrage Typologie Modèles paramétriques Filtrage Conclusion Trafic aérien aux USA de 1994 à 1997. Conclusion Tendance Tt . → modèle mixte. 9/34 10/34 Exemple de décomposition Modélisation et prévision Exemple de décomposition F. Sur - ENSMN F. Sur - ENSMN Introduction Introduction Modèles de décomposition Modèles de décomposition Les trois composantes Tendance Composante saisonnière Composante résiduelle Les trois composantes Tendance Composante saisonnière Composante résiduelle Décomposition Décomposition Typologie Modèles paramétriques Filtrage Typologie Modèles paramétriques Filtrage Conclusion Conclusion Composante saisonnière St . Résidus ut . (modèle multiplicatif, donc St centré sur 1 et pas 0) (pas de structure apparente) 11/34 Modélisation et prévision 12/34 Modélisation et prévision Composante tendancielle Tt Composante saisonnière St F. Sur - ENSMN F. Sur - ENSMN Introduction Modèles de décomposition Exemples de composante tendancielle Tt paramétriques : linéaire : Tt = at + b quadratique : exponentielle : Tt = at 2 + bt + c Tt = T0 e at Les trois composantes Tendance Composante saisonnière Composante résiduelle Décomposition Typologie Modèles paramétriques Filtrage Introduction St périodique, de période p. −→ éventuellement plusieurs composantes périodiques superposées. Exemple : comp. annuelle + comp. trimestrielle. . . Conclusion ... Modèles de décomposition Les trois composantes Tendance Composante saisonnière Composante résiduelle Décomposition Typologie Modèles paramétriques Filtrage Conclusion Question : comment trouver les périodes ? avec les paramètres a,b,c,T0 . . . à déterminer. −→ ça se voit , expertise. −→ analyse fréquentielle (périodogramme, proc spectra). 13/34 14/34 Composante résiduelle ut (le bruit) Modélisation et prévision Cas particuliers de processus stationnaires F. Sur - ENSMN → pas de tendance ou de phénomène périodique superposé. Modélisation : (ut ) réalisation d’un processus aléatoire (εt ) stationnaire. Définition : (εt ) stationnaire (au second ordre) ∀t, E(εt ) = m (moyenne constante) ∀t, s, cov(εt , εs ) = γ(|t − s|) (autocovariance symétrique, invariante par translation) En particulier ∀t, var(εt ) = γ(0) Modélisation et prévision F. Sur - ENSMN Introduction Introduction Modèles de décomposition Modèles de décomposition Les trois composantes Tendance Composante saisonnière Composante résiduelle Bruit blanc faible : m = 0 et ∀h > 0, γ(h) = 0. → absence d’autocorrélation temporelle. Décomposition Typologie Modèles paramétriques Filtrage Bruit blanc fort : m = 0 et (εt ) i.i.d. → indépendance temporelle. Conclusion Bruit blanc gaussien : (εt ) i.i.d. ∼ N (0, σ 2 ). → cf résidus dans la régression. (variance constante). → les moments d’ordre 1 et 2 ne varient pas au cours du temps. 15/34 Modélisation et prévision 16/34 Les trois composantes Tendance Composante saisonnière Composante résiduelle Décomposition Typologie Modèles paramétriques Filtrage Conclusion Modélisation et prévision Exemples Caractérisation des processus stationnaires F. Sur - ENSMN Introduction F. Sur - ENSMN Processus stationnaires considérés : Modèles de décomposition Les trois composantes Tendance Composante saisonnière Composante résiduelle bruit blanc gaussien Décomposition Typologie Modèles paramétriques Filtrage Conclusion Modélisation et prévision Xt = m + +∞ X Modèles de décomposition aj εt−j j=0 avec P+∞ j=0 et (εt ) bruit blanc (faible) |aj | < +∞ Introduction Remarque : en fait (εt ) sera même généralement un bruit blanc gaussien. Les trois composantes Tendance Composante saisonnière Composante résiduelle Décomposition Typologie Modèles paramétriques Filtrage Conclusion Par définition, (Xt ) caractérisé par moyenne m, processus non stationnaire fonction de covariance γ. → comment estimer m et γ ? 17/34 18/34 Estimation de la moyenne m Modélisation et prévision Estimation de l’autocovariance γ F. Sur - ENSMN F. Sur - ENSMN Introduction Modèles de décomposition Introduction Définition : fonction d’autocorrélation Les trois composantes Tendance Composante saisonnière Composante résiduelle Estimateur de m : Cov(Xt , Xt+h ) γ(h) . ∀h > 0, ρ(h) = p = γ(0) Var(Xt )Var(Xt+h ) Décomposition XT T 1 X = Xt T t=1 Typologie Modèles paramétriques Filtrage Corrélogramme empirique : Conclusion T ρb(h) = T −h PT t=h+1 (Xt − X T )(Xt−h − X T ) PT 2 t=1 (Xt − X T ) Graphe de ρb(h) : corrélogramme (ACF). 19/34 Modélisation et prévision 20/34 Modèles de décomposition Les trois composantes Tendance Composante saisonnière Composante résiduelle Décomposition Typologie Modèles paramétriques Filtrage Conclusion Modélisation et prévision Intérêt pratique du corrélogramme Modélisation et prévision Séance 1 F. Sur - ENSMN Introduction F. Sur - ENSMN 1 Introduction Introduction Modèles de décomposition Proposition Si Xt = m + k X Les trois composantes Tendance Composante saisonnière Composante résiduelle alors ∀h > k, ρ(h) = 0. aj εt−j , j=0 Preuve : Cov(Xt , Xt+h ) = k X k X Modèles de décomposition 2 Décomposition Typologie Modèles paramétriques Filtrage Les trois composantes Tendance Composante saisonnière Composante résiduelle Décomposition Typologie Modèles paramétriques Filtrage Conclusion ai aj Cov(εt−i , εt+h−j ). Conclusion 3 Décomposition Typologie Modèles paramétriques Filtrage 4 Conclusion i=0 j=0 Or Cov(εt−i , εt+h−j ) = 0 Modèles de décomposition Les trois composantes Tendance Composante saisonnière Composante résiduelle si h 6= j − i (car (εt ) b.b.). 21/34 22/34 Modélisation et prévision Décomposition des chroniques Modèles paramétriques déterministes F. Sur - ENSMN Introduction Méthodes de décomposition Non-paramétriques Modèles de décomposition Conclusion (TD aujourd’hui) 23/34 Stochastiques Xt = µ + a1 Xt−1 + a2 Xt−2 + · · · + εt Modèle paramétrique : Xt = a1 + a2 t + | {z } Tt Décomposition Typologie Modèles paramétriques Filtrage Moyennes mobiles F. Sur - ENSMN (Xt ) : chronique mensuelle (trimestrielle dans le poly.) Les trois composantes Tendance Composante saisonnière Composante résiduelle Paramétriques Déterministes Xt = at + b + εt δi : indicatrice du mois i. Régression (suite du cours) (première partie) 12 X 12 X bi = 0 t.q. i=1 24/34 Introduction Modèles de décomposition bi δi (t) +u(t) |i=1 {z St } Estimation des paramètres aux moindres carrés des résidus : !2 T 12 X X Xt − a1 − a2 t − bi δi (t) min ai ,bj t=1 ARIMA Modélisation et prévision i=1 Les trois composantes Tendance Composante saisonnière Composante résiduelle Décomposition Typologie Modèles paramétriques Filtrage Conclusion Filtrage par moyennes mobiles Modélisation et prévision Modélisation et prévision Décomposition d’une chronique par filtrage F. Sur - ENSMN Définition : moyenne mobile Introduction Introduction Modèles de décomposition Modèles de décomposition Les trois composantes Tendance Composante saisonnière Composante résiduelle Soit (Xt ) une chronique, et Yt = M(Xt ) la chronique telle que Décomposition ∀t, Yt = m2 X θi Xt+i i=−m1 F. Sur - ENSMN On cherche un filtre tel que Typologie Modèles paramétriques Filtrage Décomposition Typologie Modèles paramétriques Filtrage M(Tt ) = Tt ; M(St ) = 0 ; Conclusion (Yt ) est obtenue de (Xt ) par filtrage par moyenne mobile. Les trois composantes Tendance Composante saisonnière Composante résiduelle Premier objectif : décomposition de Xt = Tt + St + ut . M(ut ) Conclusion aussi petit que possible . de sorte que : M(Xt ) ' Tt Remarque : M est un opérateur linéaire. 26/34 25/34 Les moyennes mobiles arithmétiques Modélisation et prévision Filtre symétrique Pm : m1 = m2 (= m), θi = θ−i M(Xt ) = i=−m θi Xt+i . F. Sur - ENSMN Propriété P Une moyenne mobile symétrique telle que m i=−m θi = 1 conserve les chroniques affines Xt = at + b. Propriété Parmi ces moy. mob., celles qui minimisent M(ut ) avec 1 (ut ) réalisation d’un b.b. faible (εt ) vérifient : ∀i, θi = 2m+1 . Pm Pm Preuve : Var(M(εt )) = Var( i=−m θi εt+i ) = σ 2 i=−m θi2 , Pm à minimiser, sous contrainte i=−m θi = 1. Définition : moyenne mobile arithmétique 1 ∀i ∈ {−m, . . . , m}, θi = . 2m + 1 27/34 Introduction Modèles de décomposition Modélisation et prévision Effet de Slutsky-Yule F. Sur - ENSMN Attention à l’apparition éventuelle d’une périodicité artificielle . Les trois composantes Tendance Composante saisonnière Composante résiduelle 3 Introduction Modèles de décomposition Les trois composantes Tendance Composante saisonnière Composante résiduelle 1 0.8 2 0.6 Décomposition 1 Typologie Modèles paramétriques Filtrage Décomposition Typologie Modèles paramétriques Filtrage 0.4 0.2 0 0 Conclusion −1 Conclusion −0.2 −0.4 −2 −0.6 −3 0 50 100 150 200 250 300 350 400 450 bruit blanc gaussien, σ = 1 500 −0.8 0 50 100 150 200 250 300 350 400 Remarque : la variance du bruit est divisée par 2m + 1 (= 19). 28/34 450 500 lissage arithmétique, 2m + 1 = 19 Modélisation et prévision Saisonnalité et moyennes mobiles arithmétiques Modélisation et prévision Récapitulatif F. Sur - ENSMN 1 M2m+1 (Xt ) = (Xt−m + Xt−m+1 + · · · + Xt+m ) . 2m + 1 Propriété Les composantes saisonnières St de période 2m + 1 et de moyenne nulle sur une période sont éliminées par M2m+1 : M2m+1 (St ) = 0. Introduction F. Sur - ENSMN Hypothèses : (Xt ) chronique à décomposer sous la forme : Modèles de décomposition Les trois composantes Tendance Composante saisonnière Composante résiduelle Xt = Tt + St + ut , avec Tt linéaire Décomposition Typologie Modèles paramétriques Filtrage Conclusion Modèles de décomposition Les trois composantes Tendance Composante saisonnière Composante résiduelle Décomposition St de période p et moyenne nulle sur la période. Typologie Modèles paramétriques Filtrage Conclusion Alors : Mp (Xt ) = Mp (Tt ) + Mp (St ) + Mp (ut ) ' Tt . Généralisation : composantes saisonnières de période 2m : 1 1 1 M2m (Xt ) = Xt−m + Xt−m+1 + · · · + Xt+m−1 + Xt+m . 2m 2 2 Mk (St + ut ) ' St si k << p Problème : pas forcément de moyenne nulle sur une période. Mk (St + ut ) − Mp Mk (St + ut ) est de moyenne nulle. Discussion détaillée du filtrage : cf traitement du signal. 29/34 30/34 Un algorithme de décomposition par filtrage Modélisation et prévision Généralisation F. Sur - ENSMN Décomposition de Xt = Tt + St + ut . 1 périodogramme, connaissances → période p de St . 2 estimation de la tendance : Tt = Mp (Xt ) 3 estimation de Σt = St + ut par Σt = Xt − Tt 4 5 6 estimation de la composante saisonnière : St = M 0 (Σt ) avec M 0 (Σt ) = Mk (Σt ) − Mp Mk (Σt ) et k petit estimation de la série corrigée des variations saisonnières (cvs) : Xt0 = Xt − St Modélisation et prévision F. Sur - ENSMN Introduction Introduction Modèles de décomposition Modèles de décomposition Les trois composantes Tendance Composante saisonnière Composante résiduelle moyennes mobiles non-artithmétiques pour tendance de degré > 1. Décomposition 31/34 Introduction filtrage itératif Typologie Modèles paramétriques Filtrage Conclusion Remarque : c’est l’idée du programme Census X11 (1965). → tendance, saisonnalité, données c.v.s., résidus. composante résiduelle ut = Xt0 − Tt 32/34 Les trois composantes Tendance Composante saisonnière Composante résiduelle Décomposition Typologie Modèles paramétriques Filtrage Conclusion Séance 1 Modélisation et prévision Conclusion F. Sur - ENSMN 1 Introduction Introduction Modèles de décomposition 2 Modèles de décomposition Les trois composantes Tendance Composante saisonnière Composante résiduelle F. Sur - ENSMN Décomposition (additive / multiplicative / mixte) d’une chronique : Les trois composantes Tendance Composante saisonnière Composante résiduelle tendance, composante saisonnière (période ?), composante résiduelle / irrégulière (processus stationnaire). Décomposition Typologie Modèles paramétriques Filtrage Conclusion 3 4 33/34 Décomposition Typologie Modèles paramétriques Filtrage Modélisation et prévision Introduction Modèles de décomposition Les trois composantes Tendance Composante saisonnière Composante résiduelle Décomposition Typologie Modèles paramétriques Filtrage Conclusion Dans ce cours : filtrage (moyennes mobiles, Census X11) → en TD aujourd’hui. processus ARIMA → jusque la fin du cours. Conclusion 34/34