Modélisation et prévision Séries chronologiques - Séance 1

Transcription

Modélisation et prévision Séries chronologiques - Séance 1
Modélisation et
prévision
Cours SG042
Qu’est-ce qu’une série chronologique ?
F. Sur - ENSMN
F. Sur - ENSMN
Introduction
Modélisation et prévision
Séries chronologiques - Séance 1
Décomposition d’une chronique
Modélisation et
prévision
Introduction
Séries temporelles / Chroniques / Time Series
→ suite d’observations d’une grandeur au cours du temps.
Modèles de
décomposition
Les trois composantes
Tendance
Composante
saisonnière
Composante résiduelle
Exemples :
économétrie (taux de chômage),
Décomposition
finance (cours d’action),
Typologie
Modèles
paramétriques
Filtrage
Décomposition
Conclusion
démographie (population),
Frédéric Sur
Les trois composantes
Tendance
Composante
saisonnière
Composante résiduelle
Typologie
Modèles
paramétriques
Filtrage
écologie (pollution),
Conclusion
Modèles de
décomposition
météorologie (relevé de températures),
École des Mines de Nancy
astronomie (fluctuations de la magnitude d’un astre). . .
www.loria.fr/∼sur/enseignement/modprev/
Modèle sous-jacent inconnu liant les observations.
1/34
2/34
Exemple de série chronologique
Modélisation et
prévision
Modélisation et
prévision
Dans le modèle. . .
F. Sur - ENSMN
F. Sur - ENSMN
Introduction
Introduction
Modèles de
décomposition
Modèles de
décomposition
Les trois composantes
Tendance
Composante
saisonnière
Composante résiduelle
Les trois composantes
Tendance
Composante
saisonnière
Composante résiduelle
Perturbations ponctuelles : variations forte amplitude.
Décomposition
Typologie
Modèles
paramétriques
Filtrage
(grève, krach boursier, attentats, mesure aberrante. . .)
→ À traiter en premier. Cf
Conclusion
modèles d’intervention .
Tendance Tt : évolution globale.
Variations saisonnières St : fluctuations périodiques.
Cf
3/34
données corrigées des variations saisonnières .
Trafic aérien aux USA de 1990 à 2004.
→ moyenne nulle sur une période.
But du cours : décrire l’évolution des chroniques à l’aide de
modèles basés sur des propriétés statistiques.
Composante résiduelle (irrégulière) ut : fluctuations
irrégulières imprévisibles de faible amplitude.
→ moyenne nulle.
4/34
Décomposition
Typologie
Modèles
paramétriques
Filtrage
Conclusion
Pourquoi étudier les chroniques ?
Modélisation et
prévision
À faire avant chaque séance. . .
F. Sur - ENSMN
Description / explication d’un phénomène.
chômage : variation tendancielle ou fluctuation saisonnière ?
Prévision.
consommation d’électricité, démographie, restauration rapide. . .
Étude de la dynamique.
cours d’actions.
Impact d’un événement sur une variable.
sécurité routière :
F. Sur - ENSMN
Polycopié du cours :
chaque chapitre correspond à une séance
Introduction
Modèles de
décomposition
−→ à lire avant le cours !
( pour en savoir plus optionnel)
Les trois composantes
Tendance
Composante
saisonnière
Composante résiduelle
Décomposition
Introduction
Modèles de
décomposition
Les trois composantes
Tendance
Composante
saisonnière
Composante résiduelle
Décomposition
Données : fichier chroniques.zip sur Arche.
Typologie
Modèles
paramétriques
Filtrage
Conclusion
Typologie
Modèles
paramétriques
Filtrage
Conclusion
Pour approfondir :
mesure de l’impact d’une nouvelle loi.
bibliographie du polycopié disponible à la bibliothèque.
www.loria.fr/~sur/enseignement/modprev/
SG042 : techniques statistiques, aspects temporels.
→ exercices à traiter en TP ;
→ slides + chapitres du polycopié à lire ;
→ suggestions de lectures complémentaires.
Autres points de vue : aspects fréquentiels, traitement du
signal.
→ cf cours électifs.
5/34
6/34
Séance 1
Modélisation et
prévision
Modèles de décomposition
F. Sur - ENSMN
1
Introduction
Modèle additif : Xt = Tt + St + ut
Modèle multiplicatif : Xt = Tt · St · ut
Modèle mixte : Xt = Tt · St + ut
Introduction
Modèles de
décomposition
2
Modèles de décomposition
Les trois composantes
Tendance
Composante saisonnière
Composante résiduelle
Les trois composantes
Tendance
Composante
saisonnière
Composante résiduelle
Décomposition
3
Décomposition
Typologie
Modèles paramétriques
Filtrage
4
Conclusion
Modélisation et
prévision
F. Sur - ENSMN
Introduction
Modèles de
décomposition
Les trois composantes
Tendance
Composante
saisonnière
Composante résiduelle
Décomposition
Typologie
Modèles
paramétriques
Filtrage
Typologie
Modèles
paramétriques
Filtrage
Conclusion
7/34
Modélisation et
prévision
Conclusion
8/34
Exemple de décomposition
Modélisation et
prévision
Exemple de décomposition
F. Sur - ENSMN
Modélisation et
prévision
F. Sur - ENSMN
Introduction
Introduction
Modèles de
décomposition
Modèles de
décomposition
Les trois composantes
Tendance
Composante
saisonnière
Composante résiduelle
Les trois composantes
Tendance
Composante
saisonnière
Composante résiduelle
Décomposition
Décomposition
Typologie
Modèles
paramétriques
Filtrage
Typologie
Modèles
paramétriques
Filtrage
Conclusion
Trafic aérien aux USA de 1994 à 1997.
Conclusion
Tendance Tt .
→ modèle mixte.
9/34
10/34
Exemple de décomposition
Modélisation et
prévision
Exemple de décomposition
F. Sur - ENSMN
F. Sur - ENSMN
Introduction
Introduction
Modèles de
décomposition
Modèles de
décomposition
Les trois composantes
Tendance
Composante
saisonnière
Composante résiduelle
Les trois composantes
Tendance
Composante
saisonnière
Composante résiduelle
Décomposition
Décomposition
Typologie
Modèles
paramétriques
Filtrage
Typologie
Modèles
paramétriques
Filtrage
Conclusion
Conclusion
Composante saisonnière St .
Résidus ut .
(modèle multiplicatif, donc St centré sur 1 et pas 0)
(pas de structure apparente)
11/34
Modélisation et
prévision
12/34
Modélisation et
prévision
Composante tendancielle Tt
Composante saisonnière St
F. Sur - ENSMN
F. Sur - ENSMN
Introduction
Modèles de
décomposition
Exemples de composante tendancielle Tt paramétriques :
linéaire :
Tt = at + b
quadratique :
exponentielle :
Tt = at 2 + bt + c
Tt = T0 e at
Les trois composantes
Tendance
Composante
saisonnière
Composante résiduelle
Décomposition
Typologie
Modèles
paramétriques
Filtrage
Introduction
St périodique, de période p.
−→ éventuellement plusieurs composantes périodiques
superposées.
Exemple : comp. annuelle + comp. trimestrielle. . .
Conclusion
...
Modèles de
décomposition
Les trois composantes
Tendance
Composante
saisonnière
Composante résiduelle
Décomposition
Typologie
Modèles
paramétriques
Filtrage
Conclusion
Question : comment trouver les périodes ?
avec les paramètres a,b,c,T0 . . .
à déterminer.
−→ ça se voit , expertise.
−→ analyse fréquentielle (périodogramme, proc spectra).
13/34
14/34
Composante résiduelle ut (le bruit)
Modélisation et
prévision
Cas particuliers de processus stationnaires
F. Sur - ENSMN
→ pas de tendance ou de phénomène périodique superposé.
Modélisation : (ut ) réalisation d’un processus aléatoire (εt )
stationnaire.
Définition : (εt ) stationnaire (au second ordre)
∀t, E(εt ) = m
(moyenne constante)
∀t, s, cov(εt , εs ) = γ(|t − s|)
(autocovariance symétrique, invariante par translation)
En particulier ∀t, var(εt ) = γ(0)
Modélisation et
prévision
F. Sur - ENSMN
Introduction
Introduction
Modèles de
décomposition
Modèles de
décomposition
Les trois composantes
Tendance
Composante
saisonnière
Composante résiduelle
Bruit blanc faible : m = 0 et ∀h > 0, γ(h) = 0.
→ absence d’autocorrélation temporelle.
Décomposition
Typologie
Modèles
paramétriques
Filtrage
Bruit blanc fort : m = 0 et (εt ) i.i.d.
→ indépendance temporelle.
Conclusion
Bruit blanc gaussien : (εt ) i.i.d. ∼ N (0, σ 2 ).
→ cf résidus dans la régression.
(variance constante).
→ les moments d’ordre 1 et 2 ne varient pas au cours du
temps.
15/34
Modélisation et
prévision
16/34
Les trois composantes
Tendance
Composante
saisonnière
Composante résiduelle
Décomposition
Typologie
Modèles
paramétriques
Filtrage
Conclusion
Modélisation et
prévision
Exemples
Caractérisation des processus stationnaires
F. Sur - ENSMN
Introduction
F. Sur - ENSMN
Processus stationnaires considérés :
Modèles de
décomposition
Les trois composantes
Tendance
Composante
saisonnière
Composante résiduelle
bruit
blanc
gaussien
Décomposition
Typologie
Modèles
paramétriques
Filtrage
Conclusion
Modélisation et
prévision
Xt = m +
+∞
X
Modèles de
décomposition
aj εt−j
j=0
avec
P+∞
j=0
et (εt ) bruit blanc (faible)
|aj | < +∞
Introduction
Remarque : en fait (εt ) sera même généralement un bruit blanc
gaussien.
Les trois composantes
Tendance
Composante
saisonnière
Composante résiduelle
Décomposition
Typologie
Modèles
paramétriques
Filtrage
Conclusion
Par définition, (Xt ) caractérisé par
moyenne m,
processus non
stationnaire
fonction de covariance γ.
→ comment estimer m et γ ?
17/34
18/34
Estimation de la moyenne m
Modélisation et
prévision
Estimation de l’autocovariance γ
F. Sur - ENSMN
F. Sur - ENSMN
Introduction
Modèles de
décomposition
Introduction
Définition : fonction d’autocorrélation
Les trois composantes
Tendance
Composante
saisonnière
Composante résiduelle
Estimateur de m :
Cov(Xt , Xt+h )
γ(h)
.
∀h > 0, ρ(h) = p
=
γ(0)
Var(Xt )Var(Xt+h )
Décomposition
XT
T
1 X
=
Xt
T
t=1
Typologie
Modèles
paramétriques
Filtrage
Corrélogramme empirique :
Conclusion
T
ρb(h) =
T −h
PT
t=h+1 (Xt − X T )(Xt−h − X T )
PT
2
t=1 (Xt − X T )
Graphe de ρb(h) : corrélogramme (ACF).
19/34
Modélisation et
prévision
20/34
Modèles de
décomposition
Les trois composantes
Tendance
Composante
saisonnière
Composante résiduelle
Décomposition
Typologie
Modèles
paramétriques
Filtrage
Conclusion
Modélisation et
prévision
Intérêt pratique du corrélogramme
Modélisation et
prévision
Séance 1
F. Sur - ENSMN
Introduction
F. Sur - ENSMN
1
Introduction
Introduction
Modèles de
décomposition
Proposition
Si Xt = m +
k
X
Les trois composantes
Tendance
Composante
saisonnière
Composante résiduelle
alors ∀h > k, ρ(h) = 0.
aj εt−j ,
j=0
Preuve : Cov(Xt , Xt+h ) =
k X
k
X
Modèles de
décomposition
2
Décomposition
Typologie
Modèles
paramétriques
Filtrage
Les trois composantes
Tendance
Composante
saisonnière
Composante résiduelle
Décomposition
Typologie
Modèles
paramétriques
Filtrage
Conclusion
ai aj Cov(εt−i , εt+h−j ).
Conclusion
3
Décomposition
Typologie
Modèles paramétriques
Filtrage
4
Conclusion
i=0 j=0
Or Cov(εt−i , εt+h−j ) = 0
Modèles de décomposition
Les trois composantes
Tendance
Composante saisonnière
Composante résiduelle
si h 6= j − i (car (εt ) b.b.).
21/34
22/34
Modélisation et
prévision
Décomposition des chroniques
Modèles paramétriques déterministes
F. Sur - ENSMN
Introduction
Méthodes de décomposition
Non-paramétriques
Modèles de
décomposition
Conclusion
(TD aujourd’hui)
23/34
Stochastiques Xt = µ + a1 Xt−1 + a2 Xt−2
+ · · · + εt
Modèle paramétrique :
Xt = a1 + a2 t +
| {z }
Tt
Décomposition
Typologie
Modèles
paramétriques
Filtrage
Moyennes mobiles
F. Sur - ENSMN
(Xt ) : chronique mensuelle (trimestrielle dans le poly.)
Les trois composantes
Tendance
Composante
saisonnière
Composante résiduelle
Paramétriques
Déterministes Xt = at + b + εt
δi : indicatrice du mois i.
Régression
(suite du cours)
(première partie)
12
X
12

X



bi = 0

 t.q.
i=1
24/34
Introduction
Modèles de
décomposition
bi δi (t) +u(t)
|i=1 {z
St
}
Estimation des paramètres aux moindres carrés des résidus :

!2
T
12

X
X



Xt − a1 − a2 t −
bi δi (t)

 min
ai ,bj
t=1
ARIMA
Modélisation et
prévision
i=1
Les trois composantes
Tendance
Composante
saisonnière
Composante résiduelle
Décomposition
Typologie
Modèles
paramétriques
Filtrage
Conclusion
Filtrage par moyennes mobiles
Modélisation et
prévision
Modélisation et
prévision
Décomposition d’une chronique par filtrage
F. Sur - ENSMN
Définition : moyenne mobile
Introduction
Introduction
Modèles de
décomposition
Modèles de
décomposition
Les trois composantes
Tendance
Composante
saisonnière
Composante résiduelle
Soit (Xt ) une chronique, et
Yt = M(Xt ) la chronique telle que
Décomposition
∀t, Yt =
m2
X
θi Xt+i
i=−m1
F. Sur - ENSMN
On cherche un filtre tel que
Typologie
Modèles
paramétriques
Filtrage
Décomposition
Typologie
Modèles
paramétriques
Filtrage
M(Tt ) = Tt ;
M(St ) = 0 ;
Conclusion
(Yt ) est obtenue de (Xt ) par filtrage par moyenne mobile.
Les trois composantes
Tendance
Composante
saisonnière
Composante résiduelle
Premier objectif : décomposition de Xt = Tt + St + ut .
M(ut )
Conclusion
aussi petit que possible .
de sorte que : M(Xt ) ' Tt
Remarque : M est un opérateur linéaire.
26/34
25/34
Les moyennes mobiles arithmétiques
Modélisation et
prévision
Filtre symétrique
Pm : m1 = m2 (= m), θi = θ−i
M(Xt ) = i=−m θi Xt+i .
F. Sur - ENSMN
Propriété
P
Une moyenne mobile symétrique telle que m
i=−m θi = 1
conserve les chroniques affines Xt = at + b.
Propriété
Parmi ces moy. mob., celles qui minimisent M(ut ) avec
1
(ut ) réalisation d’un b.b. faible (εt ) vérifient : ∀i, θi = 2m+1
.
Pm
Pm
Preuve : Var(M(εt )) = Var( i=−m θi εt+i ) = σ 2 i=−m θi2 ,
Pm
à minimiser, sous contrainte i=−m θi = 1.
Définition : moyenne mobile arithmétique
1
∀i ∈ {−m, . . . , m}, θi =
.
2m + 1
27/34
Introduction
Modèles de
décomposition
Modélisation et
prévision
Effet de Slutsky-Yule
F. Sur - ENSMN
Attention à l’apparition éventuelle d’une périodicité
artificielle .
Les trois composantes
Tendance
Composante
saisonnière
Composante résiduelle
3
Introduction
Modèles de
décomposition
Les trois composantes
Tendance
Composante
saisonnière
Composante résiduelle
1
0.8
2
0.6
Décomposition
1
Typologie
Modèles
paramétriques
Filtrage
Décomposition
Typologie
Modèles
paramétriques
Filtrage
0.4
0.2
0
0
Conclusion
−1
Conclusion
−0.2
−0.4
−2
−0.6
−3
0
50
100
150
200
250
300
350
400
450
bruit blanc gaussien, σ = 1
500
−0.8
0
50
100
150
200
250
300
350
400
Remarque : la variance du bruit est divisée par 2m + 1
(= 19).
28/34
450
500
lissage arithmétique, 2m + 1 = 19
Modélisation et
prévision
Saisonnalité et moyennes mobiles arithmétiques
Modélisation et
prévision
Récapitulatif
F. Sur - ENSMN
1
M2m+1 (Xt ) =
(Xt−m + Xt−m+1 + · · · + Xt+m ) .
2m + 1
Propriété
Les composantes saisonnières St de période 2m + 1 et de
moyenne nulle sur une période sont éliminées par M2m+1 :
M2m+1 (St ) = 0.
Introduction
F. Sur - ENSMN
Hypothèses : (Xt ) chronique à décomposer sous la forme :
Modèles de
décomposition
Les trois composantes
Tendance
Composante
saisonnière
Composante résiduelle
Xt = Tt + St + ut ,
avec
Tt linéaire
Décomposition
Typologie
Modèles
paramétriques
Filtrage
Conclusion
Modèles de
décomposition
Les trois composantes
Tendance
Composante
saisonnière
Composante résiduelle
Décomposition
St de période p et moyenne nulle sur la période.
Typologie
Modèles
paramétriques
Filtrage
Conclusion
Alors :
Mp (Xt ) = Mp (Tt ) + Mp (St ) + Mp (ut ) ' Tt .
Généralisation : composantes saisonnières de période 2m :
1
1
1
M2m (Xt ) =
Xt−m + Xt−m+1 + · · · + Xt+m−1 + Xt+m .
2m 2
2
Mk (St + ut ) ' St
si k << p
Problème : pas forcément de moyenne nulle sur une période.
Mk (St + ut ) − Mp Mk (St + ut ) est de moyenne nulle.
Discussion détaillée du filtrage : cf traitement du signal.
29/34
30/34
Un algorithme de décomposition par filtrage
Modélisation et
prévision
Généralisation
F. Sur - ENSMN
Décomposition de Xt = Tt + St + ut .
1
périodogramme, connaissances → période p de St .
2
estimation de la tendance : Tt = Mp (Xt )
3
estimation de Σt = St + ut par Σt = Xt − Tt
4
5
6
estimation de la composante saisonnière : St = M 0 (Σt )
avec M 0 (Σt ) = Mk (Σt ) − Mp Mk (Σt ) et k petit estimation de la série corrigée des variations
saisonnières (cvs) : Xt0 = Xt − St
Modélisation et
prévision
F. Sur - ENSMN
Introduction
Introduction
Modèles de
décomposition
Modèles de
décomposition
Les trois composantes
Tendance
Composante
saisonnière
Composante résiduelle
moyennes mobiles non-artithmétiques pour tendance de
degré > 1.
Décomposition
31/34
Introduction
filtrage itératif
Typologie
Modèles
paramétriques
Filtrage
Conclusion
Remarque : c’est l’idée du programme Census X11 (1965).
→ tendance, saisonnalité, données c.v.s., résidus.
composante résiduelle ut = Xt0 − Tt
32/34
Les trois composantes
Tendance
Composante
saisonnière
Composante résiduelle
Décomposition
Typologie
Modèles
paramétriques
Filtrage
Conclusion
Séance 1
Modélisation et
prévision
Conclusion
F. Sur - ENSMN
1
Introduction
Introduction
Modèles de
décomposition
2
Modèles de décomposition
Les trois composantes
Tendance
Composante saisonnière
Composante résiduelle
F. Sur - ENSMN
Décomposition (additive / multiplicative / mixte) d’une
chronique :
Les trois composantes
Tendance
Composante
saisonnière
Composante résiduelle
tendance,
composante saisonnière (période ?),
composante résiduelle / irrégulière
(processus stationnaire).
Décomposition
Typologie
Modèles
paramétriques
Filtrage
Conclusion
3
4
33/34
Décomposition
Typologie
Modèles paramétriques
Filtrage
Modélisation et
prévision
Introduction
Modèles de
décomposition
Les trois composantes
Tendance
Composante
saisonnière
Composante résiduelle
Décomposition
Typologie
Modèles
paramétriques
Filtrage
Conclusion
Dans ce cours :
filtrage (moyennes mobiles, Census X11)
→ en TD aujourd’hui.
processus ARIMA
→ jusque la fin du cours.
Conclusion
34/34