Chapitre 4. Séries chronologiques
Transcription
Chapitre 4. Séries chronologiques
Chapitre 4. Séries chronologiques [email protected] Analyse des séries chronologiques Estimation des composantes d’une série Correction des variations saisonnières et prédiction Exemple introductif 1 On considère la consommation mensuelle, exprimée en kWh, d’un particulier, relevée durant trois années consécutives. Janv Fév Mars Avr Mai Juin Juil Août Sept Oct Nov Déc 2012 312 315 291 307 305 303 320 328 298 309 310 334 2013 315 319 299 314 306 304 325 331 304 310 317 332 2014 320 324 302 318 309 308 330 333 309 315 319 339 Figure: Consommation d’électricité de janvier 2012 à décembre 2014 2 / 29 Analyse des séries chronologiques Estimation des composantes d’une série Correction des variations saisonnières et prédiction Exemple introductif 2 On considère les chiffres d’affaires trimestriel, en milliers d’euros, d’une entreprise au cours de quatre années consécutives : Trimestres 1 2 3 4 2011 55 63 169 324 2012 231 175 378 627 2013 406 287 587 933 2014 585 399 795 1231 Figure: Chiffres d’affaire du 1er trimestre de 2011 au 4ème trimestre de 2014 3 / 29 Analyse des séries chronologiques Estimation des composantes d’une série Correction des variations saisonnières et prédiction Présentation Définition On appelle série chronologique toute suite y d’observations numériques d’une grandeur effectuées à intervalles réguliers (appelés saisons) au cours de plusieurs années. On note : I p : le nombre de saisons c’est-à-dire la période ; I n : le nombre d’années ; I yt : la valeur de la série à l’instant t. Exemple 1 : la série y est la consommation d’électricité, le nombre d’années est n = 3, la période est p = 12 et y1 = 312, y12 = 334, y13 = 315 et y25 = 320. Exemple 2 : la série y est le chiffre d’affaires, le nombre d’années est n = 4, la période est p = 4 et y1 = 55, y4 = 324, y5 = 231 et y11 = 587. 4 / 29 Analyse des séries chronologiques Estimation des composantes d’une série Correction des variations saisonnières et prédiction Problématique I Pour toute série chronologique, deux questions se posent : Comment peut-on comparer des données de la série issues de deux saisons différentes ? Peut-on prévoir des valeurs futures de la série ? I Pour répondre à ces deux questions, nous écrirons la série comme une combinaison de trois composantes. I L’objectif est de fournir des méthodes permettant : d’estimer ces trois composantes ; de comparer les données de la série ; de prévoir des données futures. 5 / 29 Analyse des séries chronologiques Estimation des composantes d’une série Correction des variations saisonnières et prédiction Sommaire 1 Analyse des séries chronologiques Composantes d’une série chronologique Modèles considérés 2 Estimation des composantes d’une série Estimation de la tendance Estimation des composantes saisonnières 3 Correction des variations saisonnières et prédiction Correction des variations saisonnières Prédiction 6 / 29 Analyse des séries chronologiques Estimation des composantes d’une série Correction des variations saisonnières et prédiction Composantes d’une série chronologique Décomposition d’une série chronologique I Toute valeur yt de la série met en évidence trois composantes : la tendance générale gt (appelée également trend), qui correspond à l’évolution à long terme de la série ; la composante saisonnière st∗ , qui correspond à des fluctuations périodiques se reproduisant de façon plus ou moins identique d’une période à l’autre ; la composante aléatoire at , qui correspond à des fluctuations irrégulières et imprévisibles. I Dans ce qui suit : on présentera les trois composantes de la série ; on fournira une méthode permettant d’avoir des estimations de la tendance générale et de la composante saisonnière. 7 / 29 Analyse des séries chronologiques Estimation des composantes d’une série Correction des variations saisonnières et prédiction Composantes d’une série chronologique Tendance générale Exemple : reprenons la consommation d’électricité. I Graphiquement, on constate que la consommation d’électricité a tendance a augmenté. I On peut justifier rigoureusement un tel phénomène en faisant une régression linéaire par la méthode des moindres carrés. I Pour rendre légitimes les calculs que nous ferons ultérieurement, on supposera que la tendance présente une faible courbure. 8 / 29 Analyse des séries chronologiques Estimation des composantes d’une série Correction des variations saisonnières et prédiction Composantes d’une série chronologique Composante saisonnière Exemple : reprenons la consommation d’électricité. I Graphiquement, on constate que la consommation d’électricité admet des pics "positifs" en août et décembre et "négatifs" en mars et juin. I On fournira une méthode permettant d’étudier l’impact que peut avoir une saison (ici un mois) sur la série chronologique. I Pour rendre légitimes les calculs que nous ferons ultérieurement, on supposera que les composantes st∗ sont périodiques (de période p) et ont une influence nulle sur l’année. 9 / 29 Analyse des séries chronologiques Estimation des composantes d’une série Correction des variations saisonnières et prédiction Composantes d’une série chronologique Composante aléatoire Exemple : reprenons la consommation d’électricité. I Graphiquement, on constate que les pics "positifs" et "négatifs" observés pour certaines saisons ne sont pas exactement réguliers. I Un tel phénomène est dû, en particulier, au fait que la composante aléatoire "casse" la monotonie des cycles. I Pour rendre légitimes les calculs que nous ferons ultérieurement, on supposera que les composantes at sont négligeables. 10 / 29 Analyse des séries chronologiques Estimation des composantes d’une série Correction des variations saisonnières et prédiction Modèles considérés Présentation des modèles I Une série temporelle consiste à supposer qu’elle est régie par une certaine fonction. I Dans ce qui suit, on se limitera à deux types de modèles : les modèles additifs ; les modèles multiplicatifs. 11 / 29 Analyse des séries chronologiques Estimation des composantes d’une série Correction des variations saisonnières et prédiction Modèles considérés Modèle additif I On parle de modèle additif, lorsqu’on cherche y sous la forme : yt = gt + st∗ + at . I Rappelons que : la participation de la composante saisonnière est nulle sur l’année : s1∗ + · · · + sp∗ = 0; p la composante aléatoire est négligeable, c’est-à-dire at ' 0. Remarque : pour savoir si l’on peut prendre un modèle additif pour une série y , on procède comme suit : I on trace les bornes supérieure et inférieure associées aux pics "positif" et "négatif" du graphe de la série ; I on prend le modèle additif uniquement lorsque la largeur de la bande associée est presque constante. Exemple : pour la consommation d’électricité, le modèle additif est approprié. 12 / 29 Analyse des séries chronologiques Estimation des composantes d’une série Correction des variations saisonnières et prédiction Modèles considérés Modèle multiplicatif I On parle de modèle multiplicatif, lorsqu’on cherche y sous la forme yt = gt × st∗ × at . I Rappelons que : la participation de la composante saisonnière est nulle sur l’année : s1∗ × · · · × sp∗ 1/p = 1; la composante aléatoire est négligeable, c’est-à-dire at ' 1. Remarque : pour savoir si l’on peut prendre un modèle multiplicatif pour une série y , on procède comme suit : I on trace les bornes supérieure et inférieure associées aux pics "positif" et "négatif" du graphe de la série ; I on prend le modèle multiplicatif lorsque la largeur de la bande associée est significativement croissante ou décroissante. Exemple : pour les chiffres d’affaire, le modèle multiplicatif est approprié. 13 / 29 Analyse des séries chronologiques Estimation des composantes d’une série Correction des variations saisonnières et prédiction 1 Analyse des séries chronologiques 2 Estimation des composantes d’une série Estimation de la tendance Estimation des composantes saisonnières 3 Correction des variations saisonnières et prédiction 14 / 29 Analyse des séries chronologiques Estimation des composantes d’une série Correction des variations saisonnières et prédiction Estimation de la tendance Méthodes générales pour estimer la tendance But : estimer la tendance générale gt . Méthodes : il existe deux façons classiques pour estimer la tendance générale : I la régression (linéaire ou plus complexe) de yt en fonction de t ; avantage : les calculs sont simples ; inconvénient : à cause des effets saisonniers, la régression (linéaire ou plus complexe) n’est pas toujours appropriée ; I la méthode des moyennes mobiles (présentée à la page suivante). Remarques : I I ∼ On désigne par g t une estimation de gt obtenue soit par régression soit par la méthode des moyennes mobiles. Les méthodes permettant d’estimer la tendance générale sont indépendantes des modèles (additif ou multiplicatif) choisis. 15 / 29 Analyse des séries chronologiques Estimation des composantes d’une série Correction des variations saisonnières et prédiction Estimation de la tendance Moyennes mobiles Définition Considérons une série chronologique y et un instant t. On appelle moyennes mobiles d’ordre 2,3,4 et 5 les quantités définies par : Ordre k 2 3 4 5 (k) Moyenne mobile d’ordre Mt (2) yt+1 Mt = 21 yt−1 2 + yt + 2 (3) Mt (4) Mt = (5) Mt = = 1 yt−2 4 2 1 (y t−2 5 1 3 (yt−1 + yt + yt+1 ) + yt−1 + yt + yt+1 + yt+2 2 + yt−1 + yt + yt+1 + yt+2 ) Dans le même esprit, on peut définir des moyennes mobiles d’ordre k. I Lorsque k est pair, les valeurs des indices extrêmes sont pondérés par 21 et les autres par 1. I Lorsque k est impair, toutes les valeurs sont pondérées par 1. 16 / 29 Analyse des séries chronologiques Estimation des composantes d’une série Correction des variations saisonnières et prédiction Estimation de la tendance Exemple 1 de moyennes mobiles Exemple 1 : reprenons la consommation d’électricité avec des moyennes ∼ (3) mobiles d’ordre k = 3. Ici, on a donc g t = Mt ' gt . Janv 2012 Fév Mars Avr Mai Juin Juil Août Sept Oct Nov Déc 306 304 301 305 309 317 315 312 306 318 320 323 2013 323 311 310 306 308 312 320 320 315 310 320 2014 325 315 315 310 312 316 324 324 319 314 324 Figure: Consommation réelle (bleu) et moyennes mobiles (vert) 17 / 29 Analyse des séries chronologiques Estimation des composantes d’une série Correction des variations saisonnières et prédiction Estimation de la tendance Exemple 2 de moyennes mobiles Exemple 2 : reprenons les chiffres d’affaire avec des moyennes mobiles ∼ (4) d’ordre k = 4. Ici, on a donc g t = Mt ' gt . Trimestres 1 2 2011 3 4 175 211 2012 251 315 375 411 2013 451 515 576 612 2014 652 715 Figure: Consommation réelle (bleu) et moyennes mobiles (vert) 18 / 29 Analyse des séries chronologiques Estimation des composantes d’une série Correction des variations saisonnières et prédiction Estimation de la tendance Remarques I En pratique, l’ordre des moyennes mobiles doit être choisi comme le nombre de saisons considérés dans l’année c’est-à-dire k = p (pour l’exemple 1, nous avons pris k = 3 et p = 12 pour des raisons pédagogiques ; pour l’exemple 2, nous avons k = p = 4). I La méthode des moyennes mobiles permet : de lisser la courbe (du fait que l’on considère des moyennes) ; d’"éliminer" la composante aléatoire ; de mieux visualiser la tendance. I L’inconvénient des moyennes mobiles par rapport à la régression linéaire est que l’on perd des informations sur les premières et les dernières données. 19 / 29 Analyse des séries chronologiques Estimation des composantes d’une série Correction des variations saisonnières et prédiction Estimation des composantes saisonnières Méthode générale pour estimer les composantes saisonnières But : estimer la composante saisonnière st∗ . Méthode : on procède en 4 étapes comme suit : Etapes 1 Modèle additif yt = gt + st∗ Calculer St = yt − 2 Calculer st = 3 Calculer s 4 Calculer ∼ gt St +St+1 +···+St+np n s +s +···+sp = 1 2p st∗ = st − s Modèle multiplicatif yt = gt × st∗ Calculer St = yt ∼ gt Calculer (S1 × S2 × · · · × St+np )1/n Calculer s = (s1 × s2 × · · · × sp )1/p Calculer st∗ = st s Remarque : les calculs des coefficients dépendent du modèle (additif ou multiplicatif) choisi. 20 / 29 Analyse des séries chronologiques Estimation des composantes d’une série Correction des variations saisonnières et prédiction Estimation des composantes saisonnières Exemple 1 ∼ (3) Exemple 1 : reprenons la consommation d’électricité avec g t = Mt . (3) 1 On calcule les St − Mt . 2 On calcule la moyenne arithmétique st de chaque mois. 3 On calcule la moyenne arithmétique s de tous les mois (ici s = −2). 4 On calcule les coefficients saisonniers normalisés st∗ = st − s. Janv 2012 Fév Mars Avr Mai Juin Juil Août Sept Oct Nov Déc 9 -13 6 0 -6 3 13 -14 3 -8 14 9 2013 -8 8 -12 8 -2 -8 5 11 -11 0 -3 2014 -5 9 -13 8 -3 -8 6 9 -10 1 -5 st -6.5 8.7 -12.7 7.3 -1.7 -7.3 4.7 11 -11.7 1.3 -5.3 11.5 st∗ -4.5 10.7 -10.7 5.3 0.3 -5.3 2.7 9 -9.7 3.3 -3.3 9.5 21 / 29 Analyse des séries chronologiques Estimation des composantes d’une série Correction des variations saisonnières et prédiction Estimation des composantes saisonnières Exemple 2 ∼ (4) Exemple 2 : reprenons les chiffres d’affaire avec g t = Mt . St (4) . Mt 1 On calcule les 2 On calcule la moyenne géométrique st de chaque mois. 3 On calcule la moyenne géométrique s de tous les mois (ici s = 0.94). 4 On calcule les coefficients saisonniers normalisés st∗ = Trimestres 1 2 2011 3 4 0.97 1.54 2012 0.92 0.56 1.01 1.53 2013 0.90 0.56 1.02 1.53 2014 0.90 0.56 st 0.91 0.56 1.00 1.53 st∗ 0.97 0.60 1.06 1.63 st s . 22 / 29 Analyse des séries chronologiques Estimation des composantes d’une série Correction des variations saisonnières et prédiction 1 Analyse des séries chronologiques 2 Estimation des composantes d’une série 3 Correction des variations saisonnières et prédiction Correction des variations saisonnières Prédiction 23 / 29 Analyse des séries chronologiques Estimation des composantes d’une série Correction des variations saisonnières et prédiction Correction des variations saisonnières Série corrigée des variations saisonnières Définition Considérons une série chronologique y . I Dans le cas du modèle additif, c’est-à-dire yt = gt + st∗ + at , on appelle série corrigée des variations saisonnières (CVS) la série yt0 = yt − st∗ . I Dans le cas du modèle multiplicatif, c’est-à-dire yt = gt × st∗ × at , on appelle série corrigée des variations saisonnières (CVS) la série yt0 = sy∗t . t Remarques : I L’intérêt de la série CVS est qu’elle permet de comparer deux valeurs issues de deux saisons différentes. I La définition de la série CVS dépend du modèle choisi. 24 / 29 Analyse des séries chronologiques Estimation des composantes d’une série Correction des variations saisonnières et prédiction Correction des variations saisonnières Exemple 1 Exemple 1 : reprenons la consommation d’électricité. Les valeurs de la série CVS sont données dans le tableau suivant : Janv Fév Mars Avr Mai Juin Juil Août Sept Oct Nov Déc 2012 317 304 302 302 305 308 317 309 308 306 313 325 2013 320 308 310 309 306 309 322 322 314 307 320 323 2014 325 313 313 313 309 313 327 324 319 312 322 330 Figure: Consommation réelle (bleu) et corrigée (vert) 25 / 29 Analyse des séries chronologiques Estimation des composantes d’une série Correction des variations saisonnières et prédiction Correction des variations saisonnières Exemple 2 Exemple 2 : reprenons les chiffres d’affaire. Les valeurs de la série CVS sont données dans le tableau suivant : Trimestres 1 2 3 4 2011 57 106 159 198 2012 239 295 355 384 2013 420 483 552 571 2014 605 672 747 754 Figure: Consommation réelle (bleu) et corrigée (vert) 26 / 29 Analyse des séries chronologiques Estimation des composantes d’une série Correction des variations saisonnières et prédiction Prédiction Principe But : prédire la valeur de yt , où t est un temps futur. Méthode 1 : (k) 1 estimer la tendance par moyennes mobiles Mt ; ∗ 2 calculer les coefficients saisonniers st ; (k) 3 effectuer une régression linéaire Tt des moyennes mobiles Mt ; 4 en déduire une valeur approchée de yt en remarquant que : yt ' Tt + st∗ pour le modèle additif ; yt ' Tt × st∗ pour le modèle multiplicatif. Méthode 2 : 1 estimer la tendance par régression linéaire Tt0 de la série initiale Tt0 ; ∗ 2 calculer les coefficients saisonniers s 0 t ; 3 en déduire une valeur approchée de yt en remarquant que : ∗ yt ' Tt0 + s 0 t pour le modèle additif ; ∗ yt ' Tt0 × s 0 t pour le modèle multiplicatif. Remarque : la méthode 1 est plus longue que la méthode 2 mais elle donne une approximation plus précise. 27 / 29 Analyse des séries chronologiques Estimation des composantes d’une série Correction des variations saisonnières et prédiction Prédiction Exemple Exemple : on reprend la consommation d’électricité. On s’intéresse à une valeur approchée de la consommation en avril 2015 c’est-à-dire à yt avec t = 40. Pour cela, on applique la méthode 1 : 1 on a déjà déterminé les moyennes mobiles d’ordre 3 (page 17) ; 2 on a également calculé les coefficients saisonniers et en particulier ∗ celui d’avril donné par : s40 = s4∗ = 5.3 (page 21) ; 3 on obtient, par la méthode des moindres carrés, qu’une régression linéaire des moyennes mobiles est Tt = 0.414t + 307.2 ; 4 on en déduit qu’une prévision de la consommation en avril 2015 est : y40 ' (0.414 × 40 + 307.2) + 5.3 = 329.06. 28 / 29 Analyse des séries chronologiques Estimation des composantes d’une série Correction des variations saisonnières et prédiction Prédiction L’essentiel I Comparaison de données issues de saisons différentes : 1 2 3 4 I déterminer le modèle ; calculer la tendance par régression ou moyennes mobiles ; calculer les coefficients saisonniers ; déterminer la série corrigée des variations saisonnières. Prédiction : 1 2 3 4 déterminer le modèle ; calculer la tendance par régression ; calculer les coefficients saisonniers ; prédire des données futures. 29 / 29