TP n 1 Séries chronologiques - IRMA
Transcription
TP n 1 Séries chronologiques - IRMA
Master 2 de Statistique Université de Strasbourg - 2010/2011 T. P. no 1 Séries chronologiques 1. Introduction Dans ces premiers travaux pratiques, nous allons approfondir quelques notions évoquées oralement en cours mais qui n’ont pas été développées par manque de temps. Nous allons surtout nous intéresser à des questions d’ordre pratique. Tout d’abord, lorsque nous étudions une série chronologique, nous supposons que nous savons identifier dans cette série la présence d’une tendance et/ou la présence d’une composante saisonnière. Naturellement, nous recommandons de tracer le graphe de la chronique pour détecter éventuellement ces deux composantes mais même après l’examen de ce graphe, il est parfois difficile de conclure sur l’éventuelle présence ou absence de l’une et/ou de l’autre composante. Une autre question qui se pose du même genre que celle précédemment est : quel est le type de schéma de composition à envisager ? En fait, nous nous rendons compte parfois que les deux questions peuvent être liées et être résolues en même temps. Comme nous le disions précédemment, nous commençons par représenter la série chronologique par un graphe. Par exemple, si la série présente des variations saisonnières, les points hauts (maxima) ainsi que les points bas (minima) sont toujours distants du même nombre de dates, ce nombre étant la période p de la composante saisonnière. 2. Premier exemple : Voyageurs RATP, issu de Introduction à la méthode statistique de B. Goldfarb et C. Pardoux, Dunod, 2004. Cet exemple provient du Bulletin Mensuel de la Statistique, INSEE . Le fichier de données est disponible sur le site : http ://www-irma.u-strasbg.fr/∼mmaumy/enseignement/M2Stats2010.html À partir du fichier, tracer la représentation de la série. Qu’observez-vous ? Relier les maxima à partir du mois d’octobre 1995. Relier les minima à partir du mois d’août 1996. Qu’observez-vous maintenant ? 3. Deuxième exemple : Indices de volume des ventes de boissons, issu de Introduction à la méthode statistique de B. Goldfarb et C. Pardoux, Dunod, 2004. Cet exemple provient du Bulletin Mensuel de la Statistique, INSEE . Le fichier de données est disponible sur le site : http ://www-irma.u-strasbg.fr/∼mmaumy/enseignement/M2Stats2010.html À partir du fichier, tracer la représentation de la série. Qu’observez-vous ? Il est conseillé de faire un changement de variable sur les données brutes. Quel changement de variable devez-vous faire à la vue du graphique ? Le changement indiqué est le changement logarithmique, effectuer-le. Qu’observez-vous maintenant ? Expliquer en quelques mots pourquoi ce changement était nécessaire à l’analyse de la série chronologique. 1 Master 2 de Statistique Université de Strasbourg - 2010/2011 4. Choix du modèle de composition Pour choisir le modèle de composition, il existe plusieurs techniques. Nous présentons ici une technique simple pour sélectionner le modèle de composition : la procédure de la bande. Cette dernière consiste à relier par une courbe (ou plutôt par une ligne brisée) les maxima distants d’une période p et faire de même avec les minima. a) Si ces deux courbes sont à peu près parallèles, alors le facteur saisonnier a des amplitudes à peu près constantes, c’est-à-dire qu’il affecte la tendance indépendamment de son niveau, et le schéma additif est adapté. C’est le cas de la chronique des Voyageurs RATP de 1995 à 2002. b) Sinon, nous représentons la chronique sur un « papier » à ordonnée logarithmique. Si les deux courbes reliant les extrema sont à peu près parallèles, alors le facteur saisonnier a des amplitudes à peu près proportionnelles à la tendance, c’est-à-dire que les effets des variations saisonnières sont proportionnels au niveau atteint par la tendance, et le schéma multiplicatif est adapté. C’est le cas de la chronique des Indices de volume des ventes de boissons de 1995 à 2002. Le modèle multiplicatif convient dans la plupart des cas puisque d’une part, l’effet saisonnier est généralement proportionnel à la tendance, et que d’autre part, dans le cas d’une chronique à tendance faiblement croissante ou faiblement décroissante, les deux schémas sont quasiment équivalents. C’est une des raisons pour laquelle en pratique nous n’évoquons bien souvent que le modèle multiplicatif. 5. Un exemple de décomposition d’une série chronologique Nous allons maintenant montrer les étapes successives du traitement de la chronique des ventes trimestrielles en France d’essences aviation. Cet exemple provient du Comité Professionnel du Pétrole et est issu de Introduction à la méthode statistique de B. Goldfarb et C. Pardoux, Dunod, 2004. Le fichier de données est le suivant : 1999 2000 2001 2002 1er trimestre 2ème trimestre 3ème trimestre 4ème trimestre 4, 0 7, 8 9, 2 4, 6 4, 6 7, 9 9, 0 14, 7 4, 0 7, 6 8, 0 4, 8 4, 3 7, 3 8, 1 3, 8 1. Tracer le graphique correspondant à la chronique. Qu’observe-t-on ? À partir de maintenant et ce jusqu’à la question 6., nous allons modéliser la chronique par un schéma additif (Xt = Ft + St + Et ). 2. Tracer sur le même graphique que précédemment la suite des moyennes mobiles de longueur 4. Pour cela, faire apparaître dans un tableau les calculs nécessaires pour tracer cette série chronologique. 3. Dans ce même tableau, calculer les valeurs numériques de la différence entre la valeur observée et la valeur de la tendance obtenue par la méthode des moyennes mobiles. 2 Master 2 de Statistique Université de Strasbourg - 2010/2011 4. Dans ce même tableau, calculer dans le même tableau les coefficients saisonniers Stj . Combien y en-a-t-il ? Est-ce que la somme des coefficients saisonniers Stj dont vous avez obtenu une valeur numérique est nulle ? Si non, vous devez corriger ces coefficients saisonniers Stj en faisant le coefficient saisonnier Stj moins leur moyenne et afficher ce calcul dans ce même tableau. Ces nouveaux coefficients seront notés St∗j . 5. Dans ce même tableau, calculer les coefficients de la série CVS. 6. Dans ce même tableau, calculer les coefficients de la série des écarts. À partir de maintenant et ce jusqu’à la question 12., nous allons modéliser la chronique par un schéma multiplicatif (Xt = Ft × (1 + St ) × (1 + Et )). 7. Dans un nouveau tableau, reporter les coefficients de la suite des moyennes mobiles de longueur 4. 8. Dans ce même tableau, calculer les valeurs numériques du rapport entre la valeur observée et la valeur de la tendance obtenue par la méthode des moyennes mobiles. 9. Dans ce même tableau, calculer la composante saisonnière, à savoir 1 + St . Est-ce que la somme des coefficients Stj est nulle ? Si non, vous devez corriger ces coefficients saisonniers et recalculer la nouvelle composante saisonnière, à savoir 1 + St∗ . 10. Dans ce même tableau, calculer les coefficients de la série CVS. 11. Dans ce même tableau, calculer la série des 1 + Et , puis la série des Et et enfin la série des écarts. 12. Tracer sur un nouveau support, le graphique correspondant à la chronique, la série CVS obtenue par le modèle additif et la série CVS obtenue par le modèle multiplicatif. Qu’observe-t-on ? Sur un autre graphique, comparer la série des écarts du modèle additif et la série des écarts du modèle multiplicatif. 6. À vous maintenant Les exercices qui suivent sont issus du livre de B. Goldfarb et C. Pardoux, intitulé Introduction à la méthode statistique, aux éditions Dunod, Quatrième édition, 2004. Exercice 1. Sans contexte. t 1 2 3 4 5 6 7 8 9 10 11 12 xt 3 −1 5 1 3 −1 5 1 3 −1 5 1 a) Calculer les moyennes mobiles de longueurs 2, 3, 4 et 5. Quelles sont les propriétés de la moyenne mobile qui sont illustrées par cet exemple ? b) Soit la chronique zt = 10 − 2t + xt , calculer la suite des moyennes mobiles de longueur 4 de la nouvelle chronique zt . 3 Master 2 de Statistique Université de Strasbourg - 2010/2011 Exercice 2. Boissons et alcools. Le tableau ci-dessous donne les valeurs des indices trimestriels (base 1995) de la production des « Boissons et alcools » pour les années 1998 à 2002. Cet exemple provient encore une fois du Bulletin Mensuel de la Statistique, INSEE . 1998 1999 2000 2001 2002 1er trimestre 2ème trimestre 3ème trimestre 4ème trimestre 95, 5 99, 6 104, 1 133, 5 94, 6 101, 8 100, 5 131, 4 83, 2 93, 7 100, 1 139, 2 86, 6 94, 6 104, 8 138, 9 89, 9 98, 4 105, 7 137, 9 a) Tracer le graphique correspondant à la chronique. Commenter l’évolution de cette chronique. Quel type de schéma de composition peut-on proposer ? b) Dans un tableau, déterminer la tendance de cette chronique en utilisant la méthode des moyennes mobiles de longueur à déterminer. Représenter sur le même graphique cette série. c) Dans ce même tableau, calculer les coefficients saisonniers. d) Dans ce même tableau, calculer la série CVS. Ajuster cette série par une droite en utilisant la méthode des moindres carrés ordinaires. e) À la vue des résultats, quelles prévisions pouvions-nous faire au dernier trimestre 2002 pour les deux premiers trimestres 2003 ? Sachant que cet indice a pris les valeurs 87,4 et 95,1 pour les premiers et deuxième trimestres 2003, calculer l’erreur moyenne et l’erreur absolue moyenne de prévision. Exercice 3. Le cinéma. Voici pour ses trois premiers mois d’ouverture, le nombre de places xt vendues par semaine par un cinéma (t désigne le numéro de la semaine.) t 1 2 3 4 5 6 7 8 9 10 11 12 xt 3428 3295 3376 3195 3573 3334 3434 3300 3703 3411 3545 3327 a) Représenter la chronique graphiquement. A-t-elle une composante saisonnière ? Si oui, de quelle période ? b) Dans un tableau, déterminer la tendance de cette chronique en utilisant la méthode des moyennes mobiles de longueur à déterminer. Représenter sur le même graphique cette série. c) Dans ce même tableau, calculer les coefficients saisonniers. d) Dans ce même tableau, calculer la série CVS. Représenter-la sur le même graphique. Calculer la série des résidus. e) Ajuster la série CVS par une droite en utilisant la méthode des moindres carrés ordinaires. Représenter cette droite sur le même graphique. f) Donner une prévision pour le nombre de places vendues pendant les deux premières semaines du quatrième mois. 4 Master 2 de Statistique Université de Strasbourg - 2010/2011 7. D’autres procédures pour savoir si il y a une tendance et/ou une composante saisonnière Ce paragraphe est issu du livre de R. Bourbonnais et M. Terraza, Analyse des séries temporelles, aux éditions Dunod, 2008. L’examen visuel du graphique ou du tableau ne permet pas toujours de déterminer avec certitude l’existence d’une saisonnalité, de surcroît il est interdit l’automastisme de traitement qui peut s’avérer nécessaire dans le cas d’un nombre important de séries à examiner. Le test de Fisher à partir de l’analyse de la variance permet de pallier ces deux inconvénients. Ce test suppose la chronique sans tendance ou encore sans extra-saisonnalité. Dans le cas contraire, cette composante est éliminée par une régression sur le temps (extrasaisonnalité déterministe), ou par une procédure de filtrage (extra-saisonnalité aléatoire). 7.1. Notations. – N le nombre d’années – p le nombre d’observations (la période) dans l’année (trimestre p = 4, mois p = 12, etc.) – xij la valeur de la série chronologique pour la ieme année (i = 1, . . . , N ) et la j eme période (j = 1, . . . , p) supposée telle que xij = mij + eij . Les eij sont les résidus considérés comme aléatoires formés d’éléments indépendants : eij → N (O, σ 2 ). – Les mij sont les éléments d’une composante de la série chronologique qui s’écrivent : mij = ai + bj abec bj qui mesure l’effet période en colonne du tableau et ai qui mesure l’effet année en ligne du tableau. 7.2. Mise en place du test. Deux effets absents sont testés contre deux effets significativement présents : a) Si l’effet période est significatif, la série chronologique est saisonnière ; b) Si l’effet année est significatif, ceci suggère deux interpétations – la chronique de départ n’a pas été transformée, elle possède alors des paliers horizontaux – la chronique de départ a été transformée, des changements de tendance existent dans la chronique. 7.3. Construction du tableau de l’ANOVA. Le tableau de l’analyse de la variance peut être construit avec le logiciel R à l’aide de la fonction aov. Procéder au test sur l’un des exemples précédents. Vous vérifierez également l’hypothèse de normalité sous-jacente au modèle linéaire à laide du test de Shapiro-Wilk implémenté dans R par la fonction shapiro.test. 5