TP n 1 Séries chronologiques - IRMA

Commentaires

Transcription

TP n 1 Séries chronologiques - IRMA
Master 2 de Statistique
Université de Strasbourg - 2010/2011
T. P. no 1
Séries chronologiques
1. Introduction
Dans ces premiers travaux pratiques, nous allons approfondir quelques notions évoquées oralement en cours mais qui n’ont pas été développées par manque de temps.
Nous allons surtout nous intéresser à des questions d’ordre pratique.
Tout d’abord, lorsque nous étudions une série chronologique, nous supposons que
nous savons identifier dans cette série la présence d’une tendance et/ou la
présence d’une composante saisonnière. Naturellement, nous recommandons
de tracer le graphe de la chronique pour détecter éventuellement ces deux composantes mais même après l’examen de ce graphe, il est parfois difficile de conclure sur
l’éventuelle présence ou absence de l’une et/ou de l’autre composante.
Une autre question qui se pose du même genre que celle précédemment est : quel est
le type de schéma de composition à envisager ? En fait, nous nous rendons compte
parfois que les deux questions peuvent être liées et être résolues en même temps.
Comme nous le disions précédemment, nous commençons par représenter la série
chronologique par un graphe.
Par exemple, si la série présente des variations saisonnières, les points hauts
(maxima) ainsi que les points bas (minima) sont toujours distants du même nombre
de dates, ce nombre étant la période p de la composante saisonnière.
2. Premier exemple : Voyageurs RATP, issu de Introduction à la
méthode statistique de B. Goldfarb et C. Pardoux, Dunod, 2004.
Cet exemple provient du Bulletin Mensuel de la Statistique, INSEE . Le fichier de
données est disponible sur le site :
http ://www-irma.u-strasbg.fr/∼mmaumy/enseignement/M2Stats2010.html
À partir du fichier, tracer la représentation de la série. Qu’observez-vous ? Relier les
maxima à partir du mois d’octobre 1995. Relier les minima à partir du mois d’août
1996. Qu’observez-vous maintenant ?
3. Deuxième exemple : Indices de volume des ventes de boissons, issu de
Introduction à la méthode statistique de B. Goldfarb et C. Pardoux,
Dunod, 2004.
Cet exemple provient du Bulletin Mensuel de la Statistique, INSEE . Le fichier de
données est disponible sur le site :
http ://www-irma.u-strasbg.fr/∼mmaumy/enseignement/M2Stats2010.html
À partir du fichier, tracer la représentation de la série. Qu’observez-vous ? Il est
conseillé de faire un changement de variable sur les données brutes. Quel changement
de variable devez-vous faire à la vue du graphique ? Le changement indiqué est le
changement logarithmique, effectuer-le. Qu’observez-vous maintenant ? Expliquer
en quelques mots pourquoi ce changement était nécessaire à l’analyse de la série
chronologique.
1
Master 2 de Statistique
Université de Strasbourg - 2010/2011
4. Choix du modèle de composition
Pour choisir le modèle de composition, il existe plusieurs techniques. Nous présentons
ici une technique simple pour sélectionner le modèle de composition : la procédure
de la bande. Cette dernière consiste à relier par une courbe (ou plutôt par une ligne
brisée) les maxima distants d’une période p et faire de même avec les minima.
a) Si ces deux courbes sont à peu près parallèles, alors le facteur saisonnier a
des amplitudes à peu près constantes, c’est-à-dire qu’il affecte la tendance
indépendamment de son niveau, et le schéma additif est adapté. C’est le cas
de la chronique des Voyageurs RATP de 1995 à 2002.
b) Sinon, nous représentons la chronique sur un « papier » à ordonnée logarithmique. Si les deux courbes reliant les extrema sont à peu près parallèles,
alors le facteur saisonnier a des amplitudes à peu près proportionnelles à la
tendance, c’est-à-dire que les effets des variations saisonnières sont proportionnels au niveau atteint par la tendance, et le schéma multiplicatif est
adapté. C’est le cas de la chronique des Indices de volume des ventes de
boissons de 1995 à 2002.
Le modèle multiplicatif convient dans la plupart des cas puisque d’une part, l’effet
saisonnier est généralement proportionnel à la tendance, et que d’autre part, dans
le cas d’une chronique à tendance faiblement croissante ou faiblement décroissante,
les deux schémas sont quasiment équivalents. C’est une des raisons pour laquelle en
pratique nous n’évoquons bien souvent que le modèle multiplicatif.
5. Un exemple de décomposition d’une série chronologique
Nous allons maintenant montrer les étapes successives du traitement de la chronique
des ventes trimestrielles en France d’essences aviation. Cet exemple provient du
Comité Professionnel du Pétrole et est issu de Introduction à la méthode statistique
de B. Goldfarb et C. Pardoux, Dunod, 2004. Le fichier de données est le
suivant :
1999
2000
2001
2002
1er trimestre 2ème trimestre 3ème trimestre 4ème trimestre
4, 0
7, 8
9, 2
4, 6
4, 6
7, 9
9, 0
14, 7
4, 0
7, 6
8, 0
4, 8
4, 3
7, 3
8, 1
3, 8
1. Tracer le graphique correspondant à la chronique. Qu’observe-t-on ?
À partir de maintenant et ce jusqu’à la question 6., nous allons modéliser la chronique
par un schéma additif (Xt = Ft + St + Et ).
2. Tracer sur le même graphique que précédemment la suite des moyennes mobiles de longueur 4. Pour cela, faire apparaître dans un tableau les calculs
nécessaires pour tracer cette série chronologique.
3. Dans ce même tableau, calculer les valeurs numériques de la différence entre
la valeur observée et la valeur de la tendance obtenue par la méthode des
moyennes mobiles.
2
Master 2 de Statistique
Université de Strasbourg - 2010/2011
4. Dans ce même tableau, calculer dans le même tableau les coefficients saisonniers Stj . Combien y en-a-t-il ? Est-ce que la somme des coefficients saisonniers
Stj dont vous avez obtenu une valeur numérique est nulle ? Si non, vous devez
corriger ces coefficients saisonniers Stj en faisant le coefficient saisonnier Stj
moins leur moyenne et afficher ce calcul dans ce même tableau. Ces nouveaux
coefficients seront notés St∗j .
5. Dans ce même tableau, calculer les coefficients de la série CVS.
6. Dans ce même tableau, calculer les coefficients de la série des écarts.
À partir de maintenant et ce jusqu’à la question 12., nous allons modéliser la chronique par un schéma multiplicatif (Xt = Ft × (1 + St ) × (1 + Et )).
7. Dans un nouveau tableau, reporter les coefficients de la suite des moyennes
mobiles de longueur 4.
8. Dans ce même tableau, calculer les valeurs numériques du rapport entre la valeur observée et la valeur de la tendance obtenue par la méthode des moyennes
mobiles.
9. Dans ce même tableau, calculer la composante saisonnière, à savoir 1 + St .
Est-ce que la somme des coefficients Stj est nulle ? Si non, vous devez corriger
ces coefficients saisonniers et recalculer la nouvelle composante saisonnière, à
savoir 1 + St∗ .
10. Dans ce même tableau, calculer les coefficients de la série CVS.
11. Dans ce même tableau, calculer la série des 1 + Et , puis la série des Et et
enfin la série des écarts.
12. Tracer sur un nouveau support, le graphique correspondant à la chronique, la
série CVS obtenue par le modèle additif et la série CVS obtenue par le modèle
multiplicatif. Qu’observe-t-on ? Sur un autre graphique, comparer la série des
écarts du modèle additif et la série des écarts du modèle multiplicatif.
6. À vous maintenant
Les exercices qui suivent sont issus du livre de B. Goldfarb et C. Pardoux,
intitulé Introduction à la méthode statistique, aux éditions Dunod, Quatrième édition, 2004.
Exercice 1. Sans contexte.
t 1 2 3 4 5 6 7 8 9 10 11 12
xt 3 −1 5 1 3 −1 5 1 3 −1 5 1
a) Calculer les moyennes mobiles de longueurs 2, 3, 4 et 5. Quelles sont les propriétés de la moyenne mobile qui sont illustrées par cet exemple ?
b) Soit la chronique zt = 10 − 2t + xt , calculer la suite des moyennes mobiles de
longueur 4 de la nouvelle chronique zt .
3
Master 2 de Statistique
Université de Strasbourg - 2010/2011
Exercice 2. Boissons et alcools.
Le tableau ci-dessous donne les valeurs des indices trimestriels (base 1995) de la
production des « Boissons et alcools » pour les années 1998 à 2002. Cet exemple
provient encore une fois du Bulletin Mensuel de la Statistique, INSEE .
1998
1999
2000
2001
2002
1er trimestre 2ème trimestre 3ème trimestre 4ème trimestre
95, 5
99, 6
104, 1
133, 5
94, 6
101, 8
100, 5
131, 4
83, 2
93, 7
100, 1
139, 2
86, 6
94, 6
104, 8
138, 9
89, 9
98, 4
105, 7
137, 9
a) Tracer le graphique correspondant à la chronique. Commenter l’évolution de
cette chronique. Quel type de schéma de composition peut-on proposer ?
b) Dans un tableau, déterminer la tendance de cette chronique en utilisant la
méthode des moyennes mobiles de longueur à déterminer. Représenter sur le
même graphique cette série.
c) Dans ce même tableau, calculer les coefficients saisonniers.
d) Dans ce même tableau, calculer la série CVS. Ajuster cette série par une
droite en utilisant la méthode des moindres carrés ordinaires.
e) À la vue des résultats, quelles prévisions pouvions-nous faire au dernier trimestre 2002 pour les deux premiers trimestres 2003 ?
Sachant que cet indice a pris les valeurs 87,4 et 95,1 pour les premiers
et deuxième trimestres 2003, calculer l’erreur moyenne et l’erreur absolue
moyenne de prévision.
Exercice 3. Le cinéma.
Voici pour ses trois premiers mois d’ouverture, le nombre de places xt vendues par
semaine par un cinéma (t désigne le numéro de la semaine.)
t
1
2
3
4
5
6
7
8
9
10
11
12
xt 3428 3295 3376 3195 3573 3334 3434 3300 3703 3411 3545 3327
a) Représenter la chronique graphiquement. A-t-elle une composante saisonnière ? Si oui, de quelle période ?
b) Dans un tableau, déterminer la tendance de cette chronique en utilisant la
méthode des moyennes mobiles de longueur à déterminer. Représenter sur le
même graphique cette série.
c) Dans ce même tableau, calculer les coefficients saisonniers.
d) Dans ce même tableau, calculer la série CVS. Représenter-la sur le même
graphique. Calculer la série des résidus.
e) Ajuster la série CVS par une droite en utilisant la méthode des moindres
carrés ordinaires. Représenter cette droite sur le même graphique.
f) Donner une prévision pour le nombre de places vendues pendant les deux
premières semaines du quatrième mois.
4
Master 2 de Statistique
Université de Strasbourg - 2010/2011
7. D’autres procédures pour savoir si il y a une tendance et/ou une
composante saisonnière
Ce paragraphe est issu du livre de R. Bourbonnais et M. Terraza, Analyse des
séries temporelles, aux éditions Dunod, 2008.
L’examen visuel du graphique ou du tableau ne permet pas toujours de déterminer
avec certitude l’existence d’une saisonnalité, de surcroît il est interdit l’automastisme
de traitement qui peut s’avérer nécessaire dans le cas d’un nombre important de
séries à examiner. Le test de Fisher à partir de l’analyse de la variance permet de
pallier ces deux inconvénients.
Ce test suppose la chronique sans tendance ou encore sans extra-saisonnalité. Dans
le cas contraire, cette composante est éliminée par une régression sur le temps (extrasaisonnalité déterministe), ou par une procédure de filtrage (extra-saisonnalité aléatoire).
7.1. Notations.
– N le nombre d’années
– p le nombre d’observations (la période) dans l’année (trimestre p = 4, mois p = 12,
etc.)
– xij la valeur de la série chronologique pour la ieme année (i = 1, . . . , N ) et la j eme
période (j = 1, . . . , p) supposée telle que xij = mij + eij . Les eij sont les résidus
considérés comme aléatoires formés d’éléments indépendants : eij → N (O, σ 2 ).
– Les mij sont les éléments d’une composante de la série chronologique qui s’écrivent :
mij = ai + bj abec bj qui mesure l’effet période en colonne du tableau et ai qui
mesure l’effet année en ligne du tableau.
7.2. Mise en place du test. Deux effets absents sont testés contre deux effets
significativement présents :
a) Si l’effet période est significatif, la série chronologique est saisonnière ;
b) Si l’effet année est significatif, ceci suggère deux interpétations
– la chronique de départ n’a pas été transformée, elle possède alors des
paliers horizontaux
– la chronique de départ a été transformée, des changements de tendance
existent dans la chronique.
7.3. Construction du tableau de l’ANOVA. Le tableau de l’analyse de la variance peut être construit avec le logiciel R à l’aide de la fonction aov. Procéder au
test sur l’un des exemples précédents. Vous vérifierez également l’hypothèse de normalité sous-jacente au modèle linéaire à laide du test de Shapiro-Wilk implémenté
dans R par la fonction shapiro.test.
5

Documents pareils