Prévisions du nombre de passagers aériens

Transcription

Prévisions du nombre de passagers aériens
Prévisions du nombre de passagers aériens embarqués/débarqués à
l’Aéroport international Jean-Lesage de Québec
Séries mensuelles, période 2015-2017
Carlos ORDÁS CRIADO
Constantinos BOUGAS
Koami Dzigbodi AMEGBLE
Juillet 2015
Résumé
Ce
rapport
fournit
des
prévisions
mensuelles
de
trafic
aérien
de
passagers
embarqués/débarqués à l’Aéroport international Jean-Lesage de Québec (YQB) à l’horizon
2015 - 2017 pour trois segments de marché : domestique, transfrontalier et international. Ces
projections se fondent sur les statistiques les plus actuelles disponibles auprès de Transports
Canada de janvier 2000 à décembre 2014. Quatre modèles statistiques de séries
chronologiques sont utilisés: (i) le modèle naïf saisonnier, (ii) la régression linéaire, (iii) le
lissage exponentiel de Holt-Winters et (iv) un modèle saisonnier autorégressif avec moyenne
mobile (SARIMA). L’étude explore la performance prévisionnelle de chaque modèle et
vérifie si la combinaison des prévisions issues des différents modèles permet d’améliorer la
performance prévisionnelle. Deux techniques de combinaison des prévisions sont testées: la
moyenne simple et la moyenne pondérée, avec des poids qui minimisent l’erreur
prévisionnelle passée. La qualité des projections est mesurée à l’aide de deux indicateurs : la
moyenne des erreurs absolues en pourcentage (MAPE) et la médiane des erreurs absolues en
pourcentage (MedPE). Les deux techniques de prévision les plus performantes sont
finalement utilisées pour réaliser les prédictions mensuelles à l’horizon 2015-2017.
Les simulations hors-échantillon effectuées sur le trafic de passagers de janvier 2012 à
décembre 2014 montrent que combiner les prédictions des meilleurs modèles prévisionnels
est l’approche la plus fiable pour prédire le nombre de passagers sur la plupart des segments
de marché de YQB. L’erreur prévisionnelle (moyenne ou médiane) obtenue avec les modèles
les plus performants est proche ou inférieure à 10% des valeurs observées pour tous les
segments de marché. Les projections mensuelles les plus fiables sont celles effectuées pour la
série agrégée (total des passagers). L’erreur prévisionnelle est alors comprise entre 2% et 5%.
On montre qu’il est préférable de prévoir le nombre total de passagers en prédisant
directement la série agrégée plutôt qu’en sommant le nombre de passagers prédits sur chaque
segment de marché. Les flux mensuels de passagers des segments domestique et
transfrontalier révèlent tous deux une dynamique relativement instable. La combinaison de
prévisions permet d’atteindre une performance prédictive hors-échantillon de l’ordre de,
1
respectivement, 4,9% et 3,7% sur ces deux segments. Le volume de passagers internationaux
s’avère la série la plus difficile à prévoir. Deux des modèles individuels explorés sont
excessivement imprécis. Le meilleur des deux modèles restants aboutit à une erreur de
prévision satisfaisante (proche de 10%), qui ne s’améliore pas par combinaison de prévisions.
Nous concluons que les prévisions effectuées à l’horizon 2015-2017 avec les approches les
plus performantes identifiées dans les simulations devraient se révéler suffisamment précises
pour servir à la prise de décision dans un scénario de type « business as usual ». Ces
prévisions peuvent être utilisées comme références pour établir des objectifs de
développement à court et moyen terme.
L’Aéroport international Jean-Lesage de Québec a vu transiter 1 510 000 passagers en 2014.
Le volume total de passagers devrait s’établir à 1 737 500 en 2017, ce qui correspond à une
augmentation de +227 400 passagers et un taux de croissance de +15,1%, similaire à celui
observé de 2011 à 2014. Cette projection est calculée en additionnant les meilleures
prévisions obtenues sur chaque segment de marché. Le meilleur modèle prédisant directement
la série agrégée aboutit à un volume total de passagers de 1 672 600 passagers, soit une
croissance plus modeste de +10,8% de 2014 à 2017. Le nombre de passagers domestiques qui
transiteront par YQB entre 2014 et 2017 devrait connaître un développement similaire à celui
de la période 2011 à 2014. Ce segment de marché franchira probablement le cap du million de
passagers en 2017, passant de 863 000 en 2014 à 1 062 000 passagers (+ 199 000, ce qui
équivaut à +23,1%). La croissance des passagers sur les segments transfrontalier et
international devrait rester positive mais inférieure à celle de la période 2014-2017. Le
volume de passagers passera de 274 000 en 2014 à 300 000 en 2017 (+ 26 400, ce qui
équivaut à +9,6%) sur le segment transfrontalier et de 373 000 en 2014 à 375 000 en 2017 (+
2 060, soit +0,6%) sur le segment international.
2
1. Table des matières
1. Introduction ..................................................................................................................................................... 5 2. Méthodologie ................................................................................................................................................... 9 2.1 Modèle naïf saisonnier ................................................................................................................................. 9 2.2 Modèles linéaires avec tendance et saisonnalité fixes ............................................................................. 10 2.3 Modèles de lissage exponentiel de Holt-Winters .................................................................................... 11 2.4 Le modèle dynamique SARIMA ............................................................................................................. 11 2.5 Simulation hors-échantillon des modèles individuels et performance prévisionnelle ............................. 12 2.6 Méthodes de combinaison ....................................................................................................................... 13 3. Données ......................................................................................................................................................... 16 4. Résultats ........................................................................................................................................................ 20 4.1 Simulations sur la période 2012 - 2014 ................................................................................................... 20 A) Modèles individuels ............................................................................................................................. 20 B) Combinaison des prévisions................................................................................................................. 22 4.2 Prévisions à l’horizon 2015 - 2017 .......................................................................................................... 25 5. Conclusions ................................................................................................................................................... 32 6. Annexes ......................................................................................................................................................... 33 7. Bibliographie ................................................................................................................................................. 39 3
Liste des tableaux
Tableau 1: Volume annuel de passagers à YQB par segments de marché ............................................................ 17 Tableau 2: Évolution des parts des segments de marché domestique, transfrontalier et international (en %)....... 17 Tableau 3: Accroissement et taux de croissance annuel du volume de passagers par segments de marché .......... 18 Tableau 4: Performance prévisionnelle des modèles individuels de janvier 2012 à décembre 2014. Indicateur
MAPE (en %) ........................................................................................................................................................ 21 Tableau 5: Performance prévisionnelle des modèles individuels de janvier 2012 à décembre 2014. Indicateur
MedAPE (en %) .................................................................................................................................................... 21 Tableau 6: Performance prévisionnelle des modèles combinés de janvier 2014 à décembre 2014. Indicateur
MAPE (en %) ........................................................................................................................................................ 23 Tableau 7: Performance prévisionnelle des modèles combinés de janvier 2014 à décembre 2014. Indicateur
MedAPE (en %) .................................................................................................................................................... 24 Tableau 8: Nombre annuel de passagers prévus de 2015 à 2017 par segments de marché ................................... 25 Tableau 9: Accroissement et taux de croissance (en %) annuels prévus du nombre de passagers de 2015 à 2017
............................................................................................................................................................................... 26 Tableau 10: Nombre annuel de passagers prévus de 2015 à 2017 par addition des prévisions des différents
segments de marchés ............................................................................................................................................. 26 Tableau 11: Prévisions mensuelles pour la période 2015-2017 avec les deux meilleures méthodes de prévision.34 Tableau 12: Modèles de régression linéaire .......................................................................................................... 35 Tableau 13: Modèles de régression harmonique ................................................................................................... 36 Tableau 14: Modèles de lissage exponentiel Holt-Winters ................................................................................... 37 Tableau 15: Modèles SARIMA ............................................................................................................................. 38 Liste des figures
Figure 1: Séries mensuelles de passagers par segments de marché ....................................................................... 19 Figure 2: Prévisions mensuelles du nombre total de passagers avec les deux meilleures méthodes de prévision. 28 Figure 3: Prévisions mensuelles du nombre de passagers dans le secteur domestique avec les deux meilleures
méthodes de prévision ........................................................................................................................................... 29 Figure 4: Prévisions mensuelles du nombre de passagers dans le secteur transfrontalier avec les deux meilleures
méthodes de prévision ........................................................................................................................................... 30 Figure 5: Prévisions mensuelles du nombre de passagers dans le secteur international avec les deux meilleures
méthodes de prévision ........................................................................................................................................... 31 4
1. Introduction
Situé dans la ville de Québec, destination touristique importante et 7ème plus grande ville du
Canada, l’Aéroport international Jean-Lesage de Québec (abrégé YQB ci-après) est le 13ème plus
grand aéroport canadien en termes de volume de passagers embarqués/débarqués, avec 1 510
000 passagers en 2014. Il se situe au 14ème rang canadien en termes de flux de passagers
domestiques, et au 9ème et 7ème rang respectivement pour les secteurs transfrontalier et
international.
Le nombre de passagers aériens embarqués/débarqués à YQB a augmenté considérablement ces
quinze dernières années (2000-2014), passant de 729 000 à 1 510 000 passagers (+107%) dans
l’ensemble des segments de marchés, de 568 000 à 863 000 (+52%) dans le secteur domestique
et de 162 000 à 373 000 (+131%) dans le secteur international1. Les vols transfrontaliers se sont
développés depuis 2002 et le nombre de passagers est passé de 16 000 passagers à 274 000 en
2014, soit une multiplication par 16,6.
L’évolution des flux de passagers dépend de la dynamique économique régionale et
internationale, du prix des billets d’avion, ainsi que de facteurs liés à l’offre de vols (accessibilité
de l’aéroport, nombre de vols offerts, etc). Les modèles explorés dans ce rapport prennent en
compte ces différents aspects de manière implicite, par l’intermédiaire de l’inertie temporelle des
séries de passagers et de chocs exogènes identifiés dans le passé. Cette approche se révèle
adéquate à court et moyen terme, dans un scénario de type « business as usual ». Dans ce
scénario, les projections basées sur le passé se révèlent en général plus précises que les
approches qui intègrent explicitement des facteurs explicatifs. En effet, les variables explicatives
doivent elles-mêmes être prédites, et elles ne sont pas toujours disponibles à une fréquence
mensuelle et au niveau régional. Les projections mensuelles du présent rapport peuvent être
utilisées comme références (benchmark) en vue d’atteindre des objectifs stratégiques. Elles
peuvent servir à l’évaluation ex-post de politiques de développement de certains segments de
1
Source : Transports Canada.
5
marché ou d’atténuation des cycles. Ces projections permettent de fixer des objectifs réalistes à
court et moyen terme afin d’aider à la décision.
Depuis les années 90, de nombreuses études ont utilisé les modèles de séries temporelles pour
prévoir l’évolution du flux de passagers aériens. La performance prévisionnelle des différents
modèles varie en fonction du pays d’origine et de destination, du type de vol considéré
(domestique, transfrontalier, international) et du critère de performance prévisionnel utilisé2. Il
n’existe donc pas de modèle prévisionnel unique dominant et indépendant du contexte d’étude.
Au Canada, le principal pourvoyeur de prévisions annuelles de trafic aérien est Transports
Canada. Ces prévisions sont effectuées à l’aide de modèles de régression3 estimés avec des
données origine-destination, qui incluent des facteurs explicatifs macroéconomiques (tels que
des prix moyens du billet, les PIB régionaux, etc). À notre connaissance, la seule étude
académique effectuée au Canada sur la prévision du trafic mensuel de passagers à l’aide de
modèles de séries temporelles4 est le cahier de recherche d’Emiray et Rodriguez (2003). Ces
auteurs fournissent des prévisions pour l’ensemble des passagers embarqués/débarqués dans les
aéroports canadiens ainsi que pour trois segments de marché : domestique, transfrontalier et
international. Ils utilisent les données allant de janvier 1984 à septembre 2002 et projettent les
tendances à l’horizon 2015. L’étude conclut que la performance prévisionnelle des modèles
dépend de deux éléments clés: le segment du marché considéré et l’horizon de prévision. De
manière générale, les modèles les plus simples s’avèrent les plus performants à court terme alors
que les modèles le plus sophistiqués performent bien à long terme et en présence de chocs
structurels. Aucun des modèles de prévision explorés ne se révèle meilleur que ses paires sur
tous les segments de marché. Par conséquent, il ne semble pas judicieux d’utiliser un seul type
de modèle pour prédire les différents segments de marché au Canada. De plus, les résultats
indiquent que combiner les prévisions issues des différents modèles aide à accroître la précision
des projections. Cette étude fournit également des prévisions agrégées annuelles de long terme
2
Voir Emiray et Rodriguez (2003), Oh et Morzuch (2005) ou encore Chu (1998) et (2009).
Il s’agit essentiellement d’équations d’inspiration gravitaire.
4
Les modèles utilisés sont un AR(p) avec saisonnalité déterministe, un AR(p) avec saisonnalité stochastique, un
SARIMA, un modèle autorégressif périodique (PAR), un modèle de série temporelle structurelle à la Koopman et al.
(1995) et un ARMA sur des séries filtrées pour se débarrasser des racines saisonnières. Notons que les auteurs
proposent également de combiner les prévisions des meilleurs modèles individuels à l’aide d’une régression.
3
6
pour les années 2001 à 2006 et pour l’année 2010, qui sont comparées à celles effectuées par
Transports Canada pour ces mêmes années. Les projections issues des modèles de séries
temporelles se révèlent relativement proches de celles offertes par Transports Canada. Avec la
rétrospective depuis la parution de cette étude, il est possible d’évaluer la performance
prévisionnelle des deux approches sur l’ensemble de ces périodes. La moyenne des erreurs
absolues en pourcentage (MAPE5) des modèles de Transports Canada pour les segments de
marché domestique, transfrontalier et international est respectivement de 4,9%, 4,4% et 9,1%.
L’erreur prévisionnelle des modèles de séries temporelles est respectivement de 6,4%, 4,9% et
7,6%. Par conséquent, les prévisions de Transports Canada se révèlent plus précises sur deux
segments de marché (domestique et transfrontalier) et moins performantes sur le segment
international. Combiner les prédictions de modèles simples de séries temporelles peut donc
aboutir à des prévisions raisonnables sur un horizon temporel de dix années.
Ces dernières années, la combinaison de prévisions de différents modèles est devenu l’approche
privilégiée par la littérature scientifique6 pour améliorer la performance prévisionnelle et pour
contrôler l’incertitude provenant de l’utilisation d’un modèle unique de prévision. Dans la
littérature sur le tourisme, cette technique conduit en général à prédire aussi bien, voir mieux,
que lorsque l’on utilise le meilleur modèle individuel7. Ce résultat peut parfois dépendre de la
technique de combinaison et des caractéristiques spécifiques des régions/pays considérés8 mais
une évidence empirique solide semble se dessiner en faveur des combinaisons de prévisions
issues de différentes sources.
Toute économie subit une variété de chocs (économiques, épidémiologiques, politiques)
imprévisibles. Ces derniers sont susceptibles de modifier durablement la tendance et la volatilité
du trafic de passagers au niveau national et international. La littérature scientifique traite ces
phénomènes en prenant en compte les chocs passés dans les modèles de prévision. Certains des
modèles utilisés dans ce travail prendront donc en compte les chocs passés.
5
Voir la section 2.5 ci-après pour une définition précise de cet indicateur de performance prévisionnelle.
Voir Bates et Granger (1969), Diebold et Pauly (1987) ou Timmermann (2006).
7
Voir Shen et al.(2008, 2011) ou Coshall (2009).
8
Voir Wong et al. (2007) ou Coshall (2009).
6
7
Le premier objectif de ce rapport est de quantifier la précision avec laquelle certains modèles
fondamentaux de séries temporelles permettent de prévoir le trafic de passagers de YQB. Dans
un second temps, ce travail teste différentes méthodes de combinaison de prévisions et il évalue
leur fiabilité prédictive. Finalement, des prévisions mensuelles sont effectuées sur chaque
segment de marché de YQB à l’horizon 2015-2017 avec les méthodes prévisionnelles identifiées
comme étant les plus performantes.
Les modèles économétriques employés sont : (i) le modèle naïf saisonnier, (ii) les régressions
linéaire et harmonique, (iii) le lissage exponentiel de Holt-Winters, (iv) une variante saisonnière
du modèle ARMA (processus autorégressif à moyenne mobile). Le modèle naïf saisonnier prédit
le niveau futur de passagers en se basant uniquement sur la dernière mesure observée durant le
même mois de l’année précédente. Les modèles de régression linéaire et harmonique produisent
des prévisions à partir de formes fonctionnelles additives dans les paramètres qui incluent une
tendance (polynomiale) et des variables explicatives capturant la saisonnalité mensuelle et les
chocs structurels. Le lissage exponentiel est une technique de prévision de moyenne mobile qui
donne des poids décroissants aux valeurs passées tout en prenant en compte l’effet distinct de la
tendance, du niveau de la chronique et sa saisonnalité. La variante saisonnière du modèle ARMA
utilisée dans ce travail est un modèle classique de séries temporelles qui modélise le passé de la
chronique et de ses erreurs en permettant une saisonnalité potentiellement fluctuante dans le
temps (appelée saisonnalité stochastique).
Nos résultats nous amène à conclure qu’il n’y a pas de modèle unique dominant pour prédire les
flux de passagers d’YQB, qui fournirait les meilleures prévisions quel que soit le segment de
marché considéré. L’utilisation de modèles distincts par segment de marché est donc nécessaire
pour obtenir les prévisions les plus fiables à court et moyen terme avec des séries mensuelles. La
performance prévisionnelle des meilleurs modèles individuels se révèle faible sur certains
segments de marché, en particulier lorsqu’il s’agit de prévoir le trafic transfrontalier ou
international. Nous montrons que, dans le cas d’YQB, combiner les prévisions des modèles
individuels les plus performants de chaque segment de marché permet dans la plupart des cas
d’améliorer la performance prévisionnelle par rapport au meilleur modèle individuel. Cette
approche permet d’atteindre une fiabilité accrue dans les prévisions. Elle conduit à une qualité
8
d’ajustement (MAPE ou MedAPE) proche ou inférieure à 10% pour l’ensemble de la période de
prévision et dans tous les segments de marché. Aucune méthode de combinaison de prévisions
ne se détache comme préférable aux autres. La meilleure méthode de prévision peut varier selon
la série analysée mais le choix est relativement robuste aux deux indicateurs de qualité
prévisionnelle testés.
Ce rapport est structuré de la manière suivante. Le chapitre 2 expose la méthodologie. Nous
présentons les séries mensuelles de passagers de YQB au chapitre 3. Finalement, nous exposons
les résultats concernant les simulations et les prévisions au chapitre 4, avant de conclure en
rappelant les faits saillants du rapport.
2. Méthodologie
Les modèles retenus dans ce travail sont ceux qui ont été testés pour le Canada dans le mémoire
de maitrise de Bougas (2013). Il s’agit de modèles fondamentaux de prévision, décrits dans la
plupart des ouvrages de référence, voir par exemple Hyndman et Athanasopoulos (2013). La
plupart des modèles sont estimés à l’aide de la librairie forecast développée par les auteurs
précités sur le logiciel libre R. Cette section décrit brièvement ces modèles et les procédures
d’estimation.
2.1 Modèle naïf saisonnier
Dans les études de prévision9, il n’est pas rare d’inclure des approches simples, car ces dernières
se révèlent parfois aussi performantes que les modèles plus sophistiqués. Le modèle « naïf
saisonnier » considère la prévision pour un mois donné comme étant égale à la dernière valeur
observée pour ce même mois de l’année précédente. Par exemple, la prévision du nombre total
de passagers embarqués/débarqués en juillet 2015 à YQB sera égale au nombre de passagers
observés en juillet 2014. Lorsque la prévision mensuelle se fait sur plusieurs années (par
exemple de juillet 2015 à juillet 2017), la valeur de juillet 2014 est utilisée sur l’ensemble des
9
Par exemple, Coshall et Charlesworth (2011).
9
mois de juillet de la période de prévision. Ce modèle n’intègre donc pas de tendance de
moyen/long terme. Il a pour but de mesurer la performance prévisionnelle d’une technique
d’estimation qui ne nécessite aucun calcul complexe.
2.2 Modèles linéaires avec tendance et saisonnalité fixes
Les régressions linéaire et harmonique sont des modèles linéaires dans les paramètres, qui
postulent l’existence d’une tendance et d’une saisonnalité stables dans le temps. Les deux
modèles présument l’existence d’une tendance polynomiale (maximale d’ordre 4 dans ce travail)
et ils se distinguent dans le traitement de la saisonnalité. Le modèle linéaire capture les effets
mensuels à l’aide de variables explicatives binaires pour onze mois et une constante. La
régression harmonique postule une saisonnalité issue de la combinaison de deux fonctions
trigonométriques : le sinus et le cosinus. Nous ajoutons aux composantes temporelles de ces
modèles trois variables explicatives (indicatrices) qui capturent les chocs structurels bien connus
dans la littérature sur le trafic aérien : l’effet du 11 septembre 2001, l’effet des mois les plus
virulents de la grippe aviaire (janvier à juillet 2003) et l’impact de la crise de 2008 (de septembre
à décembre). Les modèles linéaire et harmonique sont ensuite soumis à une procédure de
sélection automatique des variables explicatives10. Nous obtenons alors deux modèles qui
contiennent un nombre optimal de facteurs explicatifs pour la prévision. Finalement, nous
départageons les modèles optimaux linéaire et harmonique en ne conservant que le plus
performant dans la prévision hors échantillon. Plus précisément, les modèles optimaux sont
estimés avec le trafic de passagers de janvier 2000 à décembre 2011 et leur performance
prévisionnelle est évaluée sur le trafic de passagers observé de janvier 2012 à décembre 2014.
Nous conservons le modèle de régression le plus performant sur cette période d’évaluation pour
effectuer les prévisions de janvier 2015 à décembre 2017. Cette procédure est appliquée sur
chaque segment de marché et le détail des résultats se trouve dans les Tableaux 12 et 13 de
l’annexe.
10
La technique retenue est l’élimination pas à pas des variables explicatives, en minimisant le critère AIC. Voir la
fonction step sur R.
10
2.3 Modèles de lissage exponentiel de Holt-Winters
La méthode récursive de Holt-Winters est une technique de lissage de type moyenne mobile, qui
a été développée afin de prédire des séries temporelles caractérisées par la présence simultanée
d’une tendance et d’un motif saisonnier. Il existe deux versions de cette procédure : additive et
multiplicative. Dans les deux versions, les prévisions dépendent des trois composantes
fondamentales d’une série temporelle : son niveau, sa tendance et son coefficient saisonnier. Ces
trois paramètres de lissage sont calculés de manière itérative à l’aide de la fonction HoltWinters
de la librairie stats. Les valeurs de ces paramètres, comprises entre 0 et 1, s’interprètent comme
« des facteurs d’escompte » : plus ces valeurs sont proches de 1, plus le poids du passé récent est
important par rapport aux valeurs passées distantes. Le choix entre la version additive ou
multiplicative se fait en général en fonction du type de saisonnalité (additive ou multiplicative)
présent dans les données. Dans ce travail, nous estimons les deux versions des modèles et nous
évaluons leur performance prévisionnelle hors-échantillon selon la logique décrite à la fin de la
section 2.2. Aucune des deux approches ne dominera
systématiquement l’autre dans nos
résultats. Le détail de ces résultats se trouve dans le Tableau 14 de l’annexe. La procédure de
Holt-Winters est abondamment utilisée dans la littérature sur la prévision depuis plus de
cinquante ans11. Sa popularité provient du fait qu’elle est simple à utiliser. Cependant, elle est
sensible aux chocs structurels, qui ne sont pas pris en compte explicitement.
2.4 Le modèle dynamique SARIMA
Ce modèle est une variante populaire12 du modèle autorégressif avec moyenne mobile
(AutoRegressive-Moving-Average en anglais), communément abrégé ARMA(p,q). L’idée qui
sous-tend ce modèle est que la valeur prise par une série temporelle au temps t, notée yt, dépend
de deux termes additifs : (i) le passé de la chronique (noté yt-i), qui correspond à la composante
autorégressive (d’ordre p) et (ii) le passé des erreurs du processus de génération des données, qui
représente la composante moyenne mobile (d’ordre q). Par conséquent, l’équation estimée ici est
la variante saisonnière de :
11
Voir par exemple Gelper et al. (2010) ou encore Coshall et Charlesworth (2011).
Voir par exemple Lim et McAleer (2002), Emiray et Rodriguez (2003), Chen et al. (2009) ou Coshall et
Charlesworth (2011).
12
11
=∑
- ∑
+
où les φi (i=1,…,p) sont les paramètres autorégressifs, les θj (j=1,...,q) sont appelés paramètres
moyenne-mobile et le terme εt désigne l’erreur qui possède certaines propriétés stochastiques
postulées par le chercheur. Il est important de noter que ce modèle est conçu pour les séries
stationnaires, qui se caractérisent par une moyenne et une variance constantes dans le temps. Ces
hypothèses n’étant pas respectées par les séries avec tendance (comme celles des flux de
passagers), on transforme les séries en différences premières pour stabiliser leur moyenne et le
modèle est alors appelé ARIMA(p,d,q), soit AutoRegressive-Integrated-Moving-Average en
anglais. Le paramètre d indique le degré de différentiation nécessaire pour rendre la série des
passagers embarqués/débarqués stationnaire en moyenne. Dans notre cas, nous établissons à
l’aide d’une analyse graphique et de tests simples (test de racine unitaire ADF) que la
transformation logarithmique et la différenciation à l’ordre 1 permettent de rendre toutes nos
séries stationnaires en moyenne et en variance. La version saisonnière du modèle ARIMA est
appelée SARIMA(p,d,q)(P,D,Q)s, pour « Seasonal Autoregressive-Integrated-Moving Average».
L’approche SARIMA est la plus adéquate dans notre contexte car elle prend en compte
l’existence de saisonnalité déterministe ou stochastique dans les données. Ce dernier type de
saisonnalité est présent lorsque le motif saisonnier change à travers le temps. Dans un tel cas, la
série nécessitera une différentiation saisonnière, capturée par le paramètre « D ». Si le motif
saisonnier de la série se révèle stable dans le temps, alors D=0. Nous déterminons ici le meilleur
modèle SARIMA à l’aide de la fonction auto.arima de la librairie forecast. Cette fonction est
paramétrée afin d’effectuer une recherche exhaustive du meilleur modèle (ordres p,q et P,Q
optimaux) en minimisant le critère d’information AIC. L’ordre de différenciation saisonnière est
déterminé avec le test de Osborn-Chui-Smith-Birchenhall (1988). Le détail des résultats et du
paramétrage de cette fonction figure dans le Tableau 15 de l’annexe.
2.5 Simulation hors-échantillon des modèles individuels et performance
prévisionnelle
Afin d’identifier le modèle individuel le plus adéquat pour prédire le trafic de passagers de YQB
sur chaque segment de marché de janvier 2015 à décembre 2017, l’approche habituelle consiste à
12
tester la capacité prédictive hors échantillon des modèles sur un horizon temporel antérieur et de
taille similaire (36 mois). Dans notre cas, cela consiste à estimer les modèles décrits dans les
sous-sections 2.1 à 2.4 sur les différents segments de marché de YQB avec les observations de
janvier 2000 à décembre 2011, puis à évaluer leur performance prévisionnelle sur la période de
janvier 2012 à décembre 2014. Nous évaluons cette qualité d’ajustement à l’aide de deux
mesures distinctes et complémentaires13 :
i)
La moyenne des erreurs absolues en pourcentage :
ii)
La médiane des erreurs absolues en pourcentage :
| |
;
∑
|
|
, …,
|
|
.
Dans les formules ci-dessus, yt est le nombre de passagers embarqués/débarqués au mois t, n
désigne le dernier mois de prévision,
est l’erreur de prévision (l’écart entre la
valeur prédite et observée), et le signe |.| correspond à l’opérateur de la valeur absolue. Ces deux
mesures ont l’avantage d’être faciles à interpréter puisque toutes les deux expriment l’erreur de
prévision en pourcentage par rapport aux valeurs observées.
L’indicateur médian ii) est
généralement utilisé pour vérifier la robustesse des résultats obtenus avec l’indicateur moyen i).
Une MAPE/MedAPE inférieure à 10% indique une bonne performance prévisionnelle.
2.6 Méthodes de combinaison
Nous pourrions nous contenter d’utiliser le meilleur modèle identifié selon la procédure décrite
dans la sous-section 2.5 pour chaque segment de marché et pour le total des passagers. Comme
indiqué précédemment, combiner les prévisions des différents modèles aboutit en général à une
meilleure prévision. Ce rapport explore deux techniques de combinaison de prévisions qui ont
été grandement appliquées dans la littérature14: i) la méthode de la moyenne simple et ii) la
méthode de moyenne pondérée dite de « variance-covariance ». La formule générale de la
moyenne (pondérée) des prévisions de J modèles pour le mois t peut s’écrire :
∑
⋯
avec
∑
=1
13
Nous conservons ici les acronymes anglais des deux indicateurs : MAPE = Mean Absolute Percentage Error,
MedAPE = Median Absolute Percentage Error.
14
Voir Bates et Granger (1969); Chu (1998); Coshall et Charlesworth (2011); Andrawis et al, (2011) ou encore
Graefe et al. (2014).
13
où
est la moyenne pondérée des J prédictions,
représente le volume prédit de passagers
embarqués/débarqués le mois t par le jème modèle et
représente le poids accordé à
L’élément clé dans cette formule est la détermination des poids
.
. Deux méthodes sont
retenues dans ce rapport pour déterminer ces poids: la méthode de la moyenne simple et celle de
la moyenne pondérée.
La méthode de la moyenne simple, suggérée notamment par Bates et Granger (1969), est la
plus facile à utiliser. Elle consiste à donner le même poids aux prévisions de chacun des modèles
et ce, quel que soit le mois prédit et la performance prédictive passée de ces modèles. Par
conséquent, ce poids ne varie ni entre modèles, ni dans le temps. Ce poids est simplement donné
par
.
La méthode de la moyenne pondérée retenue dans ce rapport est appelée « méthode de
variance-covariance ». Elle fait partie des premières méthodes proposées dans la littérature pour
combiner de manière optimale les prévisions issues de différents modèles. Son avantage est que
les poids sont fonction de la performance passée des modèles individuels. Supposons que nous
voulions combiner les prévisions issues de deux modèles différents (J = 2) avec des poids qui
somment à 1. La moyenne pondérée des prévisions issues des deux modèles serait alors donnée
par :
=
1
)
avec 0<
La méthode de variance-covariance attribue des poids
de prévision
<1
qui minimisent la variance de l’erreur
sous les hypothèses que les poids
ne sont pas aléatoires et que
les prévisions obtenues des différents modèles individuels ne sont pas biaisées. Dans la
pratique15, la formule simplifiée suivante est la plus utilisée16:
∑
∑
∑
15
Voir par exemple Granger et Bates (1969), Coshall et Charlesworth (2009), Wong et al. (2007) ou encore
Andrawis et al. (2011).
16
On peut se référer à Diebold et Pauly (1987) ou encore à Coshall et Charlesworth (2009) pour une version plus
générale de cette formule (notamment le cas où J > 2).
14
où
représente l’erreur de prévision du modèle j au temps τ (une période antérieur à t).
L’intuition de cette formule est que plus l’erreur de prévision passée du modèle 1 est faible, plus
le poids attribué aux prévisions du modèle 1 augmente. Notons que cette formule ignore la
corrélation entre les prévisions des différents modèles individuels. Dans ce rapport, nous
calculons
de deux manières différentes : sur une fenêtre temporelle fixe et des mois
antérieurs au mois t ou sur une fenêtre temporelle mobile17 qui se déplacera en fonction du mois t
que l’on cherche à prédire.
La méthode de la fenêtre fixe permet de différencier les poids
en fonction de la performance
prévisionnelle passée des modèles individuels, en se référant à un passé fixe (poids invariants
dans le temps). Dans ce rapport, nous déterminons ces poids comme suit :
1) on estime les modèles individuels pour chaque segment de marché sur la période de
janvier 2000 à décembre 2011;
2) on prédit le trafic de passagers sur 36 mois, de janvier 2012 à décembre 2014;
3) on construit les poids optimaux selon la formule simplifiée de Granger et Bates
(1969) à l’aide des erreurs de prévision observées entre janvier 2012 et décembre
2013 (fenêtre de 24 mois).
Une fois ces poids déterminés, nous comparons la performance prévisionnelle des modèles
individuels, de la moyenne simple et de la moyenne pondérée sur les prévisions réalisées de
janvier 2014 à décembre 2014 par les modèles estimés sur la période allant de janvier 2000 à
décembre 2011.
Par rapport à l’approche précédente, la méthode de la fenêtre mobile permet une actualisation
dans le temps des poids de la moyenne pondérée (poids variables dans le temps). Cette approche
modifie le point 3) ci-dessus de la manière suivante :

on construit les poids optimaux selon la formule simplifiée de Granger et Bates
(1969) à l’aide des erreurs de prévision observées entre le 24ème mois précédant le
mois t de prévision et le mois précédant le mois t de prévision.
17
Cette partie s’inspire essentiellement de Wong et al. (2007).
15
Finalement, il est important de noter que les poids des méthodes de variance-covariance obtenus
sur la base des prévisions hors échantillons de janvier 2012 à décembre 2014 sont utilisés à deux
fins : comparer les prévisions obtenues par moyenne pondérée avec celles obtenues selon les
autres méthodes (modèles individuels ou moyenne simple) sur la période de janvier 2014 à
décembre 2014 et effectuer les prévisions de janvier 2015 à décembre 2017 lorsque la moyenne
pondérée délivre des prévisions plus précises que celles obtenues avec les autres méthodes.
3. Données
Nos données sont les séries mensuelles de passagers aériens embarqués/débarqués que
Transports Canada estime pour les secteurs domestique, transfrontalier et international. Ces
séries couvrent la période allant de janvier 2000 à décembre 2014. Le secteur domestique
regroupe l’ensemble du trafic entre deux aéroports localisés au Canada; le secteur transfrontalier
inclut le trafic entre un aéroport aux États-Unis et un aéroport au Canada et le secteur
international considère les vols d’un pays étranger autre que les États-Unis et un aéroport au
Canada.
La Tableau 1 récapitule le volume de passagers annuels observés à YQB sur les différents
segments de marché durant la période d’étude. On constate que près de 15 millions de passagers
ont transité par l’aéroport de Québec entre 2000 et 2014, dont près de 9,5 millions proviennent
du segment domestique, 3,3 millions concernent les vols internationaux et 2,1 millions sont liés à
des vols transfrontaliers. Comme le montre le Tableau 2, les segments transfrontalier et
international gagnent en importance à travers le temps, ce qui dénote une internationalisation
progressive du trafic de passagers de YQB.
Le Tableau 3 présente à l’accroissement et le taux de croissance annuel des passagers
embarqués/débarqués à YQB de 2001 à 2014. Notons d’abord que le nombre total de passagers
n’a cessé de croître depuis 2003, ce qui confirme l’expansion du trafic aérien de passagers à
YQB depuis cette date. Les segments transfrontalier et international ont également connu des
taux de croissance annuels à deux chiffres pendant de nombreuses années, même si cette
dynamique s’est récemment essoufflée dans le secteur international.
16
Tableau 1: Volume annuel de passagers à YQB par segments de marché
Années
Total
Domestique
Transfrontalier
International
2000
729 076
567 522
0
161 554
2001
698 546
547 740
0
150 806
2002
667 116
540146
15 550
111 420
2003
669 278
508 775
11 960
148 543
2004
742 076
580 348
81 176
80 552
2005
817 616
582 530
120 266
114 820
2006
826 690
563 084
135 126
128 480
2007
927 384
605 838
158 408
163 138
2008
1 030 002
649 873
157 442
222 687
2009
1 035 027
577 914
170 174
286 939
2010
1 190 091
677 546
211 112
301 433
2011
1 313 432
710 819
235 470
367 143
2012
1 342 840
733 446
260 531
348 863
2013
1 403 463
747 509
288 369
367 585
2014
1 510 047
862 823
274 050
373 174
TOTAL
14 902 684
9 455 913
2 119 634
3 327 137
Source : Transports Canada.
Tableau 2: Évolution des parts des segments de marché domestique, transfrontalier et
international (en %)
Segment de marché
2000
2007
2014
Domestique
77,8
65,3
57,1
Transfrontalier
0,0
17,1
18,1
International
22,2
17,6
24,7
Sources : Transports Canada et calcul des auteurs.
17
Tableau 3: Accroissement et taux de croissance annuel du volume de passagers par
segments de marché
Années
Total
Domestique
Transfrontalier
International
2001
-30 530
(-4,2)
-19 782
(-3,5)
-
-10 748
2002
-31 430
(-4,5)
-7 594
(-1,4)
-
-39 386 (-26,1)
2003
+2 162 (+0,3)
-31 371
(-5,8)
-
+37 123 (+33,3)
2004
+72 798 (+10,9)
2005
+75 540 (+10,2)
2006
+71 573 (+14,1)
(-6,7)
-3 590 (-23,1)
-67 991 (-45,8)
+2 182
(+0,4) +39 090 (+48,2)
+34 268 (+42,5)
+9 074 (+1,1)
-19 446
(-3,3) +14 860 (+12,4)
+13 660 (+11,9)
2007
+100 694 (+12,2)
+42 754
(+7,6) +23 282 (+17,2)
+34 658 (+27,0)
2008
+102 618 (+11,1)
+44 035
(+7,3)
2009
+5 025 (+0,5)
2010
+155 064 (+15,0)
+99 632 (+17,2) +40 938 (+24,1)
+14 494
2011
+123 341 (+10,4)
+33 273 (+4,9) +24 358 (+11,5)
+65 710 (+21,8)
2012
+29 408 (+2,2)
+22 627 (+3,2) +25 061 (+10,6)
-18 280
(-5,0)
2013
+60 623 (+4,5)
+14 063 (+1,9) +27 838 (+10,7)
+18 722
(+5,4)
2014
+106 584 (+7,6)
+5 589
(+1,5)
-966
(-0,6)
+59 549 (+36,5)
-71 959 (-11,1) +12 732
(+8,1)
+64 252 (+28,9)
+115 314 (+15,4)
-14 319
(-5,0)
(+5,1)
Sources : Transports Canada et calcul des auteurs. Les chiffres entre parenthèses sont des taux de croissance en pourcentage.
La Figure 1 montre le volume mensuel total de passagers aériens embarqués/débarqués à YQB,
ainsi que celui des trois segments de marché. Les graphiques de gauche représentent les séries en
niveau alors que ceux de droite sont leur contrepartie après transformation logarithmique et
différenciation à l’ordre 1. Les séries en niveau des différents segments de marché partagent
certaines caractéristiques: i) une tendance positive (non stationnarité de la moyenne), ii) une
volatilité croissante (non stationnarité de la variance), et iii) une importante saisonnalité
(particulièrement prononcée dans le secteur international). Notez que les mois de janvier et de
février constituent la saison creuse du trafic domestique de passagers à YQB alors que ce sont les
mois phares du segment international18. Les graphiques de droite montrent que, une fois transfor-
18
Ce constat est peut être plus apparent sur les Figures 3 et 5.
18
Figure 1: Séries mensuelles de passagers par segments de marché
19
mées, les séries semblent bien centrées autour d’une valeur (zéro en l’occurrence) et la variabilité
est moins forte dans le temps, à quelques exceptions près19.
4. Résultats
Les résultats présentés dans cette section se subdivisent en deux parties: ceux relatifs aux
simulations et à l’évaluation hors échantillon des différentes approches prévisionnelles et ceux
qui concernent les projections réalisées de janvier 2015 à décembre 2017 avec les modèles les
plus appropriés identifiés dans les simulations.
4.1 Simulations sur la période 2012 - 2014
Les simulations conduites dans cette section ont pour objectif de déterminer la précision
prévisionnelle des différentes approches décrites dans la section 2 sur chaque segment de
marché. Différents modèles sont estimés avec les données observées de janvier 2000 à décembre
2011 et des prévisions-tests sont réalisées sur un horizon de 36 mois (janvier 2012 à décembre
2014). Les détails de l’estimation sont disponibles dans l’annexe.
A) Modèles individuels
Nous commençons par comparer la performance prévisionnelle des modèles individuels sur la
période de janvier 2012 à décembre 2014. La qualité des projections est présentée dans les
Tableaux 4 et 5 pour les deux indicateurs d’erreur prévisionnelle absolue en pourcentage (MAPE
et MedAPE). Nous observons que les modèles individuels atteignent tous des MAPE et des
MedAPE inférieures à 10% pour la série agrégée (colonne « Total » des deux tableaux) et sur le
segment domestique. Le secteur transfrontalier se révèle plus difficile à prévoir, avec des erreurs
situées entre 13,9% (meilleur modèle) et 21,2% (pire modèle), ce qui est peu satisfaisant.
Concernant le segment de marché international, les modèles de régression linéaire/harmonique et
19
Cette remarque concerne essentiellement les mois de novembre de 2002 à 2006 de la série du segment
international. Les valeurs « 0 » (absence de passagers) ont été remplacées par un « 1 » pour l’application du
logarithme, d’où les pics abrupts observables à ces dates.
20
SARIMA sont inutilisables (trop imprécis), mais les deux modèles restants (Naïf saisonnier et
SARIMA) affichent une performance prévisionnelle comprise entre 10,4% et 19,6%. Un des
modèles individuels donne donc ici des prévisions raisonnablement bonnes. On notera qu’il est
plus judicieux de prévoir le trafic de passagers agrégé avec son propre modèle, plutôt que de
sommer les prévisions réalisées sur chaque segment de marché. En effet, la somme des
prévisions de chaque segment de marché
(colonne « D + Tr + I ») de la plupart des modèles
testés se révèle plus imprécise que la prévision issue des modèles estimés spécifiquement avec la
série agrégée (colonne Total), et ceci quel que soit l’indicateur de performance prévisionnel.
Tableau 4: Performance prévisionnelle des modèles individuels de janvier 2012 à décembre
2014. Indicateur MAPE (en %)
Modèles
NS
Total
Domestique
[2] 7,7
[3] 8,7
[2] 15,1
[1] 10,4
[2] 7,7
RL/RH
[4] 9,4 [RH]
[1] 6,2 [RL]
[1] 14,3 [RL]
-
[4] 19,9
[4] 9,3 [HWM]
[3] 17,5 [HWM]
[2] 19,6 [HWA]
[1] 5,6
[2] 8,3
[4] 21,2
-
[3] 15,9
HWA/HWM [1] 4,0 [HWA]
SARIMA
[3] 7,8
Segments de marché
Transfrontalier International
D+Tr+I
Remarques : [ ] le chiffre entre crochets dénote le rang du modèle, 1 désignant le modèle avec la meilleure qualité prévisionnelle.
Le signe « - » identifie les modèles dont la performance prévisionnelle est jugée largement insuffisante (erreur moyenne >
50%). NS signifie modèle naïf saisonnier, RH/RL désigne régression harmonique/linéaire. HWA/HWM est le modèle HoltWinters additif/multiplicatif et SARIMA est le modèle ARIMA saisonnier.
Tableau 5: Performance prévisionnelle des modèles individuels de janvier 2012 à décembre
2014. Indicateur MedAPE (en %)
Modèles
Total
NS
Domestique
Segments de marché
Transfrontalier International
D+Tr+I
[3] 6,8
[2] 5,8
[1] 13,9
[1] 11,2
[2] 6,8
RL/RH
[4] 8,6 [RH]
[1] 5,1 [RL]
[2] 14,2 [RL]
-
[3] 14,7
HWA/HWM
[1] 3,8 [HWA]
[4] 7,5 [HWM]
[3] 15,4 [HWA]
[2] 14,3 [HWA]
[1] 4,4
SARIMA
[2] 6,2
[3] 6,7
[4] 19,5
-
[4] 16,2
Remarques : [ ] le chiffre entre crochets dénote le rang du modèle, 1 désignant le modèle avec la meilleure qualité prévisionnelle.
Le signe « - » identifie les modèles dont la performance prévisionnelle est jugée largement insuffisante (erreur moyenne >
50%). NS signifie modèle naïf saisonnier, RH/RL désigne régression harmonique/linéaire. HWA/HWM est le modèle HoltWinters additif/multiplicatif et SARIMA est le modèle ARIMA saisonnier.
21
Il ressort des Tableaux 4 et 5 que (i) les modèles Holt-Winters additifs sont les plus performants
pour prédire le trafic total de passagers, (ii) la régression linéaire domine les autres modèles dans
le segment domestique, (iii) les modèles naïf saisonnier et la régression linéaire sont les plus
performants sur le secteur transfrontalier, dépendamment de l’indicateur de performance, (iv)
l’approche naïve saisonnière est la plus précise sur le segment international, (v) il est préférable
de prévoir le trafic total de passagers avec son propre modèle, en non pas en sommant les
prévisions réalisées pour chaque segment de marché. Le meilleur modèle de prévision est le
même quelle que soit la mesure de performance prédictive utilisée (MAPE ou MedAPE) à une
exception près. Notons également que, quelle que soit la série analysée, le modèle SARIMA
n’est jamais identifié comme le meilleur modèle.
B) Combinaison des prévisions
Ayant analysé la performance prédictive mensuelle de chacun des modèles individuels sur un
horizon de 3 ans (janvier 2012 à décembre 2014), les Tableaux 6 et 7 se concentrent sur la
combinaison de prévisions issues de ces modèles pour les mois de l’année 201420.
On constate dans ces tableaux que la qualité des prévisions des modèles individuels sur la
période de janvier 2014 à décembre 2014 est inférieure à celle reportée dans les Tableaux 4 et 5.
Ceci est attendu puisque les performances prédictives figurant dans les Tableaux 6 et 7
concernent des prédictions effectuées du 25ème au 36ème mois après la dernière valeur
observée. Les performances prédictives figurant dans les Tableaux 4 et 5 se rapportent à la
période de janvier 2012 à décembre 2014, soit du 1er au 36ème mois après la dernière valeur
observée. La qualité des prévisions mensuelles à un horizon de 1 à 2 ans étant généralement
meilleure, on ne s’étonne pas de la moins bonne performance prévisionnelle rapportée dans les
Tableaux 6 et 7. Notons également que nous excluons systématiquement les prévisions du
modèle individuel le moins performant de nos combinaisons de prévisions21. Par conséquent, les
20
Comme indiqué à la fin de la section 2.6, lorsque l’on analyse les combinaisons de prévisions, la période de
janvier 2012 à décembre 2013 est utilisée pour calculer les poids associés à certaines méthodes combinaisons
(méthodes de variance covariance). Par conséquent, la comparaison des performances prédictives se fait sur la
période allant de janvier 2014 à décembre 2014.
21
L’inclusion des prévisions de tous les modèles individuels n’améliorait pas toujours la performance prévisionnelle
et alourdissait inutilement la formule des poids optimaux de la méthode de variance-covariance.
22
combinaisons fournissent la prévision moyenne des trois meilleurs modèles individuels, notés
avec les rangs [1], [2] et [3] dans les Tableaux 4 et 5. Plus précisément, nous avons retenu les
modèles NS, HWA et SARIMA pour la série agrégée (Total), les modèles NS, RL et SARIMA
pour le segment domestique, les modèles NS, RL, HWA pour le segment transfrontalier et les
modèles NS et HWA pour le segment international.
Les Tableaux 6 et 7 indiquent qu’il existe presque toujours une méthode de combinaison de
prévisions qui permet d’améliorer la performance du meilleur modèle individuel. La principale
exception concerne le segment de marché international, pour lequel le modèle individuel le plus
simple (NS) s’avère être le plus fiable globalement22. Ensuite, on constate que la méthode de
combinaison de prévisions de la moyenne simple (MS) est très performante quel que soit
l’indicateur de performance pour les deux séries : totale et transfrontalière. Pour la série
domestique, la méthode de combinaison VCm s’avère particulièrement performante mais le
meilleur modèle individuel reste plus performant selon l’un des critères (MAPE). Pour le
segment international, aucune des méthodes de combinaison de prévision ne permet d’améliorer
le meilleur modèle individuel mais elles sont toutes supérieures au pire modèle individuel.
Tableau 6: Performance prévisionnelle des modèles combinés de janvier 2014 à
décembre 2014. Indicateur MAPE (en %)
Modèles individuels
NS
Total
Segments de marché
Domestique
Transfrontalier
[7] 13,2
[7] 17,7
[5] 14,4
[1] 11,6
RL/RH
[6] 9,3 [RH]
[1] 6,0 [RL]
[4] 12,7 [RL]
-
HWA/HWM
[3] 4,1 [HWA]
[6] 17,2 [HWM]
[6] 27,9 [HWM]
[5] 20,2 [HWA]
SARIMA
[5] 8,0
[5] 16,4
[7] 34,5
-
Combinaisons
MS
[1] 3,4
[3] 12
[1] 5,7
[4] 14,9
VCf
[2] 3,6
[4] 14,3
[2] 7,8
[3] 14,3
[4] 5,0
[2] 6,9
[3] 9,7
[2] 12,8
VCm
International
Remarques : [ ] le chiffre entre crochets dénote le rang du modèle, 1 désignant le modèle avec la meilleure qualité prévisionnelle. Le
signe « - » identifie les modèles dont la performance prévisionnelle est jugée largement insuffisante (erreur moyenne >
50%). NS signifie modèle naïf saisonnier, RH/RL désigne régression harmonique/linéaire. HWA/HWM est le modèle Holt-Winters
additif/multiplicatif et SARIMA est le modèle ARIMA saisonnier. MS est la moyenne simple et VCf et CVm sont les méthodes de
variance-covariance avec des fenêtres, respectivement, fixe et mobile.
22
Clairement le modèle NS est ici préférable au modèle HWA car même si HWA est le meilleur modèle au sens de
la MedAPE (10,9%, Tableau 7) , l’indicateur MAPE de ce modèle (20,2%, Tableau 6) n’est pas acceptable. Il est
donc préférable de privilégier le modèle individuel NS.
23
Tableau 7: Performance prévisionnelle des modèles combinés de janvier 2014 à
décembre 2014. Indicateur MedAPE (en %)
Modèles individuels
NS
RL/RH
HWA/HWM
SARIMA
Combinaisons
MS
VCf
VCm
Total
Segments de marché
Domestique
Transfrontalier
[7] 13,1
[6] 7,8 [RH]
[4] 4,0 [HWA]
[5] 7,1
[7] 18,3
[2] 5,8 [RL]
[6] 17,7 [HWM]
[4] 15,1
[5] 14,1
[4] 12,7 [RL]
[6] 29,9 [HWA]
[7] 32,7
[2] 2,5
[1] 2,0
[3] 3,6
[3] 12,9
[5] 15,1
[1] 4,9
[1] 3,7
[2] 6,1
[3] 10,3
International
[5] 12,7
[1] 10,9 [HWA]
[2] 11,6
[4] 12,0
[3] 11,6
Remarques : [ ] le chiffre entre crochets dénote le rang du modèle, 1 désignant le modèle avec la meilleure qualité prévisionnelle. Le
signe « - » identifie les modèles dont la performance prévisionnelle est jugée largement insuffisante (erreur moyenne >
50%). NS signifie modèle naïf saisonnier, RH/RL désigne régression harmonique/linéaire. HWA/HWM est le modèle Holt-Winters
additif/multiplicatif et SARIMA est le modèle ARIMA saisonnier. MS est la moyenne simple et VCf et CVm sont les méthodes de
variance-covariance avec des fenêtres, respectivement, fixe et mobile.
Une fois les méthodes de combinaison de prévision les plus performantes identifiées et les
comparaisons effectuées avec les meilleurs modèles individuels, il convient de déterminer les
modèles à utiliser pour effectuer les prévisions mensuelles sur la période de janvier 2015 à
décembre 2017. Comme le meilleur modèle à retenir peut varier selon le critère de performance
(MAPE ou MEdAPE), nous utiliserons les deux modèles les plus performants sur chaque
segment de marché, tout critère de performance confondu. Par conséquent nous fournissons deux
prévisions sur l’horizon 2015-2017 pour chacune des séries, l’une issue de la meilleure technique
de prévision (modèle individuel ou combinaison de prévisions), et l’autre issue de la seconde
meilleure technique de prévision23. Ceci permettra au décideur de disposer de deux prévisions
relativement équivalentes d’un point de vue statistique. Il pourra ainsi privilégier la plus
adéquate ex-post où de préférer celle jugée la plus crédible selon son propre jugement.
23
La note de bas de page 22 expliquait pourquoi le modèle NS était choisi comme le plus performant pour le
segment international. On remarquera dans les Tableaux 6 et 7 que la combinaison VCm pour ce segment est très
proche en termes de performance MAPE et MedAPE de celle du modèle NS. La combinaison VCm constituera donc
le second meilleur modèle prévisionnelle dans ce cas.
24
4.2 Prévisions à l’horizon 2015 - 2017
Avant de nous intéresser au détail des prévisions mensuelles de trafic de passagers de YQB pour
la période 2015-2017, analysons dans les Tableaux 8 et 9 les prévisions annuelles qui en
découlent. Rappelons que le nombre total prédit de passagers du Tableau 8 ne correspond pas
exactement à la somme des prévisions obtenues pour les trois segments de marché. En effet,
toutes les séries sont prédites indépendamment l’une de l’autre et nous avons montré dans les
Tableaux 4 et 5 qu’il est préférable de prévoir directement la série agrégée plutôt que d’agréger
les prévisions des différents segments de marché. Ceci étant dit, le Tableau 10 fournit également
le nombre total de passagers prévus lorsque l’on additionne les prévisions des différents
segments. On remarque que les volumes annuels prédits pour l’année 2016 et 2017 dans la
colonne « Total » du Tableau 8 sont inférieurs à ceux de la colonne « Total (D + Tr + I) » du
Tableau 10. Ceci indique qu’une tendance positive moins prononcée est capturée lorsque l’on
prédit les données mensuelles sous leur forme agrégée pour ces deux années plus qu’en sommant
les prévisions des différents segments de marché.
Nous nous concentrons sur les projections annuelles issues du meilleur modèle de prévision,
notés par un [1] dans les lignes/colonnes correspondantes des Tableaux 8 à 10. On voit dans le
Tableau 9 que l’accroissement prévu du nombre total de passagers embarqués/débarqués à YQB
entre 2014 et 2017 est de +162 521 passagers, soit un accroissement de +10,8% sur cette période.
Tableau 8: Nombre annuel de passagers prévus de 2015 à 2017 par segments de marché
Total
[1] VCf
[2] MS
Années
1 510 047
2014
1
564
752
1 565 167
2015
1 618 726 1 618 047
2016
1 672 568 1 670 860
2017
Segments de marché
Domestique
Transfrontalier
[1] VCm
[2] RL
[1] MS
[2] VCf
International
[1] NS
[2]VCm
862 823
901 246
900 057
975 303
963 033
1 061 791 1 036 072
373 174
373 174
374 722
373 174
374 978
373 174
375 234
274 050
286 060
286 835
294 005
296 923
300 462
305 714
Remarques : [ ] le chiffre entre crochets à la ligne 2 dénote le rang du modèle, 1 désignant le modèle avec la meilleure qualité
prévisionnelle. Les prévisions sont en italiques.
25
Tableau 9: Accroissement et taux de croissance (en %) annuels prévus du nombre de
passagers de 2015 à 2017
Années
Segments de marché Modèles
Total
[1] VCf
[2] MS
Domestique
[1] VCm
[2] RL
Transfrontalier
[1] MS
[2] VCf
International
[1] NS
[2]VCm
2015
2016
2017
2014-2017
+54 705 (+3,6) +53 974 (+3,4) +53 842 (+3,3)
+55 120 (+3,7) +52 880 (+3,4) +52 813 (+3,3)
+162 521 (+10,8)
+160 813 (+10,6)
+38 423 (+4,5) +74 057 (+8,2) +86 488 (+8,9)
+37 234 (+4,3) +62 976 (+7,0) +73 039 (+7,6)
+198 968 (+23,1)
+173 249 (+20,1)
+12 010 (+4,4) +7 945 (+2,8)
+12 785 (+4,7) +10 088 (+3,5)
+6 457 (+2,2)
+8 791 (+3,0)
+26 412 (+9,6)
+31 664 (+11,6)
+0 (+0)
+0 (+0)
+0 (-)
+0 (-)
+1 548 (+0,4)
+256 (+0,1)
+256 (+0,1)
+2 060 (+0,6)
Remarques : [ ] le chiffre entre crochets à la ligne 2 dénote le rang du modèle, 1 désignant le modèle avec la meilleure qualité
prévisionnelle. Les prévisions sont en italiques. Les chiffres entre parenthèses sont des taux de croissance en pourcentage.
Tableau 10: Nombre annuel de passagers prévus de 2015 à 2017 par addition des
prévisions des différents segments de marchés
Années
2015
2016
2017
2014-2017
Total (D + Tr + I)
[1]
[2]
Accroissement et taux de croissance
(en %)
[1]
[2]
1 560 480
1 642 482
1 735 427
1 561 614
1 634 934
1 717 020
+50 433 (+3,3)
+82 002 (+5,3)
+92 945 (+5,7)
+51 567 (+3,4)
+73 320 (+4,7)
+82 086 (+5,0)
-
-
+225 380 (+14,9)
+206 973 (+13,7)
Remarques : [ ] le chiffre entre crochets à la ligne 2 dénote le rang du modèle, 1 désignant le modèle avec la
meilleure qualité prévisionnelle. Les prévisions sont en italiques. Le Total (D + Tr + I) se réfère à la somme
des prévisions des segments Domestique, Transfrontalier et International du Tableau 8.
Cette augmentation est inférieure à celle que l’on observe durant la période 2011-2014 antérieure
(Tableau 3, +196 600 et +15,1%). Notons que l’accroissement prévu entre 2014 et 2017 lorsque
l’on agrège les prévisions des différents segments de marché (Tableau 10) est plus fort, soit +225
380 passagers et un taux de croissance de +15%. La prédiction la plus conservatrice du total de
passagers est cependant la plus plausible du point de vue statistique.
26
La dynamique des différents segments de marché reportée dans le Tableau 9 suggère que le
marché domestique devrait conserver une croissance vigoureuse (+198 968, soit +23,1% de 2014
à 2017). Le segment transfrontalier devrait expérimenter une croissance plus modeste (+26 412
passagers, soit +9,6% sur cette même période) alors qu’on s’attend à une stagnation sur le
marché international (+2 060 passagers, soit +0,2% avec le modèle de prévision le plus
optimiste). Il est bien entendu que ces scénarios sont de type « business as usual » et que ces
chiffres ne sont pertinents que dans ce contexte.
Nous abordons maintenant les prévisions mensuelles sur la période de janvier 2015 à décembre
2017. L’objectif fondamental de la prévision des séries mensuelles est de répliquer et projeter de
la manière la plus fiable possible les tendances et les cycles qui affectent le trafic de passagers de
YQB.
Les Figures 2 à 5 illustrent l’évolution mensuelle du volume de passagers prévu à l’horizon
2015-2017 pour l’ensemble des segments de marché et pour chacun d’entre eux (domestique,
transfrontalier et international). Ces projections sont mises en perspective avec le trafic mensuel
de passagers observé depuis 2010 pour évaluer visuellement la plausibilité des prédictions. Deux
graphiques sont proposés pour chaque segment de marché : le graphique A correspond aux
projections effectuées avec la meilleure technique prévisionnelle (A) alors que les projections du
graphique (B) sont celles de la « seconde meilleure » technique prévisionnelle. On remarque
dans ces figures la bonne capacité des différentes approches à capturer les cycles passés du trafic
mensuel de passagers de YQB. Les différences entre les deux projections ne sont pas
visuellement importantes. Le Tableau 11 de l’annexe fournit les volumes mensuels prédits de
passagers pour chaque segment de marché. On notera dans ce tableau que la seconde meilleure
technique prévisionnelle (colonnes [2]) donne en général des prédictions plus optimistes pour les
segments transfrontalier et international et plus conservatrices pour le segment domestique. Les
prévisions mensuelles pour la série agrégée (Total) sont relativement proches dans les colonnes
[1] et [2].
La Figure 2 montre l’évolution du trafic total de passagers de YQB de 2010 à 2014 pour les mois
de janvier à décembre et les projections obtenues pour la période 2015-2017 (en gras). On
constate que les projections A et B sont très similaires, avec des pics plus prononcés durant la
période hivernale de décembre à avril (mars étant pic le plus élevé). Le creux le plus accentué
27
correspond au mois de mai sur ce segment de marché. On remarque un pic mineur durant les
mois estivaux de juillet et août.
Figure 2: Prévisions mensuelles du nombre total de passagers avec les deux meilleures méthodes
de prévision
A. Meilleure méthode de prévision : VCf
B. Seconde meilleure méthode de prévision : MS
La Figure 3 se concentre sur le secteur domestique. Cette série se caractérise par une activité
croissante à partir de mai, le pic d’octobre et le creux particulièrement marqué en décembre. La
prévision A suggère une légère accentuation de la saisonnalité ces prochaines années avec une
différence plus grande entre les creux et les pics. Le graphique B capture ce même phénomène.
28
Figure 3: Prévisions mensuelles du nombre de passagers dans le secteur domestique avec
les deux meilleures méthodes de prévision
A. Meilleure méthode de prévision : VCm
B. Seconde meilleure méthode de prévision : RL
La Figure 4 illustre l’évolution passablement erratique du segment transfrontalier. Commençons
par noter que l’axe des ordonnées (Y) s’étend de 10 000 à 30 000 passagers. L’ampleur des
variations n’est donc pas visuellement comparable avec les autres segments de marché et elle est
en moyenne inférieure à celle des segments total et domestique. Néanmoins, à des fins
prévisionnelles, ce schéma temporel est typiquement plus difficile à extrapoler. Les creux se
situent en mai et novembre et les pics se produisent en mars et durant l’été (juillet à octobre). À
nouveau, nous ne distinguons pas de différences visuelles spectaculaires entre les graphiques A
et B.
29
Figure 4: Prévisions mensuelles du nombre de passagers dans le secteur transfrontalier
avec les deux meilleures méthodes de prévision
A. Meilleure méthode de prévision : MS
B.
Seconde meilleure méthode de prévision : VCf
Finalement, la Figure 5 donne des prévisions mensuelles pour le secteur international. On
constate que malgré les fortes variations entre les différents mois, il se dégage une cyclicité
claire. Les mois de janvier et de mars sont les mois phares (avec des niveaux d’activité proches
du niveau du segment domestique durant cette période) et l’activité minimale est enregistrée en
septembre et octobre. Les méthodes A et B donnent des résultats sensiblement similaires.
30
Figure 5: Prévisions mensuelles du nombre de passagers dans le secteur international avec
les deux meilleures méthodes de prévision
A. Meilleure méthode de prévision : NS
B. Seconde meilleure méthode de prévision : VCm
31
5. Conclusions
Dans ce rapport, nous utilisons quatre modèles simples de prévision pour prédire le trafic de
passagers de l’Aéroport International Jean-Lesage de Québec à l’horizon 2015 -2017. Dans un
premier temps, nous explorons la performance prédictive de ces modèles sur une période
antérieure pour les trois grands segments de marché (domestique, transfrontalier et international)
et le niveau total de passagers embarqués/débarqués. Nous montrons que chaque segment de
marché possède son propre meilleur modèle prévisionnel, et donc qu’il n’est en général pas
recommandé d’utiliser un seul modèle individuel pour prédire le trafic de passagers des
différents segments de marché de YQB. Nous combinons ensuite, pour chaque segment de
marché, les prévisions des meilleurs modèles individuels selon trois schémas de pondération des
prévisions (la moyenne arithmétique simple et deux méthodes de variance-covariance) et nous
calculons leur performance prévisionnelle. Nous montrons que, pour la plupart des séries
analysées et quel que soit le critère de performance prédictive utilisé, les méthodes de
combinaison permette d’améliorer les prévisions. Aucune méthode de combinaison ne domine
systématiquement les autres dans ce contexte.
Les méthodes de combinaison semblent atteindre leur objectif d’améliorer la performance
prévisionnelle lorsqu’elles sont appliquées aux séries mensuelles de trafic aérien de passagers de
YQB. Ceci est d’un grand intérêt pour la planification à court et moyen terme. En effet, les
prévisions offertes dans ce rapport devraient être suffisamment fiables pour servir de points de
référence pour atteindre des objectifs de court ou moyen terme (1 à 3 ans) et aider à la décision.
Un développement intéressant des méthodes appliquées dans ce rapport serait d’inclure, parmi
les modèles de prévision, des modèles avec des variables explicatives qui prennent en compte
explicitement l’évolution de la conjoncture pour capturer la demande, ainsi que l’offre de vols ou
la capacité d’accueil de l’infrastructure aéroportuaire. Ces modèles additionnels pourraient être
comparés aux modèles étudiés et ils pourraient être combinés entre eux pour améliorer la
performance prévisionnelle et établir des scénarios plus variés de développement pour YQB.
32
6. Annexes
33
Tableau 11: Prévisions mensuelles pour la période 2015-2017 avec les deux meilleures
méthodes de prévision.
Période
janv-15
févr-15
mars-15
avr-15
mai-15
juin-15
juil-15
août-15
sept-15
oct-15
nov-15
déc-15
Total 2015
janv-16
févr-16
mars-16
avr-16
mai-16
juin-16
juil-16
août-16
sept-16
oct-16
nov-16
déc-16
Total 2016
janv-17
févr-17
mars-17
avr-17
mai-17
juin-17
juil-17
août-17
sept-17
oct-17
nov-17
déc-17
Total 2017
Total
Domestique
Transfrontalier
International
D+T+I
[1] VCf
[2] MS
[1] VCm
[2] RL
[1] MS
[2] VCf
[1] NS
[2]VCm
[1]
[2]
150 725
146 891
167 288
141 548
104 992
112 281
129 579
130 465
119 723
119 565
110 360
131 335
151 384
146 866
167 812
142 044
104 771
111 994
129 738
130 548
119 248
119 112
110 408
131 242
65 559
68 243
69 227
66 848
80 248
83 392
76 764
80 844
84 825
90 771
71 256
63 269
66 536
67 608
69 218
66 632
79 798
80 672
79 611
81 353
83 305
90 744
71 189
63 391
22 574
23 363
25 786
20 815
17 132
22 546
27 774
28 535
26 695
27 159
20 211
23 470
22 574
23 473
25 815
20 872
17 237
22 535
27 810
28 383
26 792
27 445
20 248
23 651
58 798
54 230
68 150
53 657
12 762
12 336
17 071
16 971
10 910
6 587
22 538
39 164
58 538
54 651
69 737
53 658
12 828
12 387
17 084
17 003
10 828
6 581
22 230
39 197
146 931
145 836
163 163
141 320
110 142
118 274
121 609
126 350
122 430
124 517
114 005
125 903
147 648
145 732
164 770
141 162
109 863
115 594
124 505
126 739
120 925
124 770
113 667
126 239
1 564 752
155 616
151 411
171 815
146 053
109 367
116 699
134 057
134 944
124 172
124 015
114 755
135 822
1 565 167
155 989
151 284
172 233
146 454
109 116
116 361
134 134
134 945
123 631
123 494
114 763
135 643
901 246
70 747
73 680
74 779
72 246
86 772
90 216
83 087
87 547
91 904
98 394
77 279
68 652
900 057
70 769
71 927
74 709
71 655
86 064
85 889
83 462
85 694
88 839
98 345
77 165
68 515
286 060
23 266
24 079
26 545
21 422
17 630
23 173
28 534
29 283
27 404
27 883
20 722
24 064
286 835
23 431
24 362
26 768
21 635
17 863
23 327
28 778
29 339
27 702
28 379
20 911
24 428
373 174
58 798
54 230
68 150
53 657
12 762
12 336
17 071
16 971
10 910
6 587
22 538
39 164
374 722
58 563
54 694
69 787
53 658
12 840
12 392
17 087
17 022
10 854
6 582
22 270
39 229
1 560 480
152 811
151 989
169 474
147 325
117 164
125 725
128 692
133 801
130 218
132 864
120 539
131 880
1 561 614
152 763
150 983
171 264
146 948
116 767
121 608
129 327
132 055
127 395
133 306
120 346
132 172
1 618 726
160 143
155 938
176 336
150 571
113 781
121 149
138 555
139 442
128 648
128 491
119 186
140 328
1 618 047
160 411
155 705
176 651
150 871
113 480
120 743
138 541
139 352
128 026
127 890
119 136
140 054
975 303
76 804
80 029
81 263
78 549
94 389
98 184
90 471
95 375
100 171
107 300
84 316
74 940
963 033
76 077
77 139
81 116
77 446
93 362
92 004
87 566
90 395
95 179
107 222
84 141
74 425
294 005
23 840
24 669
27 177
21 922
18 035
23 682
29 153
29 886
27 973
28 459
21 126
24 540
296 923
24 184
25 142
27 610
22 305
18 408
24 016
29 625
30 168
28 490
29 183
21 480
25 103
373 174
58 798
54 230
68 150
53 657
12 762
12 336
17 071
16 971
10 910
6 587
22 538
39 164
374 978
58 587
54 738
69 837
53 658
12 852
12 397
17 089
17 040
10 880
6 584
22 310
39 262
1 642 482
159 442
158 928
176 590
154 128
125 186
134 202
136 695
142 232
139 054
142 346
127 980
138 644
1 634 934
158 848
157 019
178 563
153 409
124 622
128 417
134 280
137 603
134 549
142 989
127 931
138 790
1 672 568
1 670 860
1 061 791
1 036 072
300 462
305 714
373 174
375 234
1 735 427
1 717 020
34
Tableau 12: Modèles de régression linéaire
Segments de marché
Total
Variables
(Intercept)
Année
Année^2
Année^3
Année^4
Février
Mars
Avril
Mai
Juin
Juillet
Août
Septembre
Octobre
Novembre
Décembre
D11/09
DSARS
Dcrise08
R2 adj
AIC
Log.V
MAPE (%)
MedAPE(%)
Domestique
Transfrontalier
Linéaire
Sélection AIC
Linéaire
Sélection AIC
Linéaire
20,8E+3 ***
20,8E+3 ***
12,2E+3 ***
12,2E+3 *** -46,7E+3 **
(3,3E+3)
(3,3E+3)
(2,4E+3)
(2,3E+3) (15,0E+3)
Sélection AIC
-46,7E+3 **
(15,0E+3)
-20,74 *** (3,25) -20,74 *** (3,23) -12,14 *** (2,39) -12,17 *** (2,37) 46,36 ** (14,89)
0,01 *** (0)
0,01 *** (0)
0 *** (0)
0 *** (0) -0,01 ** (0)
46,36 ** (14,89)
-0,01 ** (0)
0,02 (0,04)
0,05 (0,04)
-0,14 ** (0,04)
-0,19 *** (0,04)
-0,13 ** (0,04)
-0,17 *** (0,04)
-0,12 ** (0,04)
-0,12 ** (0,04)
-0,1 * (0,04)
-0,33 *** (0,04)
-0,25 *** (0,04)
-0,21 , (0,11)
-0,1 ** (0,04)
0 (0,05)
0,84
-226,62
131,31
0,02 (0,04)
0,05 (0,04)
-0,14 ** (0,04)
-0,19 *** (0,04)
-0,13 ** (0,04)
-0,17 *** (0,04)
-0,12 ** (0,04)
-0,12 ** (0,04)
-0,1 * (0,04)
-0,33 *** (0,04)
-0,25 *** (0,04)
-0,21 , (0,11)
-0,1 ** (0,04)
0,84
-228,62
131,31
22,28
21,33
0,05 (0,03)
0,05 (0,03)
0,02 (0,03)
0,2 *** (0,03)
0,23 *** (0,03)
0,1 ** (0,03)
0,16 *** (0,03)
0,22 *** (0,03)
0,29 *** (0,03)
0,05 (0,03)
-0,11 *** (0,03)
-0,31 *** (0,08)
-0,11 *** (0,03)
-0,01 (0,04)
0,78
-315,72
175,86
0,05 (0,03)
0,05 (0,03)
0,02 (0,03)
0,2 *** (0,03)
0,23 *** (0,03)
0,1 ** (0,03)
0,16 *** (0,03)
0,22 *** (0,03)
0,29 *** (0,03)
0,05 (0,03)
-0,11 *** (0,03)
-0,3 *** (0,08)
-0,11 *** (0,03)
0,78
-317,68
175,84
6,20
5,11
0,07 (0,08)
0,06 (0,08)
-0,11 (0,08)
-0,21 * (0,08)
0,03 (0,08)
0,17 * (0,08)
0,22 ** (0,08)
0,18 * (0,09)
0,25 ** (0,09)
-0,06 (0,09)
-0,02 (0,09)
-0,13 (0,09)
0,80
-52,92
42,46
0,07 (0,08)
0,06 (0,08)
-0,11 (0,08)
-0,21 * (0,08)
0,03 (0,08)
0,17 * (0,08)
0,22 ** (0,08)
0,18 * (0,09)
0,25 ** (0,09)
-0,06 (0,09)
-0,02 (0,09)
-0,13 (0,09)
0,80
-52,92
42,46
14,35
14,22
International
Linéaire
19,5E+3 ***
(41,6E+3)
-194,53 ***
(41,51)
0,05 *** (0,01)
-0,06 (0,54)
0,05 (0,54)
-0,47 (0,54)
-1,53 ** (0,54)
-1,43 ** (0,54)
-1,02 , (0,54)
-1,06 , (0,54)
-1,45 * (0,56)
-2,22 *** (0,54)
-5,07 *** (0,54)
-0,74 (0,54)
0,44 (1,39)
-0,13 (0,47)
1,14 (0,7)
0,52
506,67
-235,33
Sélection AIC
19,5E+3 ***
(41,6E+3)
-196,42 ***
(40,94)
0,05 *** (0,01)
-0,06 (0,54)
0,05 (0,54)
-0,47 (0,54)
-1,53 ** (0,54)
-1,43 ** (0,54)
-1,02 , (0,54)
-1,05 , (0,54)
-1,41 * (0,54)
-2,21 ***
-5,07 ***
-0,74 (0,54)
1,14 (0,69)
0,53
506,67
-235,33
2541,35
1750,41
Remarques : ***, **, * indiquent le rejet aux seuils de, respectivement, 1%, 5% et 10% de l’hypothèse de nullité du coefficient de régression. L’écart-type des coefficients est entre parenthèses.
AIC se réfère au critère d’information d’Akaike et Log.V est la log-vraisemblance du modèle. Les MAPE et MedAPE sont calculées sur les prévisions hors-échantillon de janvier 2012 à
décembre 2014.
35
Tableau 13: Modèles de régression harmonique
Segments de marché
Domestique
Transfrontalier
International
Variables
Linéaire
Linéaire
Sélection AIC
Linéaire
Sélection AIC
Linéaire
Sélection AIC
(Intercept)
10,78 ***
11,13 *** (0,02) 11,12 *** (0,01) 10,78 *** (0,01)
(0,008)
9,43 *** (0,03)
9,43 *** (0,03)
8,23 *** (0,21)
8,24 *** (0,2)
Année
0,26 *** (0,02)
0,26 *** (0,02)
0,06 ** (0,02) 0,07 *** (0,006)
0,11 ** (0,04)
0,11 ** (0,03)
0,67 * (0,31)
0,76 ** (0,27)
Année^2
0,03 (0,03)
0,06 *** (0,01)
-0,01 (0,03)
0,11 , (0,06)
0,11 , (0,05)
1,26 ** (0,44)
1,31 ** (0,43)
Année^3
-0,03 * (0,01)
-0,03 * (0,01)
0 (0,01)
0,11 *** (0,02)
0,11 *** (0,02)
-0,16 (0,15)
-0,2 (0,14)
Année^4
0,01 (0,01)
0,02 , (0,01) 0,01 *** (0,003)
-0,07 ** (0,02)
-0,06 ** (0,02)
-0,27 (0,17)
-0,29 , (0,16)
SIN(2*π*année)
0,05 *** (0,01)
0,06 *** (0,01)
-0,03 ** (0,01) -0,03 ** (0,009) -0,08 *** (0,02) -0,08 *** (0,02)
1,01 *** (0,16)
0,97 *** (0,15)
COS(2*π* année)
0,03 * (0,01)
0,03 ** (0,01) -0,11 *** (0,01) -0,11 *** (0,009)
-0,05 * (0,02)
-0,05 * (0,02)
0,25 (0,15)
0,25 , (0,15)
SIN(4* π* année)
0,11 *** (0,01)
0,1 *** (0,01)
0,02 , (0,01)
0,02 , (0,009)
0,13 *** (0,02)
0,13 *** (0,02)
0,85 *** (0,16)
0,85 *** (0,16)
COS(4* π* année)
0,02 (0,01)
0,02 , (0,01) -0,05 *** (0,01) -0,05 *** (0,009)
0,04 , (0,02)
0,04 , (0,02)
0,69 *** (0,16)
0,67 *** (0,15)
SIN(6* π* année)
0,05 *** (0,01)
0,05 *** (0,01)
0,08 *** (0,01) 0,08 *** (0,009)
0,04 * (0,02)
0,04 * (0,02)
-0,26 , (0,15)
-0,26 , (0,15)
COS(6* π* année)
0,02 , (0,01)
0,02 , (0,01)
0,04 *** (0,01) 0,04 *** (0,009)
-0,03 (0,02)
-0,03 (0,02)
0,5 ** (0,16)
0,51 ** (0,15)
SIN(8* π* année)
-0,03 * (0,01)
-0,03 * (0,01)
0,01 (0,01)
-0,03 (0,02)
-0,03 (0,02) -0,61 *** (0,16)
-0,63 *** (0,15)
COS(8* π* année)
0,02 , (0,01)
0,02 , (0,01)
0 (0,01)
0,04 , (0,02)
0,04 , (0,02)
0,32 * (0,15)
0,31 * (0,15)
SIN(10* π* année)
-0,03 * (0,01)
-0,03 * (0,01)
-0,02 ** (0,01) -0,02 ** (0,009)
-0,03 (0,02)
-0,03 (0,02)
-0,42 ** (0,16)
-0,41 ** (0,15)
COS(10* π* année)
0,03 * (0,01)
0,03 * (0,01)
0,02 * (0,01)
0,02 * (0,009)
0,01 (0,02)
-0,25 (0,15)
-0,27 , (0,15)
SIN(12* π* année)
-1,69E+09
-8,66E+08
-4,02E+09
2,90E+09
3,11E+10
3,27E+10
(1,74E+09)
(1,30E+09)
(2,95E+09)
(2,90E+09)
(2,25E+10)
(2,21E+10)
COS(12* π* année)
-0,01 (0,01)
0 (0,01)
-0,03 * (0,01)
-0,03 * (0,01)
-0,19 (0,12)
-0,19 (0,12)
D11/09
-0,2 , (0,11)
-0,2 , (0,11)
-0,3 *** (0,08) -0,3 *** (0,077)
0,4 (1,39)
DSARS
-0,06 (0,04)
-0,07 , (0,04) -0,11 *** (0,03) -0,1 *** (0,027)
-0,08 (0,51)
Dcrise08
-0,02 (0,06)
0,01 (0,04)
0,02 (0,08)
0,71 (0,72)
R2 -adj
0,84
0,85
0,78
0,79
0,87
0,87
0,53
0,54
AIC
-230,35
-235,39
-314,09
-325,76
-96,43
-96,43
506,03
501,27
Log.V
136,18
134,69
178,05
176,88
65,21
65,21
-232,02
-232,63
MAPE (%)
9,36
22,77
32,98
87,00
MedAPE (%)
8,65
19,61
27,66
95,92
Remarques : ***, **, * indiquent le rejet aux seuils de, respectivement, 1%, 5% et 10% de l’hypothèse de nullité du coefficient de régression. L’écart-type des coefficients est entre
parenthèses. AIC se réfère au critère d’information d’Akaike et Log.V est la log-vraisemblance du modèle. Les MAPE et MedAPE sont calculées sur les prévisions horséchantillon de janvier 2012 à décembre 2014.
Total
Sélection AIC
36
Tableau 14: Modèles de lissage exponentiel Holt-Winters
Total
Variables Additif
Multiplicatif
a
105353,52
106037,76
b
490,41
559,70
s1
31169,16
1,32
s2
28528,89
1,30
s3
36797,54
1,39
s4
7905,70
1,10
s5
-17516,97
0,85
s6
-8679,54
0,93
s7
262,50
1,01
s8
-857,16
1,00
s9
-1091,97
0,99
s10
-3587,49
0,97
s11
-13389,83
0,86
s12
6360,72
1,05
Paramètre de lissage
alpha
0,25
0,21
beta
0,02
0,03
gamma
0,76
0,66
MAPE
3,99
5,02
MedAPE
3,21
4,15
Segments de marché
Domestique
Transfrontalier
Additif
Multiplicatif Additif Multiplicatif
22965,47
59148,20
59903,93 22539,41
230,22
-43,17
-38,34
223,82
0,87
-4661,89
0,90 -1876,14
0,98
-2868,14
0,94 -220,04
1,03
-2277,28
0,95
640,60
0,86
-3479,47
0,92 -1963,05
0,74
6576,28
1,12 -3864,63
0,92
8649,72
1,17 -956,13
1,12
2492,96
1,04 2281,62
1,09
2777,69
1,06 1475,03
1,09
4828,53
1,10 1473,51
1,17
9209,43
1,18 2707,62
0,80
-4059,28
0,93 -3646,07
0,92
-8713,34
0,83 -1215,82
0,49
0,00
0,34
9,88
9,06
0,41
0,00
0,31
9,34
7,47
0,25
0,01
0,38
17,57
15,45
0,25
0,03
0,44
17,47
16,20
International
Additif
Multiplicatif
25163,20
45173,06
-22,98
-22,98
38368,62
1,53
33486,95
1,51
37469,29
1,49
14785,77
1,17
-19587,12
0,56
-17442,73
0,83
-13212,77
0,96
-10765,43
0,98
-12580,27
0,93
-17091,05
0,71
-4326,00
0,47
13307,80
0,85
0,26
0,00
1,00
19,63
14,27
1,00
0,00
1,00
118,00
62,33
Remarques : a désigne le niveau, b est la tendance et sP (P=1,…,12) sont les composantes mensuelles. Alpha, beta et gamma sont les
paramètres de lissage de, respectivement, le niveau, la tendance et la saisonnalité. Les MAPE et MedAPE sont calculées sur les prévisions horséchantillon de janvier 2012 à décembre 2014.ß
37
Tableau 15: Modèles SARIMA
Segments de marché
Domestique
Transfrontalier
0,8 ***
-0,47 *
(0,09)
(0,24)
-1,23 ***
0,09
(0,14)
(0,21)
0,24
-0,5 ***
(0,14)
(0,11)
0,26 **
0,43 *** (0,08)
(0,1)
Variables
Total
ar1
-0,39 ***
(0,08)
-0,35 ***
(0,1)
0,44 ***
(0,08)
0,35 ***
(0,08)
0,39 *** (0,08)
(0,1,2)(2,0,0) (1,1,2)(2,0,0)
-345,35
-283,37
177,85
147,99
13,0 (0,37)
13,5 (0,06)
7,76
8,28
6,29
6,65
ma1
ma2
sar1
sar2
SARIMA(p,d,q)(P,D,Q)12
AIC
Log.V
Test Ljung-Box (p-valeur)
MAPE (en %)
MedAPE (en %)
0,45 *** (0,11)
(1,1,2)(2,0,0)
-64,77
38,86
1,6 (0,98)
21,19
19,50
International
-0,8 ***
(0,08)
-0,15
(0,09)
0,78 ***
(0,04)
(0,1,2)(1,0,0)
443,2
-217,45
2,1 (0,99)
97,55
91,47
Remarques : l’estimation du modèle SARIMA est faite avec la fonction auto.sarima(…, d=1, ic= ’AIC’, seasonnal=TRUE,
stepwise=FALSE, approximation=FALSE, seasonnal.test= « OCSB») sur les séries en log-différences. Le test de Ljung-Box
porte sur les résidus du modèle SARIMA et il est réalisé en prenant en compte les degrés de liberté du modèle, ainsi que 12 lags
(les résultats sont très similaires avec 24 lags). ***, **, * indiquent le rejet aux seuils de, respectivement, 1%, 5% et 10% de
l’hypothèse de nullité du coefficient de régression. L’écart-type des coefficients est entre parenthèses. AIC se réfère au critère
d’information d’Akaike et Log.V est la log-vraisemblance du modèle. Les MAPE et MedAPE sont calculées sur les prévisions
hors-échantillon de janvier 2012 à décembre 2014.
38
7. Bibliographie
Andrawis, R., Atiya, A. et El-Shishiny, H. (2011), Combination of long term and short term
forecasts, with application to tourism demand forecasting, International Journal of
Forecasting, 27:870-886
Bates, J. et Granger, C. (1969). The combination of forecasts. Operational Research Quarterly,
20(4):451–468.
Bougas, C. (2013). Forecasting Air Passenger Traffic Flows in Canada: An Evaluation of
Time Series Models and Combination Methods, Mémoire de maîtrise en économique, Chaire
de recherche aéroportuaire de l’Université Laval.
Chen, C., Chang, Y., et Chang, Y. (2009). Seasonal arima forecasting of inbound air travel
arrivals to Taiwan. Transportmetrica, 5(2):125–140.
Chu, F. (1998). Forecasting tourism: a combined approach. Tourism Management,
19(6):515–520.
Chu, F. (2009). Forecasting tourism demand with arma-based methods. Tourism
Management, 30(5):740–751.
Coshall, J. (2009). Combining volatility and smoothing forecasts of UK demand for
international tourism. Tourism Management, 30(4):495–511.
Coshall, J. et Charlesworth, R. (2011). A management oriented approach to combination
forecasting of tourism demand. Tourism Management, 32:759–769.
Diebold, F. et Pauly, P. (1987). Structural Change and the Combination of Forecasts. Journal
of Forecasting, 6:21-40.
Emiray, E. et Rodriguez, G. (2003). Evaluating Time Series Models in Short and Long-Term
Forecasting of Canadian Air Passenger Data. Department of Economics, University of
Ottawa.
Gelper, S., Fried, R., et Croux, C. (2010). Robust forecasting with exponential and holt–
winters smoothing. Journal of forecasting, 29(3):285–300.
Graefe, A., Armstrong, J., Randall, J., et Cuzán, A. (2014). Combining forecasts: An
application to elections, International Journal of Forecasting, 30:43–54.
Hyndman, R.J et Athanasopoulos, G. (2013). Forecasting: principles and practice.
http://otexts.org/fpp/.
39
Koopman, S. J., A. C. Harvey, J. A. Doornik, and N. Shephard (1995), STAMP, Time Series
Analyzer, Modeller and Predictor. Timberlake Consultatnts LTD.
Lim, C. et McAleer, M. (2002). Time series forecasts of international travel demand for
Australia. Tourism Managment, 23:389–396.
Oh, C. et Morzuch, B. (2005). Evaluating time-series models to forecast the demand for
tourism in Singapore comparing within-sample and postsample results. Journal of Travel
Research, 43(4):404–413.
Shen, S., Li, G., et Song, H. (2008). An assessment of combining tourism demand forecasts
over different time horizons. Journal of Travel Research, 47(2):197–207.
Shen, S., Li, G., et Song, H. (2011). Combination forecasts of international tourism demand.
Annals of Tourism Research, 38(1):72–89.
Timmermann, A. (2006), Forecast Combinations, Handbook of Economics Forecasting,
Volume 1, Chapter 4.
Transports Canada (2009), Aviation Forescasts 2008-2022, Summary Report 2008 - 2022.
Wong, K., Song, H.,Witt, S., et Wu, D. (2007). Tourism forecasting: to combine or not to
combine? Tourism Management, 28(4):1068–1078.
40