Prévisions du nombre de passagers aériens
Transcription
Prévisions du nombre de passagers aériens
Prévisions du nombre de passagers aériens embarqués/débarqués à l’Aéroport international Jean-Lesage de Québec Séries mensuelles, période 2015-2017 Carlos ORDÁS CRIADO Constantinos BOUGAS Koami Dzigbodi AMEGBLE Juillet 2015 Résumé Ce rapport fournit des prévisions mensuelles de trafic aérien de passagers embarqués/débarqués à l’Aéroport international Jean-Lesage de Québec (YQB) à l’horizon 2015 - 2017 pour trois segments de marché : domestique, transfrontalier et international. Ces projections se fondent sur les statistiques les plus actuelles disponibles auprès de Transports Canada de janvier 2000 à décembre 2014. Quatre modèles statistiques de séries chronologiques sont utilisés: (i) le modèle naïf saisonnier, (ii) la régression linéaire, (iii) le lissage exponentiel de Holt-Winters et (iv) un modèle saisonnier autorégressif avec moyenne mobile (SARIMA). L’étude explore la performance prévisionnelle de chaque modèle et vérifie si la combinaison des prévisions issues des différents modèles permet d’améliorer la performance prévisionnelle. Deux techniques de combinaison des prévisions sont testées: la moyenne simple et la moyenne pondérée, avec des poids qui minimisent l’erreur prévisionnelle passée. La qualité des projections est mesurée à l’aide de deux indicateurs : la moyenne des erreurs absolues en pourcentage (MAPE) et la médiane des erreurs absolues en pourcentage (MedPE). Les deux techniques de prévision les plus performantes sont finalement utilisées pour réaliser les prédictions mensuelles à l’horizon 2015-2017. Les simulations hors-échantillon effectuées sur le trafic de passagers de janvier 2012 à décembre 2014 montrent que combiner les prédictions des meilleurs modèles prévisionnels est l’approche la plus fiable pour prédire le nombre de passagers sur la plupart des segments de marché de YQB. L’erreur prévisionnelle (moyenne ou médiane) obtenue avec les modèles les plus performants est proche ou inférieure à 10% des valeurs observées pour tous les segments de marché. Les projections mensuelles les plus fiables sont celles effectuées pour la série agrégée (total des passagers). L’erreur prévisionnelle est alors comprise entre 2% et 5%. On montre qu’il est préférable de prévoir le nombre total de passagers en prédisant directement la série agrégée plutôt qu’en sommant le nombre de passagers prédits sur chaque segment de marché. Les flux mensuels de passagers des segments domestique et transfrontalier révèlent tous deux une dynamique relativement instable. La combinaison de prévisions permet d’atteindre une performance prédictive hors-échantillon de l’ordre de, 1 respectivement, 4,9% et 3,7% sur ces deux segments. Le volume de passagers internationaux s’avère la série la plus difficile à prévoir. Deux des modèles individuels explorés sont excessivement imprécis. Le meilleur des deux modèles restants aboutit à une erreur de prévision satisfaisante (proche de 10%), qui ne s’améliore pas par combinaison de prévisions. Nous concluons que les prévisions effectuées à l’horizon 2015-2017 avec les approches les plus performantes identifiées dans les simulations devraient se révéler suffisamment précises pour servir à la prise de décision dans un scénario de type « business as usual ». Ces prévisions peuvent être utilisées comme références pour établir des objectifs de développement à court et moyen terme. L’Aéroport international Jean-Lesage de Québec a vu transiter 1 510 000 passagers en 2014. Le volume total de passagers devrait s’établir à 1 737 500 en 2017, ce qui correspond à une augmentation de +227 400 passagers et un taux de croissance de +15,1%, similaire à celui observé de 2011 à 2014. Cette projection est calculée en additionnant les meilleures prévisions obtenues sur chaque segment de marché. Le meilleur modèle prédisant directement la série agrégée aboutit à un volume total de passagers de 1 672 600 passagers, soit une croissance plus modeste de +10,8% de 2014 à 2017. Le nombre de passagers domestiques qui transiteront par YQB entre 2014 et 2017 devrait connaître un développement similaire à celui de la période 2011 à 2014. Ce segment de marché franchira probablement le cap du million de passagers en 2017, passant de 863 000 en 2014 à 1 062 000 passagers (+ 199 000, ce qui équivaut à +23,1%). La croissance des passagers sur les segments transfrontalier et international devrait rester positive mais inférieure à celle de la période 2014-2017. Le volume de passagers passera de 274 000 en 2014 à 300 000 en 2017 (+ 26 400, ce qui équivaut à +9,6%) sur le segment transfrontalier et de 373 000 en 2014 à 375 000 en 2017 (+ 2 060, soit +0,6%) sur le segment international. 2 1. Table des matières 1. Introduction ..................................................................................................................................................... 5 2. Méthodologie ................................................................................................................................................... 9 2.1 Modèle naïf saisonnier ................................................................................................................................. 9 2.2 Modèles linéaires avec tendance et saisonnalité fixes ............................................................................. 10 2.3 Modèles de lissage exponentiel de Holt-Winters .................................................................................... 11 2.4 Le modèle dynamique SARIMA ............................................................................................................. 11 2.5 Simulation hors-échantillon des modèles individuels et performance prévisionnelle ............................. 12 2.6 Méthodes de combinaison ....................................................................................................................... 13 3. Données ......................................................................................................................................................... 16 4. Résultats ........................................................................................................................................................ 20 4.1 Simulations sur la période 2012 - 2014 ................................................................................................... 20 A) Modèles individuels ............................................................................................................................. 20 B) Combinaison des prévisions................................................................................................................. 22 4.2 Prévisions à l’horizon 2015 - 2017 .......................................................................................................... 25 5. Conclusions ................................................................................................................................................... 32 6. Annexes ......................................................................................................................................................... 33 7. Bibliographie ................................................................................................................................................. 39 3 Liste des tableaux Tableau 1: Volume annuel de passagers à YQB par segments de marché ............................................................ 17 Tableau 2: Évolution des parts des segments de marché domestique, transfrontalier et international (en %)....... 17 Tableau 3: Accroissement et taux de croissance annuel du volume de passagers par segments de marché .......... 18 Tableau 4: Performance prévisionnelle des modèles individuels de janvier 2012 à décembre 2014. Indicateur MAPE (en %) ........................................................................................................................................................ 21 Tableau 5: Performance prévisionnelle des modèles individuels de janvier 2012 à décembre 2014. Indicateur MedAPE (en %) .................................................................................................................................................... 21 Tableau 6: Performance prévisionnelle des modèles combinés de janvier 2014 à décembre 2014. Indicateur MAPE (en %) ........................................................................................................................................................ 23 Tableau 7: Performance prévisionnelle des modèles combinés de janvier 2014 à décembre 2014. Indicateur MedAPE (en %) .................................................................................................................................................... 24 Tableau 8: Nombre annuel de passagers prévus de 2015 à 2017 par segments de marché ................................... 25 Tableau 9: Accroissement et taux de croissance (en %) annuels prévus du nombre de passagers de 2015 à 2017 ............................................................................................................................................................................... 26 Tableau 10: Nombre annuel de passagers prévus de 2015 à 2017 par addition des prévisions des différents segments de marchés ............................................................................................................................................. 26 Tableau 11: Prévisions mensuelles pour la période 2015-2017 avec les deux meilleures méthodes de prévision.34 Tableau 12: Modèles de régression linéaire .......................................................................................................... 35 Tableau 13: Modèles de régression harmonique ................................................................................................... 36 Tableau 14: Modèles de lissage exponentiel Holt-Winters ................................................................................... 37 Tableau 15: Modèles SARIMA ............................................................................................................................. 38 Liste des figures Figure 1: Séries mensuelles de passagers par segments de marché ....................................................................... 19 Figure 2: Prévisions mensuelles du nombre total de passagers avec les deux meilleures méthodes de prévision. 28 Figure 3: Prévisions mensuelles du nombre de passagers dans le secteur domestique avec les deux meilleures méthodes de prévision ........................................................................................................................................... 29 Figure 4: Prévisions mensuelles du nombre de passagers dans le secteur transfrontalier avec les deux meilleures méthodes de prévision ........................................................................................................................................... 30 Figure 5: Prévisions mensuelles du nombre de passagers dans le secteur international avec les deux meilleures méthodes de prévision ........................................................................................................................................... 31 4 1. Introduction Situé dans la ville de Québec, destination touristique importante et 7ème plus grande ville du Canada, l’Aéroport international Jean-Lesage de Québec (abrégé YQB ci-après) est le 13ème plus grand aéroport canadien en termes de volume de passagers embarqués/débarqués, avec 1 510 000 passagers en 2014. Il se situe au 14ème rang canadien en termes de flux de passagers domestiques, et au 9ème et 7ème rang respectivement pour les secteurs transfrontalier et international. Le nombre de passagers aériens embarqués/débarqués à YQB a augmenté considérablement ces quinze dernières années (2000-2014), passant de 729 000 à 1 510 000 passagers (+107%) dans l’ensemble des segments de marchés, de 568 000 à 863 000 (+52%) dans le secteur domestique et de 162 000 à 373 000 (+131%) dans le secteur international1. Les vols transfrontaliers se sont développés depuis 2002 et le nombre de passagers est passé de 16 000 passagers à 274 000 en 2014, soit une multiplication par 16,6. L’évolution des flux de passagers dépend de la dynamique économique régionale et internationale, du prix des billets d’avion, ainsi que de facteurs liés à l’offre de vols (accessibilité de l’aéroport, nombre de vols offerts, etc). Les modèles explorés dans ce rapport prennent en compte ces différents aspects de manière implicite, par l’intermédiaire de l’inertie temporelle des séries de passagers et de chocs exogènes identifiés dans le passé. Cette approche se révèle adéquate à court et moyen terme, dans un scénario de type « business as usual ». Dans ce scénario, les projections basées sur le passé se révèlent en général plus précises que les approches qui intègrent explicitement des facteurs explicatifs. En effet, les variables explicatives doivent elles-mêmes être prédites, et elles ne sont pas toujours disponibles à une fréquence mensuelle et au niveau régional. Les projections mensuelles du présent rapport peuvent être utilisées comme références (benchmark) en vue d’atteindre des objectifs stratégiques. Elles peuvent servir à l’évaluation ex-post de politiques de développement de certains segments de 1 Source : Transports Canada. 5 marché ou d’atténuation des cycles. Ces projections permettent de fixer des objectifs réalistes à court et moyen terme afin d’aider à la décision. Depuis les années 90, de nombreuses études ont utilisé les modèles de séries temporelles pour prévoir l’évolution du flux de passagers aériens. La performance prévisionnelle des différents modèles varie en fonction du pays d’origine et de destination, du type de vol considéré (domestique, transfrontalier, international) et du critère de performance prévisionnel utilisé2. Il n’existe donc pas de modèle prévisionnel unique dominant et indépendant du contexte d’étude. Au Canada, le principal pourvoyeur de prévisions annuelles de trafic aérien est Transports Canada. Ces prévisions sont effectuées à l’aide de modèles de régression3 estimés avec des données origine-destination, qui incluent des facteurs explicatifs macroéconomiques (tels que des prix moyens du billet, les PIB régionaux, etc). À notre connaissance, la seule étude académique effectuée au Canada sur la prévision du trafic mensuel de passagers à l’aide de modèles de séries temporelles4 est le cahier de recherche d’Emiray et Rodriguez (2003). Ces auteurs fournissent des prévisions pour l’ensemble des passagers embarqués/débarqués dans les aéroports canadiens ainsi que pour trois segments de marché : domestique, transfrontalier et international. Ils utilisent les données allant de janvier 1984 à septembre 2002 et projettent les tendances à l’horizon 2015. L’étude conclut que la performance prévisionnelle des modèles dépend de deux éléments clés: le segment du marché considéré et l’horizon de prévision. De manière générale, les modèles les plus simples s’avèrent les plus performants à court terme alors que les modèles le plus sophistiqués performent bien à long terme et en présence de chocs structurels. Aucun des modèles de prévision explorés ne se révèle meilleur que ses paires sur tous les segments de marché. Par conséquent, il ne semble pas judicieux d’utiliser un seul type de modèle pour prédire les différents segments de marché au Canada. De plus, les résultats indiquent que combiner les prévisions issues des différents modèles aide à accroître la précision des projections. Cette étude fournit également des prévisions agrégées annuelles de long terme 2 Voir Emiray et Rodriguez (2003), Oh et Morzuch (2005) ou encore Chu (1998) et (2009). Il s’agit essentiellement d’équations d’inspiration gravitaire. 4 Les modèles utilisés sont un AR(p) avec saisonnalité déterministe, un AR(p) avec saisonnalité stochastique, un SARIMA, un modèle autorégressif périodique (PAR), un modèle de série temporelle structurelle à la Koopman et al. (1995) et un ARMA sur des séries filtrées pour se débarrasser des racines saisonnières. Notons que les auteurs proposent également de combiner les prévisions des meilleurs modèles individuels à l’aide d’une régression. 3 6 pour les années 2001 à 2006 et pour l’année 2010, qui sont comparées à celles effectuées par Transports Canada pour ces mêmes années. Les projections issues des modèles de séries temporelles se révèlent relativement proches de celles offertes par Transports Canada. Avec la rétrospective depuis la parution de cette étude, il est possible d’évaluer la performance prévisionnelle des deux approches sur l’ensemble de ces périodes. La moyenne des erreurs absolues en pourcentage (MAPE5) des modèles de Transports Canada pour les segments de marché domestique, transfrontalier et international est respectivement de 4,9%, 4,4% et 9,1%. L’erreur prévisionnelle des modèles de séries temporelles est respectivement de 6,4%, 4,9% et 7,6%. Par conséquent, les prévisions de Transports Canada se révèlent plus précises sur deux segments de marché (domestique et transfrontalier) et moins performantes sur le segment international. Combiner les prédictions de modèles simples de séries temporelles peut donc aboutir à des prévisions raisonnables sur un horizon temporel de dix années. Ces dernières années, la combinaison de prévisions de différents modèles est devenu l’approche privilégiée par la littérature scientifique6 pour améliorer la performance prévisionnelle et pour contrôler l’incertitude provenant de l’utilisation d’un modèle unique de prévision. Dans la littérature sur le tourisme, cette technique conduit en général à prédire aussi bien, voir mieux, que lorsque l’on utilise le meilleur modèle individuel7. Ce résultat peut parfois dépendre de la technique de combinaison et des caractéristiques spécifiques des régions/pays considérés8 mais une évidence empirique solide semble se dessiner en faveur des combinaisons de prévisions issues de différentes sources. Toute économie subit une variété de chocs (économiques, épidémiologiques, politiques) imprévisibles. Ces derniers sont susceptibles de modifier durablement la tendance et la volatilité du trafic de passagers au niveau national et international. La littérature scientifique traite ces phénomènes en prenant en compte les chocs passés dans les modèles de prévision. Certains des modèles utilisés dans ce travail prendront donc en compte les chocs passés. 5 Voir la section 2.5 ci-après pour une définition précise de cet indicateur de performance prévisionnelle. Voir Bates et Granger (1969), Diebold et Pauly (1987) ou Timmermann (2006). 7 Voir Shen et al.(2008, 2011) ou Coshall (2009). 8 Voir Wong et al. (2007) ou Coshall (2009). 6 7 Le premier objectif de ce rapport est de quantifier la précision avec laquelle certains modèles fondamentaux de séries temporelles permettent de prévoir le trafic de passagers de YQB. Dans un second temps, ce travail teste différentes méthodes de combinaison de prévisions et il évalue leur fiabilité prédictive. Finalement, des prévisions mensuelles sont effectuées sur chaque segment de marché de YQB à l’horizon 2015-2017 avec les méthodes prévisionnelles identifiées comme étant les plus performantes. Les modèles économétriques employés sont : (i) le modèle naïf saisonnier, (ii) les régressions linéaire et harmonique, (iii) le lissage exponentiel de Holt-Winters, (iv) une variante saisonnière du modèle ARMA (processus autorégressif à moyenne mobile). Le modèle naïf saisonnier prédit le niveau futur de passagers en se basant uniquement sur la dernière mesure observée durant le même mois de l’année précédente. Les modèles de régression linéaire et harmonique produisent des prévisions à partir de formes fonctionnelles additives dans les paramètres qui incluent une tendance (polynomiale) et des variables explicatives capturant la saisonnalité mensuelle et les chocs structurels. Le lissage exponentiel est une technique de prévision de moyenne mobile qui donne des poids décroissants aux valeurs passées tout en prenant en compte l’effet distinct de la tendance, du niveau de la chronique et sa saisonnalité. La variante saisonnière du modèle ARMA utilisée dans ce travail est un modèle classique de séries temporelles qui modélise le passé de la chronique et de ses erreurs en permettant une saisonnalité potentiellement fluctuante dans le temps (appelée saisonnalité stochastique). Nos résultats nous amène à conclure qu’il n’y a pas de modèle unique dominant pour prédire les flux de passagers d’YQB, qui fournirait les meilleures prévisions quel que soit le segment de marché considéré. L’utilisation de modèles distincts par segment de marché est donc nécessaire pour obtenir les prévisions les plus fiables à court et moyen terme avec des séries mensuelles. La performance prévisionnelle des meilleurs modèles individuels se révèle faible sur certains segments de marché, en particulier lorsqu’il s’agit de prévoir le trafic transfrontalier ou international. Nous montrons que, dans le cas d’YQB, combiner les prévisions des modèles individuels les plus performants de chaque segment de marché permet dans la plupart des cas d’améliorer la performance prévisionnelle par rapport au meilleur modèle individuel. Cette approche permet d’atteindre une fiabilité accrue dans les prévisions. Elle conduit à une qualité 8 d’ajustement (MAPE ou MedAPE) proche ou inférieure à 10% pour l’ensemble de la période de prévision et dans tous les segments de marché. Aucune méthode de combinaison de prévisions ne se détache comme préférable aux autres. La meilleure méthode de prévision peut varier selon la série analysée mais le choix est relativement robuste aux deux indicateurs de qualité prévisionnelle testés. Ce rapport est structuré de la manière suivante. Le chapitre 2 expose la méthodologie. Nous présentons les séries mensuelles de passagers de YQB au chapitre 3. Finalement, nous exposons les résultats concernant les simulations et les prévisions au chapitre 4, avant de conclure en rappelant les faits saillants du rapport. 2. Méthodologie Les modèles retenus dans ce travail sont ceux qui ont été testés pour le Canada dans le mémoire de maitrise de Bougas (2013). Il s’agit de modèles fondamentaux de prévision, décrits dans la plupart des ouvrages de référence, voir par exemple Hyndman et Athanasopoulos (2013). La plupart des modèles sont estimés à l’aide de la librairie forecast développée par les auteurs précités sur le logiciel libre R. Cette section décrit brièvement ces modèles et les procédures d’estimation. 2.1 Modèle naïf saisonnier Dans les études de prévision9, il n’est pas rare d’inclure des approches simples, car ces dernières se révèlent parfois aussi performantes que les modèles plus sophistiqués. Le modèle « naïf saisonnier » considère la prévision pour un mois donné comme étant égale à la dernière valeur observée pour ce même mois de l’année précédente. Par exemple, la prévision du nombre total de passagers embarqués/débarqués en juillet 2015 à YQB sera égale au nombre de passagers observés en juillet 2014. Lorsque la prévision mensuelle se fait sur plusieurs années (par exemple de juillet 2015 à juillet 2017), la valeur de juillet 2014 est utilisée sur l’ensemble des 9 Par exemple, Coshall et Charlesworth (2011). 9 mois de juillet de la période de prévision. Ce modèle n’intègre donc pas de tendance de moyen/long terme. Il a pour but de mesurer la performance prévisionnelle d’une technique d’estimation qui ne nécessite aucun calcul complexe. 2.2 Modèles linéaires avec tendance et saisonnalité fixes Les régressions linéaire et harmonique sont des modèles linéaires dans les paramètres, qui postulent l’existence d’une tendance et d’une saisonnalité stables dans le temps. Les deux modèles présument l’existence d’une tendance polynomiale (maximale d’ordre 4 dans ce travail) et ils se distinguent dans le traitement de la saisonnalité. Le modèle linéaire capture les effets mensuels à l’aide de variables explicatives binaires pour onze mois et une constante. La régression harmonique postule une saisonnalité issue de la combinaison de deux fonctions trigonométriques : le sinus et le cosinus. Nous ajoutons aux composantes temporelles de ces modèles trois variables explicatives (indicatrices) qui capturent les chocs structurels bien connus dans la littérature sur le trafic aérien : l’effet du 11 septembre 2001, l’effet des mois les plus virulents de la grippe aviaire (janvier à juillet 2003) et l’impact de la crise de 2008 (de septembre à décembre). Les modèles linéaire et harmonique sont ensuite soumis à une procédure de sélection automatique des variables explicatives10. Nous obtenons alors deux modèles qui contiennent un nombre optimal de facteurs explicatifs pour la prévision. Finalement, nous départageons les modèles optimaux linéaire et harmonique en ne conservant que le plus performant dans la prévision hors échantillon. Plus précisément, les modèles optimaux sont estimés avec le trafic de passagers de janvier 2000 à décembre 2011 et leur performance prévisionnelle est évaluée sur le trafic de passagers observé de janvier 2012 à décembre 2014. Nous conservons le modèle de régression le plus performant sur cette période d’évaluation pour effectuer les prévisions de janvier 2015 à décembre 2017. Cette procédure est appliquée sur chaque segment de marché et le détail des résultats se trouve dans les Tableaux 12 et 13 de l’annexe. 10 La technique retenue est l’élimination pas à pas des variables explicatives, en minimisant le critère AIC. Voir la fonction step sur R. 10 2.3 Modèles de lissage exponentiel de Holt-Winters La méthode récursive de Holt-Winters est une technique de lissage de type moyenne mobile, qui a été développée afin de prédire des séries temporelles caractérisées par la présence simultanée d’une tendance et d’un motif saisonnier. Il existe deux versions de cette procédure : additive et multiplicative. Dans les deux versions, les prévisions dépendent des trois composantes fondamentales d’une série temporelle : son niveau, sa tendance et son coefficient saisonnier. Ces trois paramètres de lissage sont calculés de manière itérative à l’aide de la fonction HoltWinters de la librairie stats. Les valeurs de ces paramètres, comprises entre 0 et 1, s’interprètent comme « des facteurs d’escompte » : plus ces valeurs sont proches de 1, plus le poids du passé récent est important par rapport aux valeurs passées distantes. Le choix entre la version additive ou multiplicative se fait en général en fonction du type de saisonnalité (additive ou multiplicative) présent dans les données. Dans ce travail, nous estimons les deux versions des modèles et nous évaluons leur performance prévisionnelle hors-échantillon selon la logique décrite à la fin de la section 2.2. Aucune des deux approches ne dominera systématiquement l’autre dans nos résultats. Le détail de ces résultats se trouve dans le Tableau 14 de l’annexe. La procédure de Holt-Winters est abondamment utilisée dans la littérature sur la prévision depuis plus de cinquante ans11. Sa popularité provient du fait qu’elle est simple à utiliser. Cependant, elle est sensible aux chocs structurels, qui ne sont pas pris en compte explicitement. 2.4 Le modèle dynamique SARIMA Ce modèle est une variante populaire12 du modèle autorégressif avec moyenne mobile (AutoRegressive-Moving-Average en anglais), communément abrégé ARMA(p,q). L’idée qui sous-tend ce modèle est que la valeur prise par une série temporelle au temps t, notée yt, dépend de deux termes additifs : (i) le passé de la chronique (noté yt-i), qui correspond à la composante autorégressive (d’ordre p) et (ii) le passé des erreurs du processus de génération des données, qui représente la composante moyenne mobile (d’ordre q). Par conséquent, l’équation estimée ici est la variante saisonnière de : 11 Voir par exemple Gelper et al. (2010) ou encore Coshall et Charlesworth (2011). Voir par exemple Lim et McAleer (2002), Emiray et Rodriguez (2003), Chen et al. (2009) ou Coshall et Charlesworth (2011). 12 11 =∑ - ∑ + où les φi (i=1,…,p) sont les paramètres autorégressifs, les θj (j=1,...,q) sont appelés paramètres moyenne-mobile et le terme εt désigne l’erreur qui possède certaines propriétés stochastiques postulées par le chercheur. Il est important de noter que ce modèle est conçu pour les séries stationnaires, qui se caractérisent par une moyenne et une variance constantes dans le temps. Ces hypothèses n’étant pas respectées par les séries avec tendance (comme celles des flux de passagers), on transforme les séries en différences premières pour stabiliser leur moyenne et le modèle est alors appelé ARIMA(p,d,q), soit AutoRegressive-Integrated-Moving-Average en anglais. Le paramètre d indique le degré de différentiation nécessaire pour rendre la série des passagers embarqués/débarqués stationnaire en moyenne. Dans notre cas, nous établissons à l’aide d’une analyse graphique et de tests simples (test de racine unitaire ADF) que la transformation logarithmique et la différenciation à l’ordre 1 permettent de rendre toutes nos séries stationnaires en moyenne et en variance. La version saisonnière du modèle ARIMA est appelée SARIMA(p,d,q)(P,D,Q)s, pour « Seasonal Autoregressive-Integrated-Moving Average». L’approche SARIMA est la plus adéquate dans notre contexte car elle prend en compte l’existence de saisonnalité déterministe ou stochastique dans les données. Ce dernier type de saisonnalité est présent lorsque le motif saisonnier change à travers le temps. Dans un tel cas, la série nécessitera une différentiation saisonnière, capturée par le paramètre « D ». Si le motif saisonnier de la série se révèle stable dans le temps, alors D=0. Nous déterminons ici le meilleur modèle SARIMA à l’aide de la fonction auto.arima de la librairie forecast. Cette fonction est paramétrée afin d’effectuer une recherche exhaustive du meilleur modèle (ordres p,q et P,Q optimaux) en minimisant le critère d’information AIC. L’ordre de différenciation saisonnière est déterminé avec le test de Osborn-Chui-Smith-Birchenhall (1988). Le détail des résultats et du paramétrage de cette fonction figure dans le Tableau 15 de l’annexe. 2.5 Simulation hors-échantillon des modèles individuels et performance prévisionnelle Afin d’identifier le modèle individuel le plus adéquat pour prédire le trafic de passagers de YQB sur chaque segment de marché de janvier 2015 à décembre 2017, l’approche habituelle consiste à 12 tester la capacité prédictive hors échantillon des modèles sur un horizon temporel antérieur et de taille similaire (36 mois). Dans notre cas, cela consiste à estimer les modèles décrits dans les sous-sections 2.1 à 2.4 sur les différents segments de marché de YQB avec les observations de janvier 2000 à décembre 2011, puis à évaluer leur performance prévisionnelle sur la période de janvier 2012 à décembre 2014. Nous évaluons cette qualité d’ajustement à l’aide de deux mesures distinctes et complémentaires13 : i) La moyenne des erreurs absolues en pourcentage : ii) La médiane des erreurs absolues en pourcentage : | | ; ∑ | | , …, | | . Dans les formules ci-dessus, yt est le nombre de passagers embarqués/débarqués au mois t, n désigne le dernier mois de prévision, est l’erreur de prévision (l’écart entre la valeur prédite et observée), et le signe |.| correspond à l’opérateur de la valeur absolue. Ces deux mesures ont l’avantage d’être faciles à interpréter puisque toutes les deux expriment l’erreur de prévision en pourcentage par rapport aux valeurs observées. L’indicateur médian ii) est généralement utilisé pour vérifier la robustesse des résultats obtenus avec l’indicateur moyen i). Une MAPE/MedAPE inférieure à 10% indique une bonne performance prévisionnelle. 2.6 Méthodes de combinaison Nous pourrions nous contenter d’utiliser le meilleur modèle identifié selon la procédure décrite dans la sous-section 2.5 pour chaque segment de marché et pour le total des passagers. Comme indiqué précédemment, combiner les prévisions des différents modèles aboutit en général à une meilleure prévision. Ce rapport explore deux techniques de combinaison de prévisions qui ont été grandement appliquées dans la littérature14: i) la méthode de la moyenne simple et ii) la méthode de moyenne pondérée dite de « variance-covariance ». La formule générale de la moyenne (pondérée) des prévisions de J modèles pour le mois t peut s’écrire : ∑ ⋯ avec ∑ =1 13 Nous conservons ici les acronymes anglais des deux indicateurs : MAPE = Mean Absolute Percentage Error, MedAPE = Median Absolute Percentage Error. 14 Voir Bates et Granger (1969); Chu (1998); Coshall et Charlesworth (2011); Andrawis et al, (2011) ou encore Graefe et al. (2014). 13 où est la moyenne pondérée des J prédictions, représente le volume prédit de passagers embarqués/débarqués le mois t par le jème modèle et représente le poids accordé à L’élément clé dans cette formule est la détermination des poids . . Deux méthodes sont retenues dans ce rapport pour déterminer ces poids: la méthode de la moyenne simple et celle de la moyenne pondérée. La méthode de la moyenne simple, suggérée notamment par Bates et Granger (1969), est la plus facile à utiliser. Elle consiste à donner le même poids aux prévisions de chacun des modèles et ce, quel que soit le mois prédit et la performance prédictive passée de ces modèles. Par conséquent, ce poids ne varie ni entre modèles, ni dans le temps. Ce poids est simplement donné par . La méthode de la moyenne pondérée retenue dans ce rapport est appelée « méthode de variance-covariance ». Elle fait partie des premières méthodes proposées dans la littérature pour combiner de manière optimale les prévisions issues de différents modèles. Son avantage est que les poids sont fonction de la performance passée des modèles individuels. Supposons que nous voulions combiner les prévisions issues de deux modèles différents (J = 2) avec des poids qui somment à 1. La moyenne pondérée des prévisions issues des deux modèles serait alors donnée par : = 1 ) avec 0< La méthode de variance-covariance attribue des poids de prévision <1 qui minimisent la variance de l’erreur sous les hypothèses que les poids ne sont pas aléatoires et que les prévisions obtenues des différents modèles individuels ne sont pas biaisées. Dans la pratique15, la formule simplifiée suivante est la plus utilisée16: ∑ ∑ ∑ 15 Voir par exemple Granger et Bates (1969), Coshall et Charlesworth (2009), Wong et al. (2007) ou encore Andrawis et al. (2011). 16 On peut se référer à Diebold et Pauly (1987) ou encore à Coshall et Charlesworth (2009) pour une version plus générale de cette formule (notamment le cas où J > 2). 14 où représente l’erreur de prévision du modèle j au temps τ (une période antérieur à t). L’intuition de cette formule est que plus l’erreur de prévision passée du modèle 1 est faible, plus le poids attribué aux prévisions du modèle 1 augmente. Notons que cette formule ignore la corrélation entre les prévisions des différents modèles individuels. Dans ce rapport, nous calculons de deux manières différentes : sur une fenêtre temporelle fixe et des mois antérieurs au mois t ou sur une fenêtre temporelle mobile17 qui se déplacera en fonction du mois t que l’on cherche à prédire. La méthode de la fenêtre fixe permet de différencier les poids en fonction de la performance prévisionnelle passée des modèles individuels, en se référant à un passé fixe (poids invariants dans le temps). Dans ce rapport, nous déterminons ces poids comme suit : 1) on estime les modèles individuels pour chaque segment de marché sur la période de janvier 2000 à décembre 2011; 2) on prédit le trafic de passagers sur 36 mois, de janvier 2012 à décembre 2014; 3) on construit les poids optimaux selon la formule simplifiée de Granger et Bates (1969) à l’aide des erreurs de prévision observées entre janvier 2012 et décembre 2013 (fenêtre de 24 mois). Une fois ces poids déterminés, nous comparons la performance prévisionnelle des modèles individuels, de la moyenne simple et de la moyenne pondérée sur les prévisions réalisées de janvier 2014 à décembre 2014 par les modèles estimés sur la période allant de janvier 2000 à décembre 2011. Par rapport à l’approche précédente, la méthode de la fenêtre mobile permet une actualisation dans le temps des poids de la moyenne pondérée (poids variables dans le temps). Cette approche modifie le point 3) ci-dessus de la manière suivante : on construit les poids optimaux selon la formule simplifiée de Granger et Bates (1969) à l’aide des erreurs de prévision observées entre le 24ème mois précédant le mois t de prévision et le mois précédant le mois t de prévision. 17 Cette partie s’inspire essentiellement de Wong et al. (2007). 15 Finalement, il est important de noter que les poids des méthodes de variance-covariance obtenus sur la base des prévisions hors échantillons de janvier 2012 à décembre 2014 sont utilisés à deux fins : comparer les prévisions obtenues par moyenne pondérée avec celles obtenues selon les autres méthodes (modèles individuels ou moyenne simple) sur la période de janvier 2014 à décembre 2014 et effectuer les prévisions de janvier 2015 à décembre 2017 lorsque la moyenne pondérée délivre des prévisions plus précises que celles obtenues avec les autres méthodes. 3. Données Nos données sont les séries mensuelles de passagers aériens embarqués/débarqués que Transports Canada estime pour les secteurs domestique, transfrontalier et international. Ces séries couvrent la période allant de janvier 2000 à décembre 2014. Le secteur domestique regroupe l’ensemble du trafic entre deux aéroports localisés au Canada; le secteur transfrontalier inclut le trafic entre un aéroport aux États-Unis et un aéroport au Canada et le secteur international considère les vols d’un pays étranger autre que les États-Unis et un aéroport au Canada. La Tableau 1 récapitule le volume de passagers annuels observés à YQB sur les différents segments de marché durant la période d’étude. On constate que près de 15 millions de passagers ont transité par l’aéroport de Québec entre 2000 et 2014, dont près de 9,5 millions proviennent du segment domestique, 3,3 millions concernent les vols internationaux et 2,1 millions sont liés à des vols transfrontaliers. Comme le montre le Tableau 2, les segments transfrontalier et international gagnent en importance à travers le temps, ce qui dénote une internationalisation progressive du trafic de passagers de YQB. Le Tableau 3 présente à l’accroissement et le taux de croissance annuel des passagers embarqués/débarqués à YQB de 2001 à 2014. Notons d’abord que le nombre total de passagers n’a cessé de croître depuis 2003, ce qui confirme l’expansion du trafic aérien de passagers à YQB depuis cette date. Les segments transfrontalier et international ont également connu des taux de croissance annuels à deux chiffres pendant de nombreuses années, même si cette dynamique s’est récemment essoufflée dans le secteur international. 16 Tableau 1: Volume annuel de passagers à YQB par segments de marché Années Total Domestique Transfrontalier International 2000 729 076 567 522 0 161 554 2001 698 546 547 740 0 150 806 2002 667 116 540146 15 550 111 420 2003 669 278 508 775 11 960 148 543 2004 742 076 580 348 81 176 80 552 2005 817 616 582 530 120 266 114 820 2006 826 690 563 084 135 126 128 480 2007 927 384 605 838 158 408 163 138 2008 1 030 002 649 873 157 442 222 687 2009 1 035 027 577 914 170 174 286 939 2010 1 190 091 677 546 211 112 301 433 2011 1 313 432 710 819 235 470 367 143 2012 1 342 840 733 446 260 531 348 863 2013 1 403 463 747 509 288 369 367 585 2014 1 510 047 862 823 274 050 373 174 TOTAL 14 902 684 9 455 913 2 119 634 3 327 137 Source : Transports Canada. Tableau 2: Évolution des parts des segments de marché domestique, transfrontalier et international (en %) Segment de marché 2000 2007 2014 Domestique 77,8 65,3 57,1 Transfrontalier 0,0 17,1 18,1 International 22,2 17,6 24,7 Sources : Transports Canada et calcul des auteurs. 17 Tableau 3: Accroissement et taux de croissance annuel du volume de passagers par segments de marché Années Total Domestique Transfrontalier International 2001 -30 530 (-4,2) -19 782 (-3,5) - -10 748 2002 -31 430 (-4,5) -7 594 (-1,4) - -39 386 (-26,1) 2003 +2 162 (+0,3) -31 371 (-5,8) - +37 123 (+33,3) 2004 +72 798 (+10,9) 2005 +75 540 (+10,2) 2006 +71 573 (+14,1) (-6,7) -3 590 (-23,1) -67 991 (-45,8) +2 182 (+0,4) +39 090 (+48,2) +34 268 (+42,5) +9 074 (+1,1) -19 446 (-3,3) +14 860 (+12,4) +13 660 (+11,9) 2007 +100 694 (+12,2) +42 754 (+7,6) +23 282 (+17,2) +34 658 (+27,0) 2008 +102 618 (+11,1) +44 035 (+7,3) 2009 +5 025 (+0,5) 2010 +155 064 (+15,0) +99 632 (+17,2) +40 938 (+24,1) +14 494 2011 +123 341 (+10,4) +33 273 (+4,9) +24 358 (+11,5) +65 710 (+21,8) 2012 +29 408 (+2,2) +22 627 (+3,2) +25 061 (+10,6) -18 280 (-5,0) 2013 +60 623 (+4,5) +14 063 (+1,9) +27 838 (+10,7) +18 722 (+5,4) 2014 +106 584 (+7,6) +5 589 (+1,5) -966 (-0,6) +59 549 (+36,5) -71 959 (-11,1) +12 732 (+8,1) +64 252 (+28,9) +115 314 (+15,4) -14 319 (-5,0) (+5,1) Sources : Transports Canada et calcul des auteurs. Les chiffres entre parenthèses sont des taux de croissance en pourcentage. La Figure 1 montre le volume mensuel total de passagers aériens embarqués/débarqués à YQB, ainsi que celui des trois segments de marché. Les graphiques de gauche représentent les séries en niveau alors que ceux de droite sont leur contrepartie après transformation logarithmique et différenciation à l’ordre 1. Les séries en niveau des différents segments de marché partagent certaines caractéristiques: i) une tendance positive (non stationnarité de la moyenne), ii) une volatilité croissante (non stationnarité de la variance), et iii) une importante saisonnalité (particulièrement prononcée dans le secteur international). Notez que les mois de janvier et de février constituent la saison creuse du trafic domestique de passagers à YQB alors que ce sont les mois phares du segment international18. Les graphiques de droite montrent que, une fois transfor- 18 Ce constat est peut être plus apparent sur les Figures 3 et 5. 18 Figure 1: Séries mensuelles de passagers par segments de marché 19 mées, les séries semblent bien centrées autour d’une valeur (zéro en l’occurrence) et la variabilité est moins forte dans le temps, à quelques exceptions près19. 4. Résultats Les résultats présentés dans cette section se subdivisent en deux parties: ceux relatifs aux simulations et à l’évaluation hors échantillon des différentes approches prévisionnelles et ceux qui concernent les projections réalisées de janvier 2015 à décembre 2017 avec les modèles les plus appropriés identifiés dans les simulations. 4.1 Simulations sur la période 2012 - 2014 Les simulations conduites dans cette section ont pour objectif de déterminer la précision prévisionnelle des différentes approches décrites dans la section 2 sur chaque segment de marché. Différents modèles sont estimés avec les données observées de janvier 2000 à décembre 2011 et des prévisions-tests sont réalisées sur un horizon de 36 mois (janvier 2012 à décembre 2014). Les détails de l’estimation sont disponibles dans l’annexe. A) Modèles individuels Nous commençons par comparer la performance prévisionnelle des modèles individuels sur la période de janvier 2012 à décembre 2014. La qualité des projections est présentée dans les Tableaux 4 et 5 pour les deux indicateurs d’erreur prévisionnelle absolue en pourcentage (MAPE et MedAPE). Nous observons que les modèles individuels atteignent tous des MAPE et des MedAPE inférieures à 10% pour la série agrégée (colonne « Total » des deux tableaux) et sur le segment domestique. Le secteur transfrontalier se révèle plus difficile à prévoir, avec des erreurs situées entre 13,9% (meilleur modèle) et 21,2% (pire modèle), ce qui est peu satisfaisant. Concernant le segment de marché international, les modèles de régression linéaire/harmonique et 19 Cette remarque concerne essentiellement les mois de novembre de 2002 à 2006 de la série du segment international. Les valeurs « 0 » (absence de passagers) ont été remplacées par un « 1 » pour l’application du logarithme, d’où les pics abrupts observables à ces dates. 20 SARIMA sont inutilisables (trop imprécis), mais les deux modèles restants (Naïf saisonnier et SARIMA) affichent une performance prévisionnelle comprise entre 10,4% et 19,6%. Un des modèles individuels donne donc ici des prévisions raisonnablement bonnes. On notera qu’il est plus judicieux de prévoir le trafic de passagers agrégé avec son propre modèle, plutôt que de sommer les prévisions réalisées sur chaque segment de marché. En effet, la somme des prévisions de chaque segment de marché (colonne « D + Tr + I ») de la plupart des modèles testés se révèle plus imprécise que la prévision issue des modèles estimés spécifiquement avec la série agrégée (colonne Total), et ceci quel que soit l’indicateur de performance prévisionnel. Tableau 4: Performance prévisionnelle des modèles individuels de janvier 2012 à décembre 2014. Indicateur MAPE (en %) Modèles NS Total Domestique [2] 7,7 [3] 8,7 [2] 15,1 [1] 10,4 [2] 7,7 RL/RH [4] 9,4 [RH] [1] 6,2 [RL] [1] 14,3 [RL] - [4] 19,9 [4] 9,3 [HWM] [3] 17,5 [HWM] [2] 19,6 [HWA] [1] 5,6 [2] 8,3 [4] 21,2 - [3] 15,9 HWA/HWM [1] 4,0 [HWA] SARIMA [3] 7,8 Segments de marché Transfrontalier International D+Tr+I Remarques : [ ] le chiffre entre crochets dénote le rang du modèle, 1 désignant le modèle avec la meilleure qualité prévisionnelle. Le signe « - » identifie les modèles dont la performance prévisionnelle est jugée largement insuffisante (erreur moyenne > 50%). NS signifie modèle naïf saisonnier, RH/RL désigne régression harmonique/linéaire. HWA/HWM est le modèle HoltWinters additif/multiplicatif et SARIMA est le modèle ARIMA saisonnier. Tableau 5: Performance prévisionnelle des modèles individuels de janvier 2012 à décembre 2014. Indicateur MedAPE (en %) Modèles Total NS Domestique Segments de marché Transfrontalier International D+Tr+I [3] 6,8 [2] 5,8 [1] 13,9 [1] 11,2 [2] 6,8 RL/RH [4] 8,6 [RH] [1] 5,1 [RL] [2] 14,2 [RL] - [3] 14,7 HWA/HWM [1] 3,8 [HWA] [4] 7,5 [HWM] [3] 15,4 [HWA] [2] 14,3 [HWA] [1] 4,4 SARIMA [2] 6,2 [3] 6,7 [4] 19,5 - [4] 16,2 Remarques : [ ] le chiffre entre crochets dénote le rang du modèle, 1 désignant le modèle avec la meilleure qualité prévisionnelle. Le signe « - » identifie les modèles dont la performance prévisionnelle est jugée largement insuffisante (erreur moyenne > 50%). NS signifie modèle naïf saisonnier, RH/RL désigne régression harmonique/linéaire. HWA/HWM est le modèle HoltWinters additif/multiplicatif et SARIMA est le modèle ARIMA saisonnier. 21 Il ressort des Tableaux 4 et 5 que (i) les modèles Holt-Winters additifs sont les plus performants pour prédire le trafic total de passagers, (ii) la régression linéaire domine les autres modèles dans le segment domestique, (iii) les modèles naïf saisonnier et la régression linéaire sont les plus performants sur le secteur transfrontalier, dépendamment de l’indicateur de performance, (iv) l’approche naïve saisonnière est la plus précise sur le segment international, (v) il est préférable de prévoir le trafic total de passagers avec son propre modèle, en non pas en sommant les prévisions réalisées pour chaque segment de marché. Le meilleur modèle de prévision est le même quelle que soit la mesure de performance prédictive utilisée (MAPE ou MedAPE) à une exception près. Notons également que, quelle que soit la série analysée, le modèle SARIMA n’est jamais identifié comme le meilleur modèle. B) Combinaison des prévisions Ayant analysé la performance prédictive mensuelle de chacun des modèles individuels sur un horizon de 3 ans (janvier 2012 à décembre 2014), les Tableaux 6 et 7 se concentrent sur la combinaison de prévisions issues de ces modèles pour les mois de l’année 201420. On constate dans ces tableaux que la qualité des prévisions des modèles individuels sur la période de janvier 2014 à décembre 2014 est inférieure à celle reportée dans les Tableaux 4 et 5. Ceci est attendu puisque les performances prédictives figurant dans les Tableaux 6 et 7 concernent des prédictions effectuées du 25ème au 36ème mois après la dernière valeur observée. Les performances prédictives figurant dans les Tableaux 4 et 5 se rapportent à la période de janvier 2012 à décembre 2014, soit du 1er au 36ème mois après la dernière valeur observée. La qualité des prévisions mensuelles à un horizon de 1 à 2 ans étant généralement meilleure, on ne s’étonne pas de la moins bonne performance prévisionnelle rapportée dans les Tableaux 6 et 7. Notons également que nous excluons systématiquement les prévisions du modèle individuel le moins performant de nos combinaisons de prévisions21. Par conséquent, les 20 Comme indiqué à la fin de la section 2.6, lorsque l’on analyse les combinaisons de prévisions, la période de janvier 2012 à décembre 2013 est utilisée pour calculer les poids associés à certaines méthodes combinaisons (méthodes de variance covariance). Par conséquent, la comparaison des performances prédictives se fait sur la période allant de janvier 2014 à décembre 2014. 21 L’inclusion des prévisions de tous les modèles individuels n’améliorait pas toujours la performance prévisionnelle et alourdissait inutilement la formule des poids optimaux de la méthode de variance-covariance. 22 combinaisons fournissent la prévision moyenne des trois meilleurs modèles individuels, notés avec les rangs [1], [2] et [3] dans les Tableaux 4 et 5. Plus précisément, nous avons retenu les modèles NS, HWA et SARIMA pour la série agrégée (Total), les modèles NS, RL et SARIMA pour le segment domestique, les modèles NS, RL, HWA pour le segment transfrontalier et les modèles NS et HWA pour le segment international. Les Tableaux 6 et 7 indiquent qu’il existe presque toujours une méthode de combinaison de prévisions qui permet d’améliorer la performance du meilleur modèle individuel. La principale exception concerne le segment de marché international, pour lequel le modèle individuel le plus simple (NS) s’avère être le plus fiable globalement22. Ensuite, on constate que la méthode de combinaison de prévisions de la moyenne simple (MS) est très performante quel que soit l’indicateur de performance pour les deux séries : totale et transfrontalière. Pour la série domestique, la méthode de combinaison VCm s’avère particulièrement performante mais le meilleur modèle individuel reste plus performant selon l’un des critères (MAPE). Pour le segment international, aucune des méthodes de combinaison de prévision ne permet d’améliorer le meilleur modèle individuel mais elles sont toutes supérieures au pire modèle individuel. Tableau 6: Performance prévisionnelle des modèles combinés de janvier 2014 à décembre 2014. Indicateur MAPE (en %) Modèles individuels NS Total Segments de marché Domestique Transfrontalier [7] 13,2 [7] 17,7 [5] 14,4 [1] 11,6 RL/RH [6] 9,3 [RH] [1] 6,0 [RL] [4] 12,7 [RL] - HWA/HWM [3] 4,1 [HWA] [6] 17,2 [HWM] [6] 27,9 [HWM] [5] 20,2 [HWA] SARIMA [5] 8,0 [5] 16,4 [7] 34,5 - Combinaisons MS [1] 3,4 [3] 12 [1] 5,7 [4] 14,9 VCf [2] 3,6 [4] 14,3 [2] 7,8 [3] 14,3 [4] 5,0 [2] 6,9 [3] 9,7 [2] 12,8 VCm International Remarques : [ ] le chiffre entre crochets dénote le rang du modèle, 1 désignant le modèle avec la meilleure qualité prévisionnelle. Le signe « - » identifie les modèles dont la performance prévisionnelle est jugée largement insuffisante (erreur moyenne > 50%). NS signifie modèle naïf saisonnier, RH/RL désigne régression harmonique/linéaire. HWA/HWM est le modèle Holt-Winters additif/multiplicatif et SARIMA est le modèle ARIMA saisonnier. MS est la moyenne simple et VCf et CVm sont les méthodes de variance-covariance avec des fenêtres, respectivement, fixe et mobile. 22 Clairement le modèle NS est ici préférable au modèle HWA car même si HWA est le meilleur modèle au sens de la MedAPE (10,9%, Tableau 7) , l’indicateur MAPE de ce modèle (20,2%, Tableau 6) n’est pas acceptable. Il est donc préférable de privilégier le modèle individuel NS. 23 Tableau 7: Performance prévisionnelle des modèles combinés de janvier 2014 à décembre 2014. Indicateur MedAPE (en %) Modèles individuels NS RL/RH HWA/HWM SARIMA Combinaisons MS VCf VCm Total Segments de marché Domestique Transfrontalier [7] 13,1 [6] 7,8 [RH] [4] 4,0 [HWA] [5] 7,1 [7] 18,3 [2] 5,8 [RL] [6] 17,7 [HWM] [4] 15,1 [5] 14,1 [4] 12,7 [RL] [6] 29,9 [HWA] [7] 32,7 [2] 2,5 [1] 2,0 [3] 3,6 [3] 12,9 [5] 15,1 [1] 4,9 [1] 3,7 [2] 6,1 [3] 10,3 International [5] 12,7 [1] 10,9 [HWA] [2] 11,6 [4] 12,0 [3] 11,6 Remarques : [ ] le chiffre entre crochets dénote le rang du modèle, 1 désignant le modèle avec la meilleure qualité prévisionnelle. Le signe « - » identifie les modèles dont la performance prévisionnelle est jugée largement insuffisante (erreur moyenne > 50%). NS signifie modèle naïf saisonnier, RH/RL désigne régression harmonique/linéaire. HWA/HWM est le modèle Holt-Winters additif/multiplicatif et SARIMA est le modèle ARIMA saisonnier. MS est la moyenne simple et VCf et CVm sont les méthodes de variance-covariance avec des fenêtres, respectivement, fixe et mobile. Une fois les méthodes de combinaison de prévision les plus performantes identifiées et les comparaisons effectuées avec les meilleurs modèles individuels, il convient de déterminer les modèles à utiliser pour effectuer les prévisions mensuelles sur la période de janvier 2015 à décembre 2017. Comme le meilleur modèle à retenir peut varier selon le critère de performance (MAPE ou MEdAPE), nous utiliserons les deux modèles les plus performants sur chaque segment de marché, tout critère de performance confondu. Par conséquent nous fournissons deux prévisions sur l’horizon 2015-2017 pour chacune des séries, l’une issue de la meilleure technique de prévision (modèle individuel ou combinaison de prévisions), et l’autre issue de la seconde meilleure technique de prévision23. Ceci permettra au décideur de disposer de deux prévisions relativement équivalentes d’un point de vue statistique. Il pourra ainsi privilégier la plus adéquate ex-post où de préférer celle jugée la plus crédible selon son propre jugement. 23 La note de bas de page 22 expliquait pourquoi le modèle NS était choisi comme le plus performant pour le segment international. On remarquera dans les Tableaux 6 et 7 que la combinaison VCm pour ce segment est très proche en termes de performance MAPE et MedAPE de celle du modèle NS. La combinaison VCm constituera donc le second meilleur modèle prévisionnelle dans ce cas. 24 4.2 Prévisions à l’horizon 2015 - 2017 Avant de nous intéresser au détail des prévisions mensuelles de trafic de passagers de YQB pour la période 2015-2017, analysons dans les Tableaux 8 et 9 les prévisions annuelles qui en découlent. Rappelons que le nombre total prédit de passagers du Tableau 8 ne correspond pas exactement à la somme des prévisions obtenues pour les trois segments de marché. En effet, toutes les séries sont prédites indépendamment l’une de l’autre et nous avons montré dans les Tableaux 4 et 5 qu’il est préférable de prévoir directement la série agrégée plutôt que d’agréger les prévisions des différents segments de marché. Ceci étant dit, le Tableau 10 fournit également le nombre total de passagers prévus lorsque l’on additionne les prévisions des différents segments. On remarque que les volumes annuels prédits pour l’année 2016 et 2017 dans la colonne « Total » du Tableau 8 sont inférieurs à ceux de la colonne « Total (D + Tr + I) » du Tableau 10. Ceci indique qu’une tendance positive moins prononcée est capturée lorsque l’on prédit les données mensuelles sous leur forme agrégée pour ces deux années plus qu’en sommant les prévisions des différents segments de marché. Nous nous concentrons sur les projections annuelles issues du meilleur modèle de prévision, notés par un [1] dans les lignes/colonnes correspondantes des Tableaux 8 à 10. On voit dans le Tableau 9 que l’accroissement prévu du nombre total de passagers embarqués/débarqués à YQB entre 2014 et 2017 est de +162 521 passagers, soit un accroissement de +10,8% sur cette période. Tableau 8: Nombre annuel de passagers prévus de 2015 à 2017 par segments de marché Total [1] VCf [2] MS Années 1 510 047 2014 1 564 752 1 565 167 2015 1 618 726 1 618 047 2016 1 672 568 1 670 860 2017 Segments de marché Domestique Transfrontalier [1] VCm [2] RL [1] MS [2] VCf International [1] NS [2]VCm 862 823 901 246 900 057 975 303 963 033 1 061 791 1 036 072 373 174 373 174 374 722 373 174 374 978 373 174 375 234 274 050 286 060 286 835 294 005 296 923 300 462 305 714 Remarques : [ ] le chiffre entre crochets à la ligne 2 dénote le rang du modèle, 1 désignant le modèle avec la meilleure qualité prévisionnelle. Les prévisions sont en italiques. 25 Tableau 9: Accroissement et taux de croissance (en %) annuels prévus du nombre de passagers de 2015 à 2017 Années Segments de marché Modèles Total [1] VCf [2] MS Domestique [1] VCm [2] RL Transfrontalier [1] MS [2] VCf International [1] NS [2]VCm 2015 2016 2017 2014-2017 +54 705 (+3,6) +53 974 (+3,4) +53 842 (+3,3) +55 120 (+3,7) +52 880 (+3,4) +52 813 (+3,3) +162 521 (+10,8) +160 813 (+10,6) +38 423 (+4,5) +74 057 (+8,2) +86 488 (+8,9) +37 234 (+4,3) +62 976 (+7,0) +73 039 (+7,6) +198 968 (+23,1) +173 249 (+20,1) +12 010 (+4,4) +7 945 (+2,8) +12 785 (+4,7) +10 088 (+3,5) +6 457 (+2,2) +8 791 (+3,0) +26 412 (+9,6) +31 664 (+11,6) +0 (+0) +0 (+0) +0 (-) +0 (-) +1 548 (+0,4) +256 (+0,1) +256 (+0,1) +2 060 (+0,6) Remarques : [ ] le chiffre entre crochets à la ligne 2 dénote le rang du modèle, 1 désignant le modèle avec la meilleure qualité prévisionnelle. Les prévisions sont en italiques. Les chiffres entre parenthèses sont des taux de croissance en pourcentage. Tableau 10: Nombre annuel de passagers prévus de 2015 à 2017 par addition des prévisions des différents segments de marchés Années 2015 2016 2017 2014-2017 Total (D + Tr + I) [1] [2] Accroissement et taux de croissance (en %) [1] [2] 1 560 480 1 642 482 1 735 427 1 561 614 1 634 934 1 717 020 +50 433 (+3,3) +82 002 (+5,3) +92 945 (+5,7) +51 567 (+3,4) +73 320 (+4,7) +82 086 (+5,0) - - +225 380 (+14,9) +206 973 (+13,7) Remarques : [ ] le chiffre entre crochets à la ligne 2 dénote le rang du modèle, 1 désignant le modèle avec la meilleure qualité prévisionnelle. Les prévisions sont en italiques. Le Total (D + Tr + I) se réfère à la somme des prévisions des segments Domestique, Transfrontalier et International du Tableau 8. Cette augmentation est inférieure à celle que l’on observe durant la période 2011-2014 antérieure (Tableau 3, +196 600 et +15,1%). Notons que l’accroissement prévu entre 2014 et 2017 lorsque l’on agrège les prévisions des différents segments de marché (Tableau 10) est plus fort, soit +225 380 passagers et un taux de croissance de +15%. La prédiction la plus conservatrice du total de passagers est cependant la plus plausible du point de vue statistique. 26 La dynamique des différents segments de marché reportée dans le Tableau 9 suggère que le marché domestique devrait conserver une croissance vigoureuse (+198 968, soit +23,1% de 2014 à 2017). Le segment transfrontalier devrait expérimenter une croissance plus modeste (+26 412 passagers, soit +9,6% sur cette même période) alors qu’on s’attend à une stagnation sur le marché international (+2 060 passagers, soit +0,2% avec le modèle de prévision le plus optimiste). Il est bien entendu que ces scénarios sont de type « business as usual » et que ces chiffres ne sont pertinents que dans ce contexte. Nous abordons maintenant les prévisions mensuelles sur la période de janvier 2015 à décembre 2017. L’objectif fondamental de la prévision des séries mensuelles est de répliquer et projeter de la manière la plus fiable possible les tendances et les cycles qui affectent le trafic de passagers de YQB. Les Figures 2 à 5 illustrent l’évolution mensuelle du volume de passagers prévu à l’horizon 2015-2017 pour l’ensemble des segments de marché et pour chacun d’entre eux (domestique, transfrontalier et international). Ces projections sont mises en perspective avec le trafic mensuel de passagers observé depuis 2010 pour évaluer visuellement la plausibilité des prédictions. Deux graphiques sont proposés pour chaque segment de marché : le graphique A correspond aux projections effectuées avec la meilleure technique prévisionnelle (A) alors que les projections du graphique (B) sont celles de la « seconde meilleure » technique prévisionnelle. On remarque dans ces figures la bonne capacité des différentes approches à capturer les cycles passés du trafic mensuel de passagers de YQB. Les différences entre les deux projections ne sont pas visuellement importantes. Le Tableau 11 de l’annexe fournit les volumes mensuels prédits de passagers pour chaque segment de marché. On notera dans ce tableau que la seconde meilleure technique prévisionnelle (colonnes [2]) donne en général des prédictions plus optimistes pour les segments transfrontalier et international et plus conservatrices pour le segment domestique. Les prévisions mensuelles pour la série agrégée (Total) sont relativement proches dans les colonnes [1] et [2]. La Figure 2 montre l’évolution du trafic total de passagers de YQB de 2010 à 2014 pour les mois de janvier à décembre et les projections obtenues pour la période 2015-2017 (en gras). On constate que les projections A et B sont très similaires, avec des pics plus prononcés durant la période hivernale de décembre à avril (mars étant pic le plus élevé). Le creux le plus accentué 27 correspond au mois de mai sur ce segment de marché. On remarque un pic mineur durant les mois estivaux de juillet et août. Figure 2: Prévisions mensuelles du nombre total de passagers avec les deux meilleures méthodes de prévision A. Meilleure méthode de prévision : VCf B. Seconde meilleure méthode de prévision : MS La Figure 3 se concentre sur le secteur domestique. Cette série se caractérise par une activité croissante à partir de mai, le pic d’octobre et le creux particulièrement marqué en décembre. La prévision A suggère une légère accentuation de la saisonnalité ces prochaines années avec une différence plus grande entre les creux et les pics. Le graphique B capture ce même phénomène. 28 Figure 3: Prévisions mensuelles du nombre de passagers dans le secteur domestique avec les deux meilleures méthodes de prévision A. Meilleure méthode de prévision : VCm B. Seconde meilleure méthode de prévision : RL La Figure 4 illustre l’évolution passablement erratique du segment transfrontalier. Commençons par noter que l’axe des ordonnées (Y) s’étend de 10 000 à 30 000 passagers. L’ampleur des variations n’est donc pas visuellement comparable avec les autres segments de marché et elle est en moyenne inférieure à celle des segments total et domestique. Néanmoins, à des fins prévisionnelles, ce schéma temporel est typiquement plus difficile à extrapoler. Les creux se situent en mai et novembre et les pics se produisent en mars et durant l’été (juillet à octobre). À nouveau, nous ne distinguons pas de différences visuelles spectaculaires entre les graphiques A et B. 29 Figure 4: Prévisions mensuelles du nombre de passagers dans le secteur transfrontalier avec les deux meilleures méthodes de prévision A. Meilleure méthode de prévision : MS B. Seconde meilleure méthode de prévision : VCf Finalement, la Figure 5 donne des prévisions mensuelles pour le secteur international. On constate que malgré les fortes variations entre les différents mois, il se dégage une cyclicité claire. Les mois de janvier et de mars sont les mois phares (avec des niveaux d’activité proches du niveau du segment domestique durant cette période) et l’activité minimale est enregistrée en septembre et octobre. Les méthodes A et B donnent des résultats sensiblement similaires. 30 Figure 5: Prévisions mensuelles du nombre de passagers dans le secteur international avec les deux meilleures méthodes de prévision A. Meilleure méthode de prévision : NS B. Seconde meilleure méthode de prévision : VCm 31 5. Conclusions Dans ce rapport, nous utilisons quatre modèles simples de prévision pour prédire le trafic de passagers de l’Aéroport International Jean-Lesage de Québec à l’horizon 2015 -2017. Dans un premier temps, nous explorons la performance prédictive de ces modèles sur une période antérieure pour les trois grands segments de marché (domestique, transfrontalier et international) et le niveau total de passagers embarqués/débarqués. Nous montrons que chaque segment de marché possède son propre meilleur modèle prévisionnel, et donc qu’il n’est en général pas recommandé d’utiliser un seul modèle individuel pour prédire le trafic de passagers des différents segments de marché de YQB. Nous combinons ensuite, pour chaque segment de marché, les prévisions des meilleurs modèles individuels selon trois schémas de pondération des prévisions (la moyenne arithmétique simple et deux méthodes de variance-covariance) et nous calculons leur performance prévisionnelle. Nous montrons que, pour la plupart des séries analysées et quel que soit le critère de performance prédictive utilisé, les méthodes de combinaison permette d’améliorer les prévisions. Aucune méthode de combinaison ne domine systématiquement les autres dans ce contexte. Les méthodes de combinaison semblent atteindre leur objectif d’améliorer la performance prévisionnelle lorsqu’elles sont appliquées aux séries mensuelles de trafic aérien de passagers de YQB. Ceci est d’un grand intérêt pour la planification à court et moyen terme. En effet, les prévisions offertes dans ce rapport devraient être suffisamment fiables pour servir de points de référence pour atteindre des objectifs de court ou moyen terme (1 à 3 ans) et aider à la décision. Un développement intéressant des méthodes appliquées dans ce rapport serait d’inclure, parmi les modèles de prévision, des modèles avec des variables explicatives qui prennent en compte explicitement l’évolution de la conjoncture pour capturer la demande, ainsi que l’offre de vols ou la capacité d’accueil de l’infrastructure aéroportuaire. Ces modèles additionnels pourraient être comparés aux modèles étudiés et ils pourraient être combinés entre eux pour améliorer la performance prévisionnelle et établir des scénarios plus variés de développement pour YQB. 32 6. Annexes 33 Tableau 11: Prévisions mensuelles pour la période 2015-2017 avec les deux meilleures méthodes de prévision. Période janv-15 févr-15 mars-15 avr-15 mai-15 juin-15 juil-15 août-15 sept-15 oct-15 nov-15 déc-15 Total 2015 janv-16 févr-16 mars-16 avr-16 mai-16 juin-16 juil-16 août-16 sept-16 oct-16 nov-16 déc-16 Total 2016 janv-17 févr-17 mars-17 avr-17 mai-17 juin-17 juil-17 août-17 sept-17 oct-17 nov-17 déc-17 Total 2017 Total Domestique Transfrontalier International D+T+I [1] VCf [2] MS [1] VCm [2] RL [1] MS [2] VCf [1] NS [2]VCm [1] [2] 150 725 146 891 167 288 141 548 104 992 112 281 129 579 130 465 119 723 119 565 110 360 131 335 151 384 146 866 167 812 142 044 104 771 111 994 129 738 130 548 119 248 119 112 110 408 131 242 65 559 68 243 69 227 66 848 80 248 83 392 76 764 80 844 84 825 90 771 71 256 63 269 66 536 67 608 69 218 66 632 79 798 80 672 79 611 81 353 83 305 90 744 71 189 63 391 22 574 23 363 25 786 20 815 17 132 22 546 27 774 28 535 26 695 27 159 20 211 23 470 22 574 23 473 25 815 20 872 17 237 22 535 27 810 28 383 26 792 27 445 20 248 23 651 58 798 54 230 68 150 53 657 12 762 12 336 17 071 16 971 10 910 6 587 22 538 39 164 58 538 54 651 69 737 53 658 12 828 12 387 17 084 17 003 10 828 6 581 22 230 39 197 146 931 145 836 163 163 141 320 110 142 118 274 121 609 126 350 122 430 124 517 114 005 125 903 147 648 145 732 164 770 141 162 109 863 115 594 124 505 126 739 120 925 124 770 113 667 126 239 1 564 752 155 616 151 411 171 815 146 053 109 367 116 699 134 057 134 944 124 172 124 015 114 755 135 822 1 565 167 155 989 151 284 172 233 146 454 109 116 116 361 134 134 134 945 123 631 123 494 114 763 135 643 901 246 70 747 73 680 74 779 72 246 86 772 90 216 83 087 87 547 91 904 98 394 77 279 68 652 900 057 70 769 71 927 74 709 71 655 86 064 85 889 83 462 85 694 88 839 98 345 77 165 68 515 286 060 23 266 24 079 26 545 21 422 17 630 23 173 28 534 29 283 27 404 27 883 20 722 24 064 286 835 23 431 24 362 26 768 21 635 17 863 23 327 28 778 29 339 27 702 28 379 20 911 24 428 373 174 58 798 54 230 68 150 53 657 12 762 12 336 17 071 16 971 10 910 6 587 22 538 39 164 374 722 58 563 54 694 69 787 53 658 12 840 12 392 17 087 17 022 10 854 6 582 22 270 39 229 1 560 480 152 811 151 989 169 474 147 325 117 164 125 725 128 692 133 801 130 218 132 864 120 539 131 880 1 561 614 152 763 150 983 171 264 146 948 116 767 121 608 129 327 132 055 127 395 133 306 120 346 132 172 1 618 726 160 143 155 938 176 336 150 571 113 781 121 149 138 555 139 442 128 648 128 491 119 186 140 328 1 618 047 160 411 155 705 176 651 150 871 113 480 120 743 138 541 139 352 128 026 127 890 119 136 140 054 975 303 76 804 80 029 81 263 78 549 94 389 98 184 90 471 95 375 100 171 107 300 84 316 74 940 963 033 76 077 77 139 81 116 77 446 93 362 92 004 87 566 90 395 95 179 107 222 84 141 74 425 294 005 23 840 24 669 27 177 21 922 18 035 23 682 29 153 29 886 27 973 28 459 21 126 24 540 296 923 24 184 25 142 27 610 22 305 18 408 24 016 29 625 30 168 28 490 29 183 21 480 25 103 373 174 58 798 54 230 68 150 53 657 12 762 12 336 17 071 16 971 10 910 6 587 22 538 39 164 374 978 58 587 54 738 69 837 53 658 12 852 12 397 17 089 17 040 10 880 6 584 22 310 39 262 1 642 482 159 442 158 928 176 590 154 128 125 186 134 202 136 695 142 232 139 054 142 346 127 980 138 644 1 634 934 158 848 157 019 178 563 153 409 124 622 128 417 134 280 137 603 134 549 142 989 127 931 138 790 1 672 568 1 670 860 1 061 791 1 036 072 300 462 305 714 373 174 375 234 1 735 427 1 717 020 34 Tableau 12: Modèles de régression linéaire Segments de marché Total Variables (Intercept) Année Année^2 Année^3 Année^4 Février Mars Avril Mai Juin Juillet Août Septembre Octobre Novembre Décembre D11/09 DSARS Dcrise08 R2 adj AIC Log.V MAPE (%) MedAPE(%) Domestique Transfrontalier Linéaire Sélection AIC Linéaire Sélection AIC Linéaire 20,8E+3 *** 20,8E+3 *** 12,2E+3 *** 12,2E+3 *** -46,7E+3 ** (3,3E+3) (3,3E+3) (2,4E+3) (2,3E+3) (15,0E+3) Sélection AIC -46,7E+3 ** (15,0E+3) -20,74 *** (3,25) -20,74 *** (3,23) -12,14 *** (2,39) -12,17 *** (2,37) 46,36 ** (14,89) 0,01 *** (0) 0,01 *** (0) 0 *** (0) 0 *** (0) -0,01 ** (0) 46,36 ** (14,89) -0,01 ** (0) 0,02 (0,04) 0,05 (0,04) -0,14 ** (0,04) -0,19 *** (0,04) -0,13 ** (0,04) -0,17 *** (0,04) -0,12 ** (0,04) -0,12 ** (0,04) -0,1 * (0,04) -0,33 *** (0,04) -0,25 *** (0,04) -0,21 , (0,11) -0,1 ** (0,04) 0 (0,05) 0,84 -226,62 131,31 0,02 (0,04) 0,05 (0,04) -0,14 ** (0,04) -0,19 *** (0,04) -0,13 ** (0,04) -0,17 *** (0,04) -0,12 ** (0,04) -0,12 ** (0,04) -0,1 * (0,04) -0,33 *** (0,04) -0,25 *** (0,04) -0,21 , (0,11) -0,1 ** (0,04) 0,84 -228,62 131,31 22,28 21,33 0,05 (0,03) 0,05 (0,03) 0,02 (0,03) 0,2 *** (0,03) 0,23 *** (0,03) 0,1 ** (0,03) 0,16 *** (0,03) 0,22 *** (0,03) 0,29 *** (0,03) 0,05 (0,03) -0,11 *** (0,03) -0,31 *** (0,08) -0,11 *** (0,03) -0,01 (0,04) 0,78 -315,72 175,86 0,05 (0,03) 0,05 (0,03) 0,02 (0,03) 0,2 *** (0,03) 0,23 *** (0,03) 0,1 ** (0,03) 0,16 *** (0,03) 0,22 *** (0,03) 0,29 *** (0,03) 0,05 (0,03) -0,11 *** (0,03) -0,3 *** (0,08) -0,11 *** (0,03) 0,78 -317,68 175,84 6,20 5,11 0,07 (0,08) 0,06 (0,08) -0,11 (0,08) -0,21 * (0,08) 0,03 (0,08) 0,17 * (0,08) 0,22 ** (0,08) 0,18 * (0,09) 0,25 ** (0,09) -0,06 (0,09) -0,02 (0,09) -0,13 (0,09) 0,80 -52,92 42,46 0,07 (0,08) 0,06 (0,08) -0,11 (0,08) -0,21 * (0,08) 0,03 (0,08) 0,17 * (0,08) 0,22 ** (0,08) 0,18 * (0,09) 0,25 ** (0,09) -0,06 (0,09) -0,02 (0,09) -0,13 (0,09) 0,80 -52,92 42,46 14,35 14,22 International Linéaire 19,5E+3 *** (41,6E+3) -194,53 *** (41,51) 0,05 *** (0,01) -0,06 (0,54) 0,05 (0,54) -0,47 (0,54) -1,53 ** (0,54) -1,43 ** (0,54) -1,02 , (0,54) -1,06 , (0,54) -1,45 * (0,56) -2,22 *** (0,54) -5,07 *** (0,54) -0,74 (0,54) 0,44 (1,39) -0,13 (0,47) 1,14 (0,7) 0,52 506,67 -235,33 Sélection AIC 19,5E+3 *** (41,6E+3) -196,42 *** (40,94) 0,05 *** (0,01) -0,06 (0,54) 0,05 (0,54) -0,47 (0,54) -1,53 ** (0,54) -1,43 ** (0,54) -1,02 , (0,54) -1,05 , (0,54) -1,41 * (0,54) -2,21 *** -5,07 *** -0,74 (0,54) 1,14 (0,69) 0,53 506,67 -235,33 2541,35 1750,41 Remarques : ***, **, * indiquent le rejet aux seuils de, respectivement, 1%, 5% et 10% de l’hypothèse de nullité du coefficient de régression. L’écart-type des coefficients est entre parenthèses. AIC se réfère au critère d’information d’Akaike et Log.V est la log-vraisemblance du modèle. Les MAPE et MedAPE sont calculées sur les prévisions hors-échantillon de janvier 2012 à décembre 2014. 35 Tableau 13: Modèles de régression harmonique Segments de marché Domestique Transfrontalier International Variables Linéaire Linéaire Sélection AIC Linéaire Sélection AIC Linéaire Sélection AIC (Intercept) 10,78 *** 11,13 *** (0,02) 11,12 *** (0,01) 10,78 *** (0,01) (0,008) 9,43 *** (0,03) 9,43 *** (0,03) 8,23 *** (0,21) 8,24 *** (0,2) Année 0,26 *** (0,02) 0,26 *** (0,02) 0,06 ** (0,02) 0,07 *** (0,006) 0,11 ** (0,04) 0,11 ** (0,03) 0,67 * (0,31) 0,76 ** (0,27) Année^2 0,03 (0,03) 0,06 *** (0,01) -0,01 (0,03) 0,11 , (0,06) 0,11 , (0,05) 1,26 ** (0,44) 1,31 ** (0,43) Année^3 -0,03 * (0,01) -0,03 * (0,01) 0 (0,01) 0,11 *** (0,02) 0,11 *** (0,02) -0,16 (0,15) -0,2 (0,14) Année^4 0,01 (0,01) 0,02 , (0,01) 0,01 *** (0,003) -0,07 ** (0,02) -0,06 ** (0,02) -0,27 (0,17) -0,29 , (0,16) SIN(2*π*année) 0,05 *** (0,01) 0,06 *** (0,01) -0,03 ** (0,01) -0,03 ** (0,009) -0,08 *** (0,02) -0,08 *** (0,02) 1,01 *** (0,16) 0,97 *** (0,15) COS(2*π* année) 0,03 * (0,01) 0,03 ** (0,01) -0,11 *** (0,01) -0,11 *** (0,009) -0,05 * (0,02) -0,05 * (0,02) 0,25 (0,15) 0,25 , (0,15) SIN(4* π* année) 0,11 *** (0,01) 0,1 *** (0,01) 0,02 , (0,01) 0,02 , (0,009) 0,13 *** (0,02) 0,13 *** (0,02) 0,85 *** (0,16) 0,85 *** (0,16) COS(4* π* année) 0,02 (0,01) 0,02 , (0,01) -0,05 *** (0,01) -0,05 *** (0,009) 0,04 , (0,02) 0,04 , (0,02) 0,69 *** (0,16) 0,67 *** (0,15) SIN(6* π* année) 0,05 *** (0,01) 0,05 *** (0,01) 0,08 *** (0,01) 0,08 *** (0,009) 0,04 * (0,02) 0,04 * (0,02) -0,26 , (0,15) -0,26 , (0,15) COS(6* π* année) 0,02 , (0,01) 0,02 , (0,01) 0,04 *** (0,01) 0,04 *** (0,009) -0,03 (0,02) -0,03 (0,02) 0,5 ** (0,16) 0,51 ** (0,15) SIN(8* π* année) -0,03 * (0,01) -0,03 * (0,01) 0,01 (0,01) -0,03 (0,02) -0,03 (0,02) -0,61 *** (0,16) -0,63 *** (0,15) COS(8* π* année) 0,02 , (0,01) 0,02 , (0,01) 0 (0,01) 0,04 , (0,02) 0,04 , (0,02) 0,32 * (0,15) 0,31 * (0,15) SIN(10* π* année) -0,03 * (0,01) -0,03 * (0,01) -0,02 ** (0,01) -0,02 ** (0,009) -0,03 (0,02) -0,03 (0,02) -0,42 ** (0,16) -0,41 ** (0,15) COS(10* π* année) 0,03 * (0,01) 0,03 * (0,01) 0,02 * (0,01) 0,02 * (0,009) 0,01 (0,02) -0,25 (0,15) -0,27 , (0,15) SIN(12* π* année) -1,69E+09 -8,66E+08 -4,02E+09 2,90E+09 3,11E+10 3,27E+10 (1,74E+09) (1,30E+09) (2,95E+09) (2,90E+09) (2,25E+10) (2,21E+10) COS(12* π* année) -0,01 (0,01) 0 (0,01) -0,03 * (0,01) -0,03 * (0,01) -0,19 (0,12) -0,19 (0,12) D11/09 -0,2 , (0,11) -0,2 , (0,11) -0,3 *** (0,08) -0,3 *** (0,077) 0,4 (1,39) DSARS -0,06 (0,04) -0,07 , (0,04) -0,11 *** (0,03) -0,1 *** (0,027) -0,08 (0,51) Dcrise08 -0,02 (0,06) 0,01 (0,04) 0,02 (0,08) 0,71 (0,72) R2 -adj 0,84 0,85 0,78 0,79 0,87 0,87 0,53 0,54 AIC -230,35 -235,39 -314,09 -325,76 -96,43 -96,43 506,03 501,27 Log.V 136,18 134,69 178,05 176,88 65,21 65,21 -232,02 -232,63 MAPE (%) 9,36 22,77 32,98 87,00 MedAPE (%) 8,65 19,61 27,66 95,92 Remarques : ***, **, * indiquent le rejet aux seuils de, respectivement, 1%, 5% et 10% de l’hypothèse de nullité du coefficient de régression. L’écart-type des coefficients est entre parenthèses. AIC se réfère au critère d’information d’Akaike et Log.V est la log-vraisemblance du modèle. Les MAPE et MedAPE sont calculées sur les prévisions horséchantillon de janvier 2012 à décembre 2014. Total Sélection AIC 36 Tableau 14: Modèles de lissage exponentiel Holt-Winters Total Variables Additif Multiplicatif a 105353,52 106037,76 b 490,41 559,70 s1 31169,16 1,32 s2 28528,89 1,30 s3 36797,54 1,39 s4 7905,70 1,10 s5 -17516,97 0,85 s6 -8679,54 0,93 s7 262,50 1,01 s8 -857,16 1,00 s9 -1091,97 0,99 s10 -3587,49 0,97 s11 -13389,83 0,86 s12 6360,72 1,05 Paramètre de lissage alpha 0,25 0,21 beta 0,02 0,03 gamma 0,76 0,66 MAPE 3,99 5,02 MedAPE 3,21 4,15 Segments de marché Domestique Transfrontalier Additif Multiplicatif Additif Multiplicatif 22965,47 59148,20 59903,93 22539,41 230,22 -43,17 -38,34 223,82 0,87 -4661,89 0,90 -1876,14 0,98 -2868,14 0,94 -220,04 1,03 -2277,28 0,95 640,60 0,86 -3479,47 0,92 -1963,05 0,74 6576,28 1,12 -3864,63 0,92 8649,72 1,17 -956,13 1,12 2492,96 1,04 2281,62 1,09 2777,69 1,06 1475,03 1,09 4828,53 1,10 1473,51 1,17 9209,43 1,18 2707,62 0,80 -4059,28 0,93 -3646,07 0,92 -8713,34 0,83 -1215,82 0,49 0,00 0,34 9,88 9,06 0,41 0,00 0,31 9,34 7,47 0,25 0,01 0,38 17,57 15,45 0,25 0,03 0,44 17,47 16,20 International Additif Multiplicatif 25163,20 45173,06 -22,98 -22,98 38368,62 1,53 33486,95 1,51 37469,29 1,49 14785,77 1,17 -19587,12 0,56 -17442,73 0,83 -13212,77 0,96 -10765,43 0,98 -12580,27 0,93 -17091,05 0,71 -4326,00 0,47 13307,80 0,85 0,26 0,00 1,00 19,63 14,27 1,00 0,00 1,00 118,00 62,33 Remarques : a désigne le niveau, b est la tendance et sP (P=1,…,12) sont les composantes mensuelles. Alpha, beta et gamma sont les paramètres de lissage de, respectivement, le niveau, la tendance et la saisonnalité. Les MAPE et MedAPE sont calculées sur les prévisions horséchantillon de janvier 2012 à décembre 2014.ß 37 Tableau 15: Modèles SARIMA Segments de marché Domestique Transfrontalier 0,8 *** -0,47 * (0,09) (0,24) -1,23 *** 0,09 (0,14) (0,21) 0,24 -0,5 *** (0,14) (0,11) 0,26 ** 0,43 *** (0,08) (0,1) Variables Total ar1 -0,39 *** (0,08) -0,35 *** (0,1) 0,44 *** (0,08) 0,35 *** (0,08) 0,39 *** (0,08) (0,1,2)(2,0,0) (1,1,2)(2,0,0) -345,35 -283,37 177,85 147,99 13,0 (0,37) 13,5 (0,06) 7,76 8,28 6,29 6,65 ma1 ma2 sar1 sar2 SARIMA(p,d,q)(P,D,Q)12 AIC Log.V Test Ljung-Box (p-valeur) MAPE (en %) MedAPE (en %) 0,45 *** (0,11) (1,1,2)(2,0,0) -64,77 38,86 1,6 (0,98) 21,19 19,50 International -0,8 *** (0,08) -0,15 (0,09) 0,78 *** (0,04) (0,1,2)(1,0,0) 443,2 -217,45 2,1 (0,99) 97,55 91,47 Remarques : l’estimation du modèle SARIMA est faite avec la fonction auto.sarima(…, d=1, ic= ’AIC’, seasonnal=TRUE, stepwise=FALSE, approximation=FALSE, seasonnal.test= « OCSB») sur les séries en log-différences. Le test de Ljung-Box porte sur les résidus du modèle SARIMA et il est réalisé en prenant en compte les degrés de liberté du modèle, ainsi que 12 lags (les résultats sont très similaires avec 24 lags). ***, **, * indiquent le rejet aux seuils de, respectivement, 1%, 5% et 10% de l’hypothèse de nullité du coefficient de régression. L’écart-type des coefficients est entre parenthèses. AIC se réfère au critère d’information d’Akaike et Log.V est la log-vraisemblance du modèle. Les MAPE et MedAPE sont calculées sur les prévisions hors-échantillon de janvier 2012 à décembre 2014. 38 7. Bibliographie Andrawis, R., Atiya, A. et El-Shishiny, H. (2011), Combination of long term and short term forecasts, with application to tourism demand forecasting, International Journal of Forecasting, 27:870-886 Bates, J. et Granger, C. (1969). The combination of forecasts. Operational Research Quarterly, 20(4):451–468. Bougas, C. (2013). Forecasting Air Passenger Traffic Flows in Canada: An Evaluation of Time Series Models and Combination Methods, Mémoire de maîtrise en économique, Chaire de recherche aéroportuaire de l’Université Laval. Chen, C., Chang, Y., et Chang, Y. (2009). Seasonal arima forecasting of inbound air travel arrivals to Taiwan. Transportmetrica, 5(2):125–140. Chu, F. (1998). Forecasting tourism: a combined approach. Tourism Management, 19(6):515–520. Chu, F. (2009). Forecasting tourism demand with arma-based methods. Tourism Management, 30(5):740–751. Coshall, J. (2009). Combining volatility and smoothing forecasts of UK demand for international tourism. Tourism Management, 30(4):495–511. Coshall, J. et Charlesworth, R. (2011). A management oriented approach to combination forecasting of tourism demand. Tourism Management, 32:759–769. Diebold, F. et Pauly, P. (1987). Structural Change and the Combination of Forecasts. Journal of Forecasting, 6:21-40. Emiray, E. et Rodriguez, G. (2003). Evaluating Time Series Models in Short and Long-Term Forecasting of Canadian Air Passenger Data. Department of Economics, University of Ottawa. Gelper, S., Fried, R., et Croux, C. (2010). Robust forecasting with exponential and holt– winters smoothing. Journal of forecasting, 29(3):285–300. Graefe, A., Armstrong, J., Randall, J., et Cuzán, A. (2014). Combining forecasts: An application to elections, International Journal of Forecasting, 30:43–54. Hyndman, R.J et Athanasopoulos, G. (2013). Forecasting: principles and practice. http://otexts.org/fpp/. 39 Koopman, S. J., A. C. Harvey, J. A. Doornik, and N. Shephard (1995), STAMP, Time Series Analyzer, Modeller and Predictor. Timberlake Consultatnts LTD. Lim, C. et McAleer, M. (2002). Time series forecasts of international travel demand for Australia. Tourism Managment, 23:389–396. Oh, C. et Morzuch, B. (2005). Evaluating time-series models to forecast the demand for tourism in Singapore comparing within-sample and postsample results. Journal of Travel Research, 43(4):404–413. Shen, S., Li, G., et Song, H. (2008). An assessment of combining tourism demand forecasts over different time horizons. Journal of Travel Research, 47(2):197–207. Shen, S., Li, G., et Song, H. (2011). Combination forecasts of international tourism demand. Annals of Tourism Research, 38(1):72–89. Timmermann, A. (2006), Forecast Combinations, Handbook of Economics Forecasting, Volume 1, Chapter 4. Transports Canada (2009), Aviation Forescasts 2008-2022, Summary Report 2008 - 2022. Wong, K., Song, H.,Witt, S., et Wu, D. (2007). Tourism forecasting: to combine or not to combine? Tourism Management, 28(4):1068–1078. 40