Télécharger
Transcription
Télécharger
Université du Québec Institut national de la recherche scientifique Centre Eau Terre Environnement ÉVALUATION DE DIVERSES TECHNIQUES DE MISE À L'ÉCHELLE STATISTIQUE DES INDICES QUI CARACTÉRISENT LE DÉBIT D'ÉTIAGE DE TROIS RIVIÈRES DE L'EST DU CANADA Par Deepti Joshi Thèse présentée pour l'obtention du grade de Philosophiae Doctor (Ph.D.) en sciences de l'eau Jury d'évaluation Examinateur Externe Madame Marie-Amélie Boucher Université du Québec à Chicoutimi Examinateur Externe Monsieur Alex J. Cannon Pacific Climate Impacts Consortium Examinateur Interne Monsieur Fateh Chebana INRS, Centre Eau Terre Environnement Co-directeur de recherche Monsieur Taha B.M.J. Ouarda INRS, Centre Eau Terre Environnement Co-directrice de recherche Madame Anik Daigle INRS, Centre Eau Terre Environnement Cégep Garneau, Québec Directeur de recherche Monsieur André St-Hilaire INRS, Centre Eau Terre Environnement © Droits réservés de DEEPTI JOSHI, 2014 - - - - - - - - REMERCIEMENTS Je tiens à exprimer ma profonde gratitude et ma grande reconnaissance envers mon directeur de recherche le Professeur André St-Hilaire, pour son aide immense, sa coopération et ses conseils qui m'ont guidée dans l'achèvement de cette thèse. J'exprime également ma profonde et sincère reconnaissance à mes co-directeurs de recherche, le Professeur Taha Ouarda et Anik Daigle dont les suggestions et les conseils m'ont accompagnée tout au long de cette étude. Je remercie également Mme Suzanne Dussault et Mme Sophie Magos pour leur aide et leurs instructions. Je pense aussi tout particulièrement à mes amis Valérie Ouellet, Hélène Higgins, Sébastien Ouellet-Proulx, Laurence Perron et Christian Saad pour leur coopération et leur aide. Je suis grandement redevable et exprime un profond sens de l'honneur envers mes parents bien-aimés, mon mari, Anirban Bhattacharjee et mon frère, Vivek Joshi, pour l'amour et les encouragements qu'ils m'ont accordés et pour leur soutien indéfectible tout au long de mes études. Enfin, je tiens à exprimer mes sincères remerciements à tous ceux qui m'ont aidée, directement ou indirectement, à terminer cette thèse. iii PRÉFACE Cette étude met l'emphase sur la comparaison de deux approches de mise à l'échelle d'indices hydrologiques caractérisant les débits d'étiage dans trois rivières du Québec: la rivière Moisie, la rivière Romaine et la rivière Ouelle. Les résultats de cette étude ont été présentés dans plusieurs publications. La thèse est structurée en quatre chapitres. Le Chapitre 1 présente le résumé avec une justification de l'utilisation des indices hydrologiques pour la gestion des ressources hydriques, suivi par une description détaillée des différentes approches de mise à l'échelle pour faciliter l'analyse des impacts des changements climatiques. Ce chapitre présente aussi la méthodologie, la formulation mathématique des approches mises en œuvre, les principaux résultats et une discussion à propos des méthodes développées. Le Chapitre 2 présente les résultats de l'approche directe de mise à l'échelle, qui, comme son nom l'indique, établit une relation directe avec les indices d'étiage (article 1, publié dans le Journa/ of Hydr%gy). La deuxième approche de mise à l'échelle est appelée 'indirecte' parce qu'elle utilise une approche en deux étapes. D'abord, on procède à la mise à l'échelle statistique des variables météorologiques locales (précipitation et température). Puis, ces variables servent d'intrants à un modèle hydrologique déterministe qui simule les débits. Les indices d'étiage sont calculés à partir des chroniques de débits simulés. Le Chapitre 3 décrit les résultats de mise à l'échelle de la précipitation et de la température (article 2, soumis à Stochastic Environmenta/ Research and Risk Assessment). Finalement, le Chapitre 4 décrit les resultats des simulations de débit faites à l'aide du modèle SSARR, avec en entrée des données de température et de précipitations mises à l'échelle. Ce chapitre décrit aussi les projections futures des indices de débit d'étiage obtenus à partir des sorties de modèles climatiques régional et global. v RÉSUMÉ L'étiage est une période de l'année hydrologique pouvant s'avérer critique sur divers plans, notamment en ce qui a trait aux pêcheries, à la capacité d'assimilation des plans d'eau, à la disponibilité de l'eau potable et à la navigation. Toutefois, malgré l'importance évidente que revêt le facteur climatique relativement à la variabilité des débits d'étiage, bien peu d'études portent sur cette question. La plupart des études de mise à l'échelle de données hydro climatiques qui portent sur les étiages présentent une approche à deux étapes: (1) les sorties issues d'un modèle de circulation générale (MCG) ou d'un modèle climatique régional sont utilisées pour la mise à l'échelle des variables climatiques locales, dont les précipitations et la température; puis (2) les variables ainsi ramenées à l'échelle locale sont insérées dans un modèle hydrologique afin de procéder à une simulation des débits qui peuvent ensuite servir à calculer des indices descripteurs du débit d'étiage. Le cadre de mise à l'échelle utilisant un modèle hydrologique (ou approche indirecte de mise à l'échelle) est entravé par certains écarts entre les sorties du MCG et les entrées requises au modèle hydrologique, les incertitudes relatives à la mise à l'échelle des variables climatiques et à l'estimation des paramètres du modèle, de même que par la propagation d'erreurs à travers les modèles de mise à l'échelle et hydrologique. Pour contourner ces contraintes, certaines études ont tenté d'établir un lien directe entre les variables climatiques à grande échelle et le débit. Toutefois, ces liens directs n'ont pas été explorés de façon aussi exhaustive que les approches indirectes de mise à l'échelle. La présente étude vise ainsi à comparer les approches directe (AD) et indirecte (AI) de mise à l'échelle en vue de caractériser le régime d'étiage de trois rivières de l'est du Canada, soit les rivières Moisie, Romaine et Ouelle. Le régime d'étiage des rivières est caractérisé par le calcul d'indices hydrologiques (IH). En plus de ces approches, une troisième méthode a été mise en œuvre, laquelle comprend l'introduction de variables météorologiques observées dans le modèle hydrologique choisi en vue de simuler des débits qui serviront ensuite à calculer les IH. Cette approche a été appelée « Approche de validation partielle» (AVP). Les modèles statistiques utilisés pour la mise à l'échelle des IH selon l'AD et des variables climatiques locales selon la AI sont un modèle stochastique d'apprentissage bayésien (MSAB) et la régression linéaire multiple (RLM). D'un côté, le MSAB permet de définir des relations non linéaires entre les variables climatiques à grande échelle (prédicteurs) et la variable mise à vii -- ------------- l'échelle (prédictant) à l'aide d'un cadre probabiliste qui désavantage les modèles complexes en définissant une fonction de probabilité a priori associée aux coefficients de pondération. Ultimement, l'algorithme conduit à un modèle dans lequel la valeur de la plupart des coefficients de pondération est de zéro. Les paramètres correspondants sont alors exclus du modèle prédictif, ce qui assure la parcimonie de la méthode. De l'autre côté, la RLM s'appuie sur les relations linéaires entre les prédicteurs et le prédictant. Le MSAB a été mis en œuvre sous forme d'une machine à vecteur de pertinence (MVP, ou 'Relevant Vector Machine') alors que la RLM a été mise en œuvre à l'aide de l'outil mise à l'échelle statistique automatique ASD. Le choix des prédicteurs pour la MVP a été fait à l'aide de l'analyse de corrélation canonique (ACC) alors que l'ASD utilise la régression multiple pas à pas descendante (RMD). En plus de l'ACC et de la régression pas à pas qui sont des constituantes de l'approche indirecte, un algorithme de programmation génétique (PG) a été testé pour la sélection des prédicteurs. Ce type d'algorithme fait évoluer un modèle mathématique à partir de fonctions non-linéaires d'ordre peu élevé qui transforment les variables d'entrée. Les prévisions des IH à partir de deux modèles (ECHAM5 (MCG) et le Modèle régional canadien du climat, MRCC) de 2021 à 2050 et de 2051 à 2070 ont également été analysées. Les trois rivières sélectionnées sont hôtes de populations de saumon atlantique (Sa/mo sa/ar), espèce qui est sensible aux conditions hydrologiques et thermiques associées aux étiages sévères. Les rivières Moisie et Romaine se situent sur la rive nord du fleuve Saint-Laurent alors que la rivière Ouelle est située sur la rive sud. Les régimes d'étiage de la Moisie et de la Romaine se caractérisent par des débits hivernaux très faibles attribuables à de basses températures prolongées. Ces conditions sont attribuées à l'occurrence de precipitations sou form de neige et des periods prolongée de temperature froide. Quant à la rivière Ouelle, elle se caractérise par des débits estivaux très faibles, probablement en raison des faibles précipitations et de l'évaporation relativement élevée ainsi que du faible afflux d'eaux souterraines. Les trois rivières qui nous intéressent ont été caractérisées par six indices hydrologiques appartenant à quatre catégories principales: l'amplitude, la temporalité, la variabilité et la durée. Les indices choisis sont: • Les valeurs minimales du débit observées au mois de mars pour chaque année (AMP1); le rapport entre le débit le plus faible observé au cours de l'année et le débit annuel moyen (indice de débit de base, AMP2); • le jour julien moyen des sept journées au cours desquelles les débits les plus faibles ont viii été observés au cours de l'année (T); • • l'écart type du jour julien de ces sept journées (V); le débit le plus faible observé sur une durée de 90 jours divisé par la valeur médiane de toute la période d'enregistrement (01); • le débit le plus faible observé sur une durée de 90 jours, de juillet à octobre, divisé par la valeur médiane de toute la période d'enregistrement (02). Comparativement à ceux des rivières Moisie et Romaine, les indices observés à la rivière Ouelle présentent de plus fortes variations. Les résultats obtenus ont permis de démontrer que l'approche directe de mise à l'échelle statistique (AD) à l'aide du MVP (AD1) surpasse toutes les autres approches et ce, à de nombreux égards. En effet, les indices de performance obtenus à partir de l'AD1 présentaient des différences marquées par rapport à ceux des autres approches. La parcimonie de la méthode a été assurée en choisissant un faible nombre de paramètres dans le modèle prédictif. La grande capacité de généralisation du modèle, AD1 s'est traduite par une similitude des valeurs des indices de performance lors des étapes d'étalonnage et de validation. Malgré les bons résultats obtenus, il s'avère que les approches d'AD dépendent de la capacité de modélisation de l'approche statistique sélectionnée pour la mise à l'échelle des indices de débit d'étiage. La principale raison qui explique cette conclusion est que pour certains indices (p. ex.: l'indice V pour la rivière Ouelle), de meilleurs résultats ont été obtenus à partir des AI et AVP qu'à partir de l'AD à l'aide de l'ASD. Ainsi, les approches de mise à l'échelle directe s'avèrent grandement influencées par le modèle statistique utilisé. Les résultats obtenus à partir de la AI sont potentiellement entachés de deux sources d'incertitude: celles associées à la mise à l'échelle des variables climatiques et celles associées au modèle hydrologique. MVP a donné de meilleurs résultats que ASD pour la mise à l'échelle de la température. En contraste, les deux approches ont performé de manière sensiblement égale pour la mise à l'échelle des précipitations. Cependant, les résultats étaient plus probants pour ce qui est de la température (coefficient de corrélation (R) > 0,9) que pour la précipitation (R de l'ordre de 0,3 à 0,7). La combinaison de PG et MVP (MVPPG) améliore les résultats de mise à l'échelle des précipitations tandis que l'utilisation de PG et RLM (RLMPG) ne donne pas de meilleurs résultats que la même méthode sans algorithme génétique. Dans certains cas, ASD performe mieux que RLMPG pour la classification des jours avec et sans pluie, de même que pour l'estimation des quantités de pluie. ix ------- - --- - Par la suite, les variables climatiques mises à l'échelle locale ont été utilisées comme intrants dans le modèle SSARR en vue de simuler le débit. Cette fois encore, les indices de débit d'étiage (IH) calculés à partir des résultats de la simulation se sont avérés comparables pour les deux approches indirectes de mise à l'échelle. Pour certains indices, l'AVP a été surpassée par les AI (indice V pour la Romaine) et ce, malgré l'utilisation des valeurs observées de précipitation et de température. Les prévisions des IH sur les périodes 2021 à 2050 et 2051 à 2070 ont révélé un changement marqué de leur moyenne et de leur variabilité. Toutefois, aucune tendance croissante ou décroissante n'a été observée chez aucun des indices. Mots-clés: Indices de débit d'étiage, méthode stochastique d'apprentissage bayésien, régression linéaire multiple, débits d'étiage, analyse de corrélation canonique, mise à l'échelle statistique. x TABLE DES MATIÈRES REMERCIEMENTS _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ iii PRÉFACE _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ v RÉSUMÉ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - vii TABLE DES MATIÈRES ___________________________________________ xi LISTE DES TABLEAUX _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ xvii LISTE DES FIGURES _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ xxi LISTE DES ÉQUATIONS - - - - - - - - - - - - - - - - - - - - - - xxvii LISTE DES ABRÉVIATIONS - - - - - - - - - - - - - - - - - - - - - - -xxxi PARTIE 1 : SYNTHÈSE- - - - - - - - - - - - - - - - - - - - - - - - - - - 1 CHAPITRE 1: SYNTHÈSE 3 1. 3 INTRODUCTION 1.1 Le débit d'étiage et la variabilité du climat _________________ 5 1.2 Définition du domaine de l'étiage: Les Indices Hydrologiques 6 1.3 Les conséquences de la variabilité climatique sur le débit d'étiage 8 1.4 Des modèles climatiques globaux au climat régional 9 1.5 LA MISE À L'ÉCHELLE DYNAMIQUE ____________________________ 13 1.6 La mise à l'échelle statistique _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 14 1.6.1 Le typage météorologique 16 1.6.2 Les générateurs météorologiques stochastiques (WGEN) 16 1.6.3 Les modèles de régression 17 1.7 2 21 PROBLÉMATIQUE ET OBJECTIFS DE RECHERCHE ____________________ 23 2.1 3 Le cadre de mise à l'échelle indirecte Originalité du projet de recherche ____________________ 24 PLAN DE MISE EN APPLICATION ________________________________ 25 xi - - - - - - - - - - - - 3.1 Modèles de mise à l'échelle statistique _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 25 3.1.1 Apprentissage Bayésien (AB) 25 3.1.1.1 Modèle de régression parcimonieux 26 3.1.1.2 Modèle de classification parcimonieux 30 3.1.2 Régression linéaire multiple (RLM) 31 3.1.3 Algorithme génétique pour la mise à l'échelle des précipitations 32 3.2 Modèle hydrologique _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 38 3.3 Cadre de mise à l'échelle statistique 3.3.1 44 Préparation des entrées 44 3.3.2 Mise à l'échelle 44 3.3.3 Calcul des IH du débit d'étiage 45 3.3.4 Approches utilisées 45 3.4 Méthodes de validation et mesures du rendement - - - - - - - - - - - - - - - - - - 48 3.5 Projections _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 50 4 RÉGIONÉTUDIÉE ____________________________________________ 53 5 CHOIX DES INDICES HYDROLOGIQUES DE DÉBIT D'ÉTIAGE 59 6 RÉSULTATS 63 6.1 Approche directe de mise à l'échelle _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 63 6.2 Approche indirecte de mise à l'échelle _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 64 6.2.1 Mise à l'échelle des valeurs de précipitations et de température 64 6.2.2 Simulation des débits à l'aide du modèle SSARR 69 6.2.3 Comparaison des approches indirectes de mise à l'échelle 70 6.3 Comparaison de l'approche directe, de l'approche indirecte et de la validation partielle ________________________________________________________ 72 6.4 Projections _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 75 7 DISCUSSION _______________________________________________ 81 8 CONCLUSION 85 9 RECOMMENDATIONS 87 PARTIE 2: ARTICLES 89 xii DATABSED COMPARISON OF SPARSE BAYESIAN LEARNING AND MULTIPLE LlNEAR REGRESSION FOR STATISTICAL DOWNSCALING OF LOW FLOW INDICES _ _ _ _ 91 ABSTRACT 93 1 INTRODUCTION 94 2 STATISTICAL DOWNSCALING 98 2.1 Automated Statistical Downscaling Tool _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 98 2.2 Sparse Bayesian Learning _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 98 2.2.1 Relevance Vector Machine 99 3 STUDYAREAANDDATARESOURCE _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 100 4 METHODOLOGY 4.1 104 Selection of Low flow Indices 104 4.1.1 Selected Lowflow Indices 106 4.1.1.1 A 1 (Minimum March Flows) 106 4.1.1.2 A2 (Base flow Index) 107 4.1.1.3 T (Average Julian date of seven one day minimum) 107 4.1.1.4 V (standard deviation of the Julian date of seven one day minimum) 108 4.1.1.5 01 (Annual 90 day minimum divided by 050) 108 4.1.1.6 02 (90 day minimum for S2 divided by 050) 108 4.1.2 Predictor Selection 109 4.1.3 Statistical downscaling Framework 115 4.1.4 Performance Indices 117 5 RESULTS _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 118 6 DISCUSSION 122 7 CONCLUSION 124 8 APPENDIX-1 126 8.1.1 Theoretical Background of Sparse Bayesian Learning 126 STATISTICAL DOWNSCALING OF PRECIPITATION AND TEMPERATURE USING SPARSE BAYESIAN LEARNING, MULTIPLE LlNEAR REGRESSION AND GENETIC PROGRAMMING FRAMEWORKS _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 131 ABSTRACT 133 xiii 1 INTRODUCTION _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 134 ' 2 STATISTICAL MODELS 2.1 137 Multiple linear regression _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 137 2.1.1 Automated Statistical Downscaling Tooi 137 2.2 Sparse Bayesian Learning _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 138 2.3 Genetic programming framework for precipitation downscaling 139 3 STUDY AREAS AND DATA _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 145 4 METHODOLOGY 5 149 4.1 Statistical Downscaling Framework _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 149 4.2 Model Accuracy Measures 155 RESULTS _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 156 5.1 Temperature downscaling results _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 156 5.2 Precipitation Results 5.2.1 159 Classification Results 159 Comparison of transition probabilites 161 5.2.2 Precipitation amount downscaling results 162 5.2.1.1 5.2.2.1 Seasonal results 165 6 DISCUSSION _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 166 7 CONCLUSION 168 COMPARISON OF DIRECT STATISTICAL AND INDIRECT STATISTICAL-DETERMINISTIC FRAMEWORKS IN DOWNSCALING RIVER LOW-FLOW INDICES _ _ _ _ _ _ _ _ 169 ABSTRACT 171 1 INTRODUCTION 172 2 STATISTICAL DOWNSCALING FRAMEWORK 175 2.1 Statistical models _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 178 2.1.1 Relevance vector machine (RVM) 179 2.1.2 Automated statistical downscaling tool 179 2.2 The hydrological model: SSARR 179 xiv 2.2.1 SSARR calibration 181 3 STUDY AREA 183 4 SELECTION OF lOW FLOW INDICES 187 5 PREDICTOR SELECTION 189 6 MODEl VALIDATION AND PERFORMANCE 191 7 RESUlTS 192 7.1 Intercomparison of DO approaches (001 and 002) 192 7.2 Downscaling of precipitation and temperature 192 7.3 SSARR calibration 192 7.4 Intercomparison of ID approaches (101 and 102) 194 7.5 Comparison of DO and ID approaches 194 7.6 Comparison of PVA and downscaling approaches (DO and ID) 198 7.6.1 PVA and DO approaches 198 7.6.2 PVA and ID approaches 7.7 8 9 198 Future projections of low flow His 198 7.7.1 Amplitude Indices (AMP1 and AMP2) 199 7.7.2 Timing and Variability Indices (T and V) 199 7.7.3 Duration Indices (01 and 02) 199 DISCUSSION 202 8.1 Comparison between statistical models (SBl and MlR) 202 8.2 Comparison between the two downscaling strategies 202 8.3 Future projections given by GCM and RCM 204 CONCLUSION 205 BIBLIOGRAPHIE 207 xv LISTEDESTABLEAUX Tableau1.1 Performances de simulationdes MCG en fonctionde l'échellespatiale, temporelle, verticale et des variables d'intérêt pour la modélisation h y d r o l o g i q u( X e u ,1 9 9 9 ) ...............12 T a b l e a u1 . 2 . P r é d i c t e u rdsu N C E Pu t i l i s é d s a n sl e c a d r ed e l a m i s eà l ' é c h e l l e ...................47 T a b l e a u1 . 3 Division des données météorologiquesdisponibles en ensembles d'étalonnage et de validation. Deux combinaisons d'ensembles d'étalonnage et de validationont été définies;ellessont désignéespar C1etC2............. .........50 Tableau1.4. Scénarios d'émissions recommandés par le Groupe d'experts intergouvernemental sur l'évolution du climat(lPCC,2000)afin d'évaluer l e s r é s u l t a tfsu t u r sr e l a t i f a s u xé m i s s i o n s . . . . . . . . , , . ............52 Tableau1.5 (tiré de Joshi et al., Descriptiondes stationset donnéeshydrométriques 2013)........ ...................55 Tableau1.6. pour la mise à l'échellede la température Prédicteurs sélectionnés et de la précipitation. réfèrentau tableau1.2..............66 Les numérosdes prédicteurs Table 2.1 Table 2.2 T a b l e2 . 3 NCEP predictorsused in the downscalingframework.... ïable 2.4 Predictandssignificantlycorrelatedwith selectedlow flow indicesfor river Romaine.Negativelycorrelatedpredictorsare indicatedby bold numbers whereas normal fonts indicate positively correlated predictors. The mentionednumbersreferto NCEPreanalysis variableslistedin table2.3.....112 T a b l e2 . 5 Predictandssignificantlycorrelatedwith selectedlow flow indicesfor river Moisie. Negativelycorrelatedpredictorsare indicatedby bold numbers whereas normal fonts indicate positively correlated predictors. The mentionednumbersreferto NCEPreanalysis variableslistedin table2.3.....113 Table2.6 Predictandssignificantlycorrelatedwith selectedlow flow indicesfor river Ouelle. Negativelycorrelatedpredictorsare indicatedby bold numbers whereas normal fonts indicate positively correlated predictors. The mentionednumbersreferto NCEPreanalysis variableslistedin table2.3.....114 XVII Table2.7 Predictors selected using stepwise regression in the ASD tool. The mentionednumbers refer to NCEP reanalysisvariablesshown in table . . . . . . . . . . . . . .1. 6. . 1 2.3............ Table2.8 Numberof Relevantvectors(% of total trainingpoints).The width of the . . . . . .1.19 k e r n efl u n c t i o n a s r e i n d i c a t e idn b r a c k e t s..... . . . . . . . . . Table3.1 Details of the meteorologicalstations used in the current work. The alphabet mentioned in brackets in the first column denotes the a b b r e v i a t i ouns e df o r t h e s t a t i o ni n s u b s e q u e nt at b l e sa n d f i g u r e s . . . . . . . . . . . . . . . . . 1 4 7 Table 3.2 List of predictors selected for the downscaling of precipitationand ....150 temperature at the selectedmeteorological stations T a b l e3 . 3 Combinationsof calibrationand validationsets used in downscaling precipitationand temperature downscaling.Data sizes in years are i n d i c a t eidn b r a c k e t s ..................151 Table3.4 Some of the initial system parameters(GPTIPS) used for the GP .................153 algorithm.. Table3.5 Predictorsselectedfor temperatureand precipitationdownscalingfor set 1 and set 2. The numbersreferto the correspondingpredictorsmentioned i n t a b l e3 . 2 .A l p h a b e t rse f e rt o t h e s t a t i o n sm e n t i o n e idn t a b l e3 . 1 . . . . . . . . . . . . . 1 5 7 Table3.6 Table3.7 'Obs' Comparisonof wet day transitionprobabilities obtainedfor C1. refersto observedvalues and 'Stn' indicatesthe stations.The alphabets . ............161 d e n o t i n gt h e s t a t i o nn a m e sa r e s h o w ni n t a b l e3 . 1 . . 'Obs'refers Comparison of dry day transitionprobabilities obtainedfor C1. 'Stn' to observed values and indicates the stations. The alphabets ............162 d e n o t i n tgh es t a t i o n a m e sa r e s h o w ni n t a b l e3 . 1 . . . . . . . . . . . . .. .... 185 T a b l e4 . 1 Description of meteorological stationsusedin the currentwork... lable 4.2 Description of hydrometric from Joshiet a|.,2013).......186 stations(reproduced Table4.3 Selectedhydrologicalindicesdefinitionwith index code (reproducedfrom .........188 Joshe i t a1.,2013).............. ïable 4.4 NCEP predictorsused in the downscalingframework(reproducedfrom .........190 Joshe i t a 1 . . 2 0 1 3. . . . . . . . . . . . . T a b l e4 . 5 Calibrationand validationsets used in the analysis.Data sizes in years ...............193 a r e i n d i c a t eidn b r a c k e t.s. . . . . . . . . . . . . XVIII T a b l e4 . 6 SSARR simulationresultsfor C1 for the entire year (YEARLY),summer (SMR) and winter (WNTR).The performanceindiceswere calculatedfor c a l i b r a t i oann d v a l i d a t i opne r i o d sc o m b i n e d .................193 xix LISTEDESFIGURES F i g u r e1 . 1 Un modèle multigènepseudo-linéaire avec variabledépendanteY et prédicteursx, y and z. Les coefficientsa0, a1 and a2 sont obtenus a u t o m a t i q u e m epnat r M V Pa n d A S D . . . ..........34 F i g u r e1 . 2 Deux différenttypes de mutations.L'arbredu haut est I'original.En bas à gauche, on a la représentation d'une mutationd'une seule branche par (3) terminale une autre branche terminale(a). C'est aussi une représentationd'une mutation d'une seule fonction (-) pour une autre fonction(+). L'arbreen bas à droiteillustreun remplacement de touteune a r b o r e s c e n cpea r u n e a u t r e . ........36 F i g u r e1 . 3 Opérationde transfertdans I'algorithmegénétique.Les sélectionsen gras pourles deux parentssontéchangéespourcréerles enfants .........37 F i g u r e1 . 4 Algorithmedu moduleintégrépar bandesde neige homogènesselon le S S A R R( g u i d ed ' u t i l i s a t i odnu S S A R R ,1 9 9 1 ) ..................40 F i g u r e1 . 5 Cadre de mise à l'échellestatistiquedécrivantles algorithmesde la mise à l'échelledirecte,de la mise à l'échelleindirecteet de la validation p a r t i e l l eP. G a s e u l e m e nét t é u t i l i s ép o u rl e s p r é c i p i t a t i o n d sa n s A 1 . . . . . . . . . . . . . . . . 4 6 F i g u r e1 . 6 Carte de la zone d'étude illustrant I'emplacement des stations hydrométriques (cercles) et météorologiques(carrés) des rivières R o m a i n eM , o i s i ee t O u e l l e (. f i g u r et i r é ed e J o s h ie t a | . , 2 0 1 3 ) . . . . . . . . . . . . . . . . . . . . . . . . . . 5 3 F i g u r e1 . 7 Courbesde débits classésestivaleset hivernalesdes rivièresRomaine. M o i s i ee t O u e l l e ..........55 F i g u r e1 . 8 Températureset précipitationsannuelles moyennes enregistréesaux Les lettrescorrespondentaux stationsdécrites stationsmétéorologiques. a u t a b l e a u1 . 6 . . . . . . . . . . . ..................57 F i g u r e1 . 9 Diagrammes choisispourles rivières en hamacdes indiceshydrologiques R o m a i n eM , o i s i ee t O u e l l e( t i r é sd e J o s h ie t a l . ,2 0 1 3 ) . . . . . . . . . . . . . . ......61 F i g u r e1. 1 0 Résultatsde validationdes modèlesde mise à l'échelle(MVP, ASD et RLMACC)obtenuspourla rivièreOuelle ......64 F i g u r e1. 11 Résultatsde validationde la mise à l'échellede la températureobtenus par le MVP et I'ASD, pour les combinaisonsC1 et C2. Les barres blanches et grises représententrespectivementI'ASD et le MVP. Les noms de stationssont représentéspar des lettressur I'axehorizontal(voir l e t a b l e a u1 6 ) . . . . . ... ...................66 XXI F i g u r e1 . 1 2 Résultatsde classificationdes jours secs et humides pour la mise à l'échelledes précipitations avec PG comme méthodede préparationdes intrants.Les résultatssont présentéspour les périodesde validationde C1 et C2 (tableau1.3). Les noms de stationssont représentéspar des (voirle tableau1.6) . .....68 lettressur I'axehorizontal F i g u r e1. 1 3 Résultatsdes régressionspour les taux de précipitationsmis à l'échelle avec le PG comme méthode de preparationdes intrants.Les résultats présentéscorrespondentaux périodesde validationde C1 et C2 (tableau 1.3). Les noms de stations sont représentéspar des lettres sur I'axe ............68 h o r i z o n t a( vl o i rl e t a b l e a u1 . 6 ) .... F i g u r e1 . 1 4 Résultatsde la simulationà I'aide du modèle SSARR pour les trois rivières,pour les deux combinaisonsC1 et C2 des ensembles de 70 F i g u r e1. 1 5 Indicesde performancedes lH d'approcheindirectepour la rivièreMoisie pour les deux combinaisonsdes ensembles de calibrationet de ....................71 validation. F i g u r e1. 1 6 Indices de performancedes lH de I'approcheindirectepour la rivière et de Romainepour les deux combinaisons des ensemblesde calibration validation.. ...................71 F i g u r e1 . 1 7 Indicesde performancedes lH de I'approcheindirectepour rivièreOuelle pour les deux combinaisonsdes ensembles de calibrationet de validation.. ...................72 F i g u r e1. 1 8 C1 Comparaison des indicesde performance des lH pour la combinaison appliquée à la rivière Ouelle. Les approches comparées sont les suivantes:réductiondirecteà I'aidede la MVP (AD1)et du ASD (AD2); réductionindirecteà I'aidedu modèlehydrologique SSARRet des valeurs observées (AVP) et mises à l'échelle des précipitationset de la températureà titre d'entréesselon deux méthodes,soit la MVP (Al1) et le ASD(Ar2). 74 F i g u r e1. 1 9 C2 Comparaison des indicesde performance des lH pour la combinaison appliquée à la rivière Ouelle. Les approches comparées sont les suivantes: réductiondirecteà I'aidede la MVP (AD1)et du ASD (AD2); réductionindirecteà l'aidedu modèlehydrologique SSARRet des valeurs observées (AVP) et mises à l'échelle des précipitationset de la températureà titre d'entréesselon deux méthodes,soit la MVP (Al1) et le A S D( A l 2 ) . ...................74 F i g u r e1 . 2 0 Comparaisondes lH observéset simulésà partirdes sortiesdu MCG et du MCR, ainsique des donnéesdu NCEP pour la périodede référence, ...................75 s o i td e 1 9 6 1à 2 0 1 0 .à l a r i v i è r eR o m a i n e . . . xxii F i g u r e1 . 2 1 Comparaisondes lH observéset simulésà partirdes sortiesdu MCG et du MCR, ainsique des donnéesdu NCEP pour la périodede référence, ........76 s o i td e 1 9 6 1à 2 0 1 0 ,à l a r i v i è r eO u e l l e . Figure1.22 Comparaisondes lH observéset simulésà partirdes sortiesdu MCG et du MCR, ainsique des donnéesdu NCEP pour la périodede référence, s o i td e 1 9 6 1à 2 0 1 0 .à l a r i v i è r eM o i s i e . ........76 F i g u r e1 . 2 3 Diagrammeen hamac des lH de débit d'étiage prévus à la rivière Romaine,tels qu'obtenusà partir du modèle ECHAMS soumis aux scénariosA1B, A2 et 81 pour les années2O2O(2021 à 2050) et 2050 (2051à2070).Histréfèreà la période 1960-2010 ........78 Figure1.24 Diagrammeen hamac des lH de débit d'étiage prévus à la rivière Romainetels qu'obtenusdu MRCCsoumisaux scénariosA1B, A2 et B1 pour les années 2020 (2021 à 2050) et 2050 (2051 à 2070). Hist réfère à l a p é r i o d e1 9 6 0 - 2 0 1 .0. . . . . . . . . . . . . ..................78 F i g u r e1 . 2 5 Diagrammeen hamac des lH de débit d'étiage prévus à la rivière Romainetels qu'obtenuspour DD2 du ECHAMSsoumisaux scénarios A1B, A2 et 81 pour les années 2O2O(2021 à 2050) et 2050 (2051 à 2 O 7 O )H. i s tr é f è r eà l a p é r i o d e1 9 6 0 - 2 0 1 0. ... . . . . . . . . . . . .......79 Figure2.1 The study area map showing the locations of discharge and meteorologicalstationson each river. The squares and circles denote m e t e o r o l o g i caanl d d i s c h a r g set a t i o n sr,e s p e c t i v e l y . . . . . . . . . . .......101 Figure2.2 Precipitation stations.For and Temperaturenormalsof the meteorological Lac Eon and Havre-StPierre normalsare calculatedfor 1964-1976and 1964-1984respectively.For the remainingstationsnormalscorrespondto 1971-2000 .................103 Figure 2.3 Meanspecifichydrograms for (a) Romaine,(b) Moisieand (c) Ouelle.The dotted lines indicatedaily mean specificflow plus and minus the daily s t a n d a r d e v i a t i o nT.h e d r a i n a g ea r e ao f e a c hr i v e ri s a l s oi n d i c a t e d . . . . . . . . . . . . . 1 0 3 Figure2.4 Box plots of low flow indicesusing the entireavailabledataset.The gray l i n er e p r e s e n ttsh e m e d i a na n dt h e ' + ' s i g ns h o w st h e o u t l i e r s ......106 F i g u r e2 . 5 S t a t i s t i cdaol w n s c a l i nf rga m e w o r k . . . . . . . . . . . . . . . F i g u r e2 . 6 Mean RRMSE, RMABE and R2 calibrationvalues for (a) Romaine,(b) Moisie and (c) Ouelle.White bars representASD resultsand gray bars . . . .. . . . . . . . . .1.1.8. r e p r e s e nRt V Mr e s u l t s. . . . . . . . . . . . . Figure2.7 RRMSE,RMABE and R2 validationresultsfor (a) Romaine,(b) Moisie and (c) Ouelle.White bars representASD resultsand gray bars represent ................119 R V Mr e s u l t s..... . . . . . . . . . . XXIII .................117 F i g u r e2 . 8 Observedversus predictedplot of the variabilityindex for Ouelle. The ..........120 d o t t e dl i n er e p r e s e n t1s: 1| i n e . . . . . . . . . . . F i g u r e2 . 9 RRMSE, RMABE and R2 validationresultsfor river Ouelle using MLR, CCAMLR and SBL frameworks.The descriptionof selected indices is g i v e ni n t a b l e 2 . 2 . ......121 F i g u r e3 . 1 Exampleof a functiontree formed using grammarfunctions" and + . The 139 equationrepresenting the tree is f(x1,x2)= x1+(x2.1 0).......... Figure 3.2 Crossoveroperationsfor genetic programming.The bold selectionson b o t hp a r e n t sa r e s w a p p e dt o c r e a t et h e o f f s p r i n o g r c h i l d r e n. . . . . . . . . . ........ . . . . . . 1 4 2 Figure 3.3 Two differenttypes of mutations.The top tree is the originalindividual. The bottom left tree illustratesa mutation of a single terminal (3) for another single terminal (a). lt also illustratesa mutationof a single function(-) for anothersinglefunction(+). The tree on the extreme right illustrates ...........143 a replacement of a subtreeby anothersubtree.. F i g u r e3 . 4 Study area map showingthe drainagebasins and the locationof the meteorologicaland hydrologicalstations. Meteorologicalstations are . .....146 denotedby squareswhereashydrological stationsby circles. F i g u r e3 . 5 Precipitationand temperature normals of the meteorologicalstations ...148 describedin table3.1. Normalswere calculated for 30 years(1971-2000).. Figure3.6 .............154 Statistical downscaling frameworkfor precipitation and temperature. F i g u r e3 . 7 SBL (RVM) and MLR (ASD) temperaturedownscalingresultsfor C1. WhitebarsrepresentMLR whereasgray barsrepresentSBL resu|ts.............158 Figure3.8 SBL (RVM) and MLR (ASD) temperaturedownscalingresultsfor C2. WhitebarsrepresentMLR whereasgray barsrepresentSBL results..... .......158 F i g u r e3 . 9 Comparisonof classificationresults given by SBL, MLR, SBLGP and MLRGPfor combinationC1. White bars representSBL, light gray bars representMLR, dark gray bars representSBLGP and black bars show M L R G Pr e s u l t s . . ........160 F i g u r 3e . 1 0 Comparisonof classification resultsgiven by SBL, MLR, SBLGP and MLRGP for combinationC2. White bars representSBL, light gray bars representMLR, dark gray bars representSBLGP and black bars show 160 M L R G Pr e s u l t s . . . . . . . F i g u r e3 . 1 1 Regressionresults given by SBL, MLR, SBLGP and MLRGP for combinationC1. White bars representSBL, light gray bars represent MLR, dark gray bars representSBLGP and black bars show MLRGP results... ...164 xxiv F i g u r e3 . 1 2 Regressionresults given by SBL, MLR, SBLGP and MLRGP for combinationC2. White bars represent SBL, light gray bars represent MLR, dark gray bars representSBLGP and black bars show MLRGP results... ...164 F i g u r e3 . 1 3 RRMSE,RMABEand R2 resultsof winterand summerseasonsobtained f o r C 1. W h i t eb a r sa n d g r a yb a r sr e p r e s e nSt B L a n d M L Rr e s u l t s... . . . . . . . . . . 1. .6.5. F i g u r e4 . 1 S t a t i s t i cD a lo w n s c a l i nFgr a m e w o r k . . . . . . . . . . . . . . Figure4.2 Snow-Elevation band exampleof rain, snow and melt (SSARRmanual, 1991)........ .................180 F i g u r e4 . 3 The study area map showing the locations of discharge and meteorologicalstationson each river. The squares and circles denote meteorological .......184 and dischargestations,respectively. .......... Figure4.4 Flowdurationcurvesfor Romaine,Moisieand Ouellefor summer(dashed line) and winter flows (smooth line). The drainage areas (DA) are i n d i c a t e idn t h e f i g u r e D . a t aa r e p l o t t e do n s e m i - l o g a r i t h maixci s . . . . . . . . . . . . . . . . . . . 1 8 5 F i g u r e4 . 5 Comparisonof downscalingresultsfor Moisiefor C1.The downscaling approachesare: Directdownscalingusing RVM (DD1) and ASD (DD2), indirectdownscalinginvolvinghydrologicalmodel SSARR with observed (PVA) and downscaledvalues of precipitationand temperatureusing , sinput.. R V M( l D 1 ) a n dA S D ( l D 2 ) a ..........195 F i g u r e4 . 6 Comparisonof downscalingresults for Moisie for C2.The downscaling approachesare: Directdownscalingusing RVM (DD1) and ASD (DD2), indirectdownscalinginvolvinghydrologicalmodel SSARR with observed (PVA) and downscaledvalues of precipitationand temperatureusing , sinput. R V M( l D 1 )a n dA S D ( l D 2 ) a ............195 Figure4.7 Comparisonof downscalingresultsfor Romainefor C1.Thedownscaling approachesare: Directdownscalingusing RVM (DD1) and ASD (DD2), indirectdownscalinginvolvinghydrologicalmodel SSARR with observed (PVA) and downscaledvalues of precipitationand temperatureusing , sinput... R V M( l D 1 )a n dA S D ( l D 2 ) a ..........196 F i g u r e4 . 8 Comparisonof downscalingresultsfor Romaine'ïorC2.ïhe downscaling approachesare: Directdownscalingusing RVM (DD1) and ASD (DD2), indirectdownscalinginvolvinghydrologicalmodel SSARR with observed (PVA) and downscaledvalues of precipitationand temperatureusing ............196 R V M( l D 1 )a n dA S D ( l D 2 ) a, s i n p u t . F i g u r e4 . 9 Comparisonof downscalingresultsfor Ouelle for C1.The downscaling approachesare: Directdownscalingusing RVM (DD1) and ASD (DD2), indirectdownscalinginvolvinghydrologicalmodel SSARR with observed (PVA) and downscaledvalues of precipitationand temperatureusing R V M ( l D 1 )a n dA S D ( l D 2 ) ,a s i n p u t . . . . . .. . . . . . 1 9 7 ................178 F i g u r e4 . 1 0 Comparisonof downscalingresults for Ouelle for C2.The downscaling approachesare: Directdownscalingusing RVM (DD1) and ASD (DD2), indirectdownscalinginvolvinghydrologicalmodel SSARR with observed (PVA) and downscaledvalues of precipitationand temperatureusing ............197 , sinput. R V M( l D 1 )a n dA S D ( l D 2 ) a F i g u r e4 . 1 1 CRCM (RCM) projectionsfor Ouellefor scenarioA2. BL refersto baseline period(1961-2010). The namingconventionis scenarionamefollowedby 2Os (2021-2050) or 50s (2051-2080). A220s and A250s refer to A2 ...............200 scenariocorresponding to 2021-2050and 2051-2080respectively Figure4.12 ECHAMS(GCM) projections for Ouellegiven by scenariosA1B, A2 and The namingconventionis 81. BL refersto baselineperiod(1961-2010). scenarioname followedby 20s (2021-2050)or 50s (2051-2080).A1B20s and A1B50sreferto A1B scenariocorresponding to 2021-2050and 2051.....200 2080 respectively. F i g u r e4 . 1 3 CRCM (RCM)projectionsfor Moisiefor scenarioA2. BL refersto baseline period(1961-2010). The namingconventionis scenarionamefollowedby (2021-2050) 2Os or 50s (2051-2080). A220s and A250s refer to A2 scenariocorresponding to 2021-2050and2051-2080respectively................2O1 Figure4.14 ECHAMS(GCM) projections for Ouellegiven by scenariosA1B, A2 and period (1961-2010). 81. BL refersto baseline The namingconventionis scenarioname followedby 20s (2021-2050)or 50s (2051-2080).A1B20s to 2021-2050and 2051and A1B50sreferto A1B scenariocorresponding .....201 2080 respectively. XXVI XXVII XXVIII XXIX LISTEDES ABREVIATIONS ACC Analysede corrélationcanonique ACP Analyseen Composantes Principales AD Approchedirectede mise à l'échelle AI Approchedirectede miseà l'échelle ASD AutomatedStatisticalDownscalingModel AVP Approchede validationpartielle BMA BiaisMoyenAbsolu BMR Biaismoyen relatif CFDÉ Courbede fréquencedu débit d'étiage COSEPAC Comitésur la situationdes espècesen périlau Canada DAM Débitannuelmoyen DM Débitmedian DMA Débitminimalabsolu FDC Fonctionsde distributions cumulées GIEC Groupesd'expertsintergouvernemental sur I'evolution du climat IH Indicesde débitd'étiage IDB lndexde debitde base ITEÉ Taux d'efficacitéde l'évapotranspiration MCG globaux Modèlesclimatiques MCR Modèleclimatiquerégional MRCC Modèlerégionalcanadiendu climat MSAB Méthodestochastique bayésien d'apprentissage MSABPG MSAB avec PG MVP Machineà vecteurde pertinence MVS Machineà vecteurde soutien NCEP Prediction NationalCenterfor Environmental PG génétique Programmation R2 Coefficientde détermination RLM Régression linéairemultiple RLMACC RLM avec ACC RLMPG RLM avec PG RN Réseauxneuronaux REQM Racinede I'erreurquadratique moyenne RREQM moyenne Racinerelativede I'erreurquadratique SDSM StatisticalDownscalingModel SSARR Synthèsedu débitet régulationdu reservoir VCR Validationcroiséepar rééchantillonnage XXXII PARTIE1 : SYNTHESE 1: SYNTHESE CHAPITRE 1. INTRODUCTION que connaîtle climatde la planèterisquentde poserune sérieusemenace Les changements environnementale au cours du prochainsiècle.Les changementsclimatiquespeuventêtre attribuablesà des processusinternesd'originenaturelle,à des influencesexternesou à des persistants changements anthropiques dans la composition de I'atmosphère ou dans I'utilisation des sols. À cet effet, le quatrième rapport d'évaluation du Groupe d'experts intergouvernemental sur l'évolutiondu climat (GIEC) (2007) prévoit une augmentationde la températuremoyenneà la surfacedu globevariantde 1,8 à 4,0 'C par rapportà la température actuelled'ici I'an 21Q0.De tels changementsauront de graves répercussions sur le cycle hydrologique;ils modifierontles taux de précipitationet d'évapotranspiration, lesquelsaurontà leur tour une influencesur le débit et sur les débitsd'étiage(Kite, 1993;Lettenmaier et Gan, 1 9 9 0 ;M o r t s he t a | . , 2 0 0 0 ; W e s t m a c oetttB u r n ,1 9 9 7 ) . Les débitsd'étiageretiennentgrandementI'attentionde la sociétéscientifiqueen raisonde leur nature diversifiéeet complexe,ainsi que de I'intérêtqu'ils représententdans plusieurs disciplinesscientifiques(la géologie,la météorologie,I'hydrologie,etc.). Par ailleurs,un écoulementfluvial réduit peut s'avérer nuisibleaux espèces aquatiquesen raison d'une diminutionde la concentration d'oxygènedissouset d'unevariationde la température de I'eau. ll réduitégalementla capacitéd'assimilation de la chargeen résidusdu plan d'eau, ce qui entraînedes coûts élevésen traitementdes eaux. Les débitsd'étiagepeuventégalementavoir de lourdes conséquencessocioéconomiquessur I'approvisionnement en eau et sur I'exploitation des réservoirs.C'est pourquoiil est primordialque les responsablesde la gestion des ressourcesen eau prennentconsciencedes conséquencesdes changementsclimatiques sur les débits d'étiage tout en structurantles stratégiesde planificationet de gestion des systèmeshydriques. générale(MCG)constituent la principalesourcede renseignements Les modèlesde circulation pour l'évaluation des changements climatiques. Lorsqu'ilest questionde la des répercussions modificationdu climat de la planète,I'accentest surtoutmis sur la réponsede la sociétéaux localeset régionales à grandeéchelle.À l'échellecontinentale conséquences des changements les MCG intègrentune grandepartiede la complexitédu système,mais ils et hémisphérique, pas à représenter ne parviennent les élémentset les dynamiqueslocalesd'échelleinférieureà cellede leur maillage(Wigleyet al., 1990).Pourcomblerl'écartentrela résolutiondes MCG et les exigenceslocaleset régionalesdes étudesd'impactde naturehydrologique, ces modèles sont souventcombinésà des modèleshydrologiques.Les modèleshydrologiquesoffrentainsi des façons de conceptualiseret d'évaluer le lien qui unit les variablesclimatiquesau ruissellement et au débit fluvial.Ces modèlesont recoursà des descriptionsphysiqueset mathématiques des phénomèneshydrologiques. En outre,les variablesd'entréesdes modèles hydrologiquespeuvent correspondreà des scénarios climatiqueshypothétiquesou à des sortiesissuesdes MCG.Voilàpourquoiil s'avèresouventnécessaire de procéderà une miseà l'échelledes sortiesdu MCG, afin de transférerles sortiesde modèled'une échellerelativement grossièrevers un maillageplusfin, à l'échelledu bassin-versant à l'étude. Les approchesde mise à l'échelle(Hewitsonet Crane, 1996; Wilby et al., 2004; Wilby et Wigley,1997;Xu, 1999;Zoritaet von Storch,1999)ontfait leurapparition à titred'outilsservant à établirune correspondance entre des variablesatmosphériques à grande échelleet des variablesclimatiques localesou par station.Ces méthodesse subdivisent en deux catégories: qui consistenten la résolutionexplicitedes processusphysiquesà les approchesdynamiques, qui consistent l'æuvredans le système(Giorgiet Mearns,1991),et les approchesstatistiques, en l'établissement d'un lien empiriqueentre les variablesatmosphériques à grande échelle (prédicteurs)et les variablesclimatiquesà petite échelle (prédictants)(Landmanet al., 2001; Tisseuilet al.,2010).Les sortiesissuesdu MCG subissentsouventd'abordune miseà l'échelle (dynamiqueou statistique) localeavantd'êtreprésentéesà I'entréed'un modèlehydrologique en vue de simulerun débit (Evanset Schreider,2002; Fowleret Kilsby,2007; Fowleret al., 2007; Graham et al., 2007a; Graham et al., 2007b:Jasper et al., 2004; Muller-Wohlfeil et al., 2000; Prudhommeet al., 2002; Wilby et Wigley, 2000; Wood et al., 2004). Par la suite, les indicescaractérisant les débits(lH) peuventêtrecalculésà partirdes simulations. Ce cadre de mise à l'échelle,basé sur un modèlehydrologique,permetla conceptualisation et l'évaluationdes liens qui unissentle climat aux ressourceshydrologiques.Certainesétudes récentesont tenté d'établirun lien directentre les variablesclimatiquesà grandeéchelleet les débitsobservés(Ghoshet Majumdar,2008;Philipset al., 2003;Tisseuilet al.,2010).Toutefois, cette approche a été remise en question, car elle ne tient pas compte explicitementde par les modèleshydrologiques (p. ex.: infiltration, I'influencedes processusconceptualisés évapotranspiration, etc.).À la lumièrede I'importance des débitsd'étiageet de l'attentionsans cesse croissanteportéeà la variabilitédu climat,il s'avèreprimordialpour la gestiondes débits d'étiagede favoriserle développement d'outilsd'analysedes conséquencespossiblesdes changementsclimatiques des incertitudes inhérentesà ces sur ceux-ci,ainsi que l'évaluation changements.La présentthèse cherchedonc à comparerI'approchede mise à l'échellebasée sur un modèlehydrologique à I'approche directede miseà l'échellepour la miseà l'échelledes débits d'étiage. L'approchedirecte consiste à établir une relation entre les variables de circulation atmosphérique à grandeéchelleet les indicesde débitd'étiage,alorsque I'approche de mise à l'échellebaséesur un modèlehydrologique allieles sortiesd'un MCG à un modèle hydrologiquevia une mise à l'échelledes conditionsmétéorologiques locales.Ces deux approchesévaluentla mise à l'échelledes indicesqui caractérisent le régimed'étiagede trois rivièresde I'est du Canada. En outre, les changementsobservésdans les valeursde ces lH dans les régimesclimatiquesà venir sont analysésà partirdes projections d'un MCG et d'un MCR. 1 . 1 Le débit d'étiageet la variabilitédu climat Le débit en rivièrerésultedes nombreuxprocessusnaturelscomplexesqui interviennentdans I'ensemble le débitd'étiageest influencépar divers d'un bassinversant.Plus particulièrement, facteurs,notammentla distributionet les caractéristiques d'infiltrationdes types de sols; les caractéristiques hydrauliqueset l'étenduedes aquifères;la vitesse,la fréquenceet le degré de la recharge;les taux d'évapotranspiration dans le bassin;la répartitiondes types de végétation; la topographie;le climat et les effets anthropiques(Andersonet Burt, 1980; Eheart et Tornil, 1999;FREND,1989;Rogerset Armbruster,1990;Walkeret Thoms,1993).Burn et al. (2008) ont tenté de comprendreles traits caractéristiquesdes étiages de six régions du Canada: l'Arctique,la régionmontagneuse, les Prairies,le sud de I'Ontario,le Boucliercanadienet la régionde I'Atlantique.Les résultatsobtenusont révéléune vaste gamme de processusqui ont une incidencesur le débit d'étiagedans les diversesrégions.ll s'avèreque les faiblesréserves d'humiditéconstituentun facteur dominantcommun alors que la fonte de neige et la fonte glaciairesont des processusde contrôlepropresà certainesrégions.Tout en se référantà cette étude,la principalerégionétudiéedans cettethèse est le Boucliercanadien,car elle représente la majeurepartiede I'estet du centredu Canada. Le débit d'étiagedes bassinsde la partienord du Boucliercanadienest régi en fonctiondu taux de rabattementdes réservoirsnaturels (eau souterraineet lacs). Dans la partie sud, la disponibilitéen eau en périoded'étiageest dictée par l'équilibreentre la précipitationet vers la l'évapotranspiration. Dans le nord du Bouclier,le débit d'étiageapparaîtgénéralement fin de I'hiverou au début du printempsalors que dans le sud, il survientà la fin de l'été en raisond'un apportd'eau périodique(qui maintientun certaindébit hivernal)doubléd'une perte par évaporationdans les bassins.Ainsi, la temporalitédu débit d'étiagedans le Bouclier canadienreprésenteune transitionentreles débitsde la fin de I'hiverdans les régionsdu nord, les valeursminimalesdes débitsde la fin de I'hiveret de la fin de l'étédes régionsdu centre,et les débitsde la fin de l'étédans les régionsdu sud du Bouclier. 1.2 Définitiondu domainede l'étiage:Les IndicesHydrologiques D'un point de vue historique,la mise en applicationdes renseignements relatifsau débit d'étiagea pratiquementtoujoursservià la conceptionet au bon fonctionnement de projetsdans un secteurparticulierdu domainede I'eau (p. ex.: serviced'eau public,irrigation,énergie, navigation, industrie). Selon les connaissancesinitiales et les besoins, les séries chronologiquesdes débits quotidienspeuventêtre analyséesde nombreusesfaçons en vue d'en tirer de I'information utile. Par conséquent,il existe toute une gamme de mesureset d'indicesqui permettentde quantifierle débit d'étiage.Dans le cadred'un examenapprofondi, Smakhtin(2001) est arrivé à définir et à estimer divers indicesde débit d'étiage à partir de séries chronologiques de débit. Selon cette étude, le débit annuel moyen (DAM) ou débit median(DM) représentent la limitesupérieuredu débitd'étiage.Diversindicesdescripteurs du débit d'étiage peuventêtre exprimésen pourcentagedu DAM ou du DM. En outre, le débit quotidienle plusfaible,soit le débitminimalabsolu(DMA),constituela limiteinférieure du débit d'étiage.Afin de représentertoute I'amplituded'un débit, de l'étiageaux débits de crue, la courbe des débits classésest utilisée.ll s'agit de la relationentre un débit donné et la probabilitéque ce débit soit égalé ou dépassé.Ce type de courbe peut être créé à partir de diversesrésolutionstemporellesdes donnéesde débit,qu'ellessoientannuelles,mensuelles ou quotidiennes. Par ailleurs,plusieursindicesde débit d'étiagepeuventêtre calculésà I'aide d'une courbedes débitsclassés,par exempleles débitsqui, au coursd'unejournéeou d'un nombredonnéde jours,ont excédé75o/o (Q75(n)),90% (O90(n))ou 95 % (495(n))du temps, où n est le nombrede jours sur lequelle débitest moyenné(Vogelet Fennessey,1994).Des indicescourammentutiliséssont:Q95(1),Q95(7)et Q95(10).O20/O90figureparmiles indices moins courants.Cet indice est interprétécomme étant une mesure de la variabilitédu débit (Arihoodet Glatfelter,1991). En outre, le rapportQ50/Q90peut représenterla variabilitédu débitd'étiagealorsque le rapportinverse(O90/O50)peut être interprétécomme étant un indice de la proportiondu débit provenantdes réservessouterraines,à I'exceptionde ce qui est (Smakhtin,2001). attribuableau bassin-versant Le débit d'étiagepeut égalementêtre représentéà I'aidede la courbe de fréquencedu débit d'étiage(CFDÉ),laquelleprésentela proportiondes annéesau coursdesquellesle débitd'un coursd'eauchutesous un débitdonné.Un certainnombred'indicespeutêtreobtenuà partirde la CFDÉ, I'un des plus courammentutilisésétant le quantileQ;u.Cet indicefait état du débit moyen le plus faibleenregistréau coursd'une périodede n j > jours consécutifsqui correspond à un intervallede récurrence(périodede retour)de < a > années.Aux États-Unisainsi qu'au Canada,les indicesles plusfréquemment utiliséssont les suivants:Qz,ro,Qz,z êt Qao, s (Ouarda et al., 2008)alorsqu'en Russieet en Europeorientale,les indicesles plus répandussont les débits d'étiagehivernauxet estivauxd'une journée et de trentejours (des moyennesou des probabilités de dépassement de 50,80, 90 et 95 % (Amusjaet al., 1988a;Yevstigneev, 1990; Sakovich,1990).L'indicede débit de base (lDB) constitueun autre indice importantdans l'étudedu débitd'étiage.ll s'agitd'un rapportnon dimensionnel définicomme étant le volume du débitde base divisépar le volumedu débittotal.L'lDB peut être estimépour chacunedes (p.ex.: FREND,1989;Gustardet al., annéesétudiéesou pour toute la périoded'observation 1992).Dans les bassinsversantsoù la participation de I'eausouterraineau débit est grande, l'lDB peut s'approcherde 1, mais pour les cours d'eau saisonniers,I'indices'approche davantagede zéro.L'indicede débitde base s'estrévéléun bon indicateurde I'influence de la géologiesur le débit d'étiage.C'est d'ailleurspourquoiil est utilisédans autant d'études régionalesdu débit d'étiage(Beran et Gustard,1977;FREND, 1989; Gustardet al., 1992; Smakhtinet Watkins,1997). Ces dernièresannées, le paradigmedu débit naturelest devenu le postulatau cæur de l'élaborationd'indicescaractérisantI'amplitude,la durée, la fréquence,la temporalitéet la variabilitédes événementsrelatifsaux régimeshydrologiquesnaturels(Poff et al., 1997). De plus,le paradigmedu débitnaturelmet I'accentsur la nécessitéde maintenirou, dans le cas de rivièresaménagées,de retrouverentièrementou en partie,l'éventailde variationnaturelle,au cours d'une même année et d'une année à I'autre,de ces régimesen vue de protégerla biodiversitéindigèneet le potentielévolutifdes écosystèmesaquatiqueet riverainainsi que ceuxdes milieuxhumides(Arthington et al., 1991;Poff et al., 1997;Richteret al., 1996;Richter (lH) ont été et al., 1997;Sparks,1992;Stanfordet al., 1996).Plusieursindiceshydrologiques élaborésdans le but de quantifierles caractéristiques du débitqui sont pertinentes sur le plan généraledes régimeshydrologiques biologique, de décrirela variabilité à l'échellerégionaleou mondiale,et de quantifierles caractéristiques du débitqui seraientsensiblesà diversesformes de perturbation d'originehumaine(Monket al., 2006).Oldenet Poff (2003)ont passéen revue 171 lH définisen fonctionde leur pertinencebiologique. Ces indicesont ensuiteété examinés afin de déceler des redondanceset fournir un certain nombre de recommandationsd'ordre statistiqueet écologiqueen ce qui a trait au choix d'un plus petit nombre d'indices.Non seulement Olden et Poff (2003) ont-ils expliqué une partie importantede la variation des indices,mais ils sont égalementparvenusà réduirela multicolinéarité tout en permettantune représentationjuste des principalescaractéristiques du régime d'écoulement.Dans le cadre d'une autre étude, Monk et al. (2007) ont apporté une mise en garde défendantque les approchesde réductionde la dimensionnalité ne mènent axéessur une analysede corrélation pas forcément à I'identificationdes lH les plus pertinents.À la lumière de ces résultats, Daigleet al. (2011) ont eu recoursà une analysemultivariéeen vue de cerner les indices hydrologiquesqui caractérisentle mieux les régimeshydrologiquesdes cours d'eau de I'est du Canada,particulièrement en ce qui a traitau débitd'étiage. 1.3 Les conséquences de la variabilitéclimatiquesur le débit d'étiage Dans le cadre de son examenapprofondide I'hydrologiedes étiages,Smakhtin(2001)affirme que les étudesqui portentsur les conséquences des changements sur le débitsont climatiques généralement menéesà I'aidede deux approchesdistinctes,soit par I'analysede I'historique des débitsou par I'utilisation de modèleshydrologiquespour étudierles effetsdes scénariosde changementclimatiquepossiblessur le débit.Majercakova et al. (1997,1995)ont eu recoursà I'analysede I'historique des débitset ont remarquéune tendanceà la baissedu débit annuel moyendes coursd'eauen Slovaquie. Arnell(1989)ont égalementutiliséI'historique des débits pour examiner les changementspossiblesrelativementà la fréquencedes phénomènes hydrologiquesextrêmesen Europe.Selon cette étude, les courtes périodesde cueillettedes donnéesont compliquéencore davantageI'identification de tels changementsà partir des données d'observation.Les auteurs concluentque I'approchetraditionnelle selon laquelle I'historiquedes débits constitueun modèleacceptablepour les projectionsfuturess'avèrepeu réaliste. Certaines tentatives ont été faites quant à l'étude des répercussionsdes changements climatiques sur le débitd'étiage(Leithet Whitfield,1998;Nietoet Wilby,2005;Whitfieldet al., 2002; Yue et Pinon,2003). Dans le cadre d'une étude portantsur le débit d'étiagedes cours Whitfieldet Cannon(2001)ont remarqué,en d'eaudu centresud de la Colombie-Britannique, comparantles donnéesde deux décenniesrécentes,une diminutionde la magnitudedu débit d'étiageainsi qu'un changementdans la temporalitédes débitsles plus faibles,lesquelsont maintenantlieu à I'automneplutôtqu'à I'hiver.Yue et Pinon(2003)ont mis en application une procédurepréliminairede décorrélationindépendantedes tendances(frend-freepre-whitening, TFPW en vue d'éliminerI'effetde I'autocorrélation sur le test de Mann-Kendall(MK) dans l'étudedes tendancesdans les donnéescanadiennes de débits.Au seuilde signification 0,05, I'importancedes tendancesdes maximumsannuels,des débits moyens et des minimums quotidiensde 37 stationshydrométriques à traversle pays a été évaluéeà I'aidedu test de MK et de la procédure de décorrélationindépendantedes tendances. L'étude a révélé une tendanceà la baissedes valeursminimalesannuelleset des valeursquotidiennes moyennes dans les sérieschronologiques de trenteans des stationssituéesdans le sud de la ColombieBritannique(C.-8.),près du centredes Prairiesainsi que dans les provincesde I'Atlantique. L'étudea égalementrévéléune tendanceà la haussede ces valeursdans le nordde la C.-8. et au Yukon. Étant donné I'attentioncroissanteportée à la variabilitéclimatiqueet la pertinence portantsur les débitsd'étiagedans la gestiondes ressourcesen eau, des des renseignements recherchesplus pousséess'avèrentrequises,particulièrement en ce qui a trait à la variationdu En outre,la prédictiondu débit débit d'étiagedans un contextede changementsclimatiques. d'étiagedans des conditionsclimatiques non permanentes à des fins d'ingénierie et de gestion 2001). devraitfaireI'objetd'un intérêtplusmarqué(Smakhtin, 1.4 Des modèlesclimatiquesglobauxau climatrégional Les modèles climatiquesglobaux (MCG) constituentdes outils mathématiquesservant à simuler le climat actuel et à effectuerdes projectionsen imposantdes valeurs relativesà l'émissionde gaz à effet de serre et d'aérosols.Ces modèlessont adéquatssur des échelles spatiales de quelques centaines de kilomètreset sont en mesure d'intégrer une grande proportionde la complexitéqui caractérisele systèmemondial.Cependant,ils ne peuventtenir comptedes élémentsde physiographie d'échellelocale,inférieureà leur maillagequi ont une incidencesur le climat régional (topographie,nuages et utilisationdes sols) (Grotch et MacCracken,1991).Par exemple,le modèlecouplédu HadleyCentre,version3 (HadCM3; T u r n e r e t a 1 . , 2 0 0 6 )p r é s e n t eu n e r é s o l u t i o ns p a t i a l ed e 2 , 5 o d e l a t i t u d ee t d e 3 , 7 5 o d e longitude.Or, les simulations hydrologiques du débitmensueldes bassinsversantsdes régions Ainsi, montagneuses nécessitent une résolutionspatialede I'ordrede 0,125" (Salathe,2003). pour comblerl'écartentrele rendementdu MCG à une échellerégionaleet les exigencesdes études d'impact à cette échelle, des schémas d'intégrationdes MCG aux modèles hydrologiques ont été créés. par plusieursélémentsintéressants (Glecik,1986;Schulze, De tels schémasse caractérisent 1997). Dans un premiertemps, les modèlesclimatiquessont élaboréspuis évaluésdans diversesconditionsclimatiqueset physiographiques. lls sont conçus pour supporterdiverses échelles spatialeset processusde représentationset sont facilementaccessibles.Dans un deuxièmetemps,toute une gamme de réponsesaux scénariosde changementsclimatiques peut être modélisée,à partirdes perturbations climatiquesissuesdu MCG (selondiversniveaux de mise à l'échelle:mensuelle,saisonnière,etc.). Dans un troisièmetemps, les modèlesà l'échellerégionalesont plusfacilesd'utilisation aux MCG. Dans un quatrième comparativement temps, ces modèles permettentd'évaluer I'impact sur un bassin-versantde changements climatiqueshypothétiques ou projetés.Par ailleurs,le choixdu modèlepour une étudede cas donnéedépendde plusieursfacteurs,le principalétant la naturedes objectifset les exigences du modèleen termesde données(Ng et Marsalek,1992).Par exemple,pourévaluerla gestion et du des ressourcesen eau à l'échellerégionale,les modèlesde prévisiondes précipitations débit mensuels (bilan hydrique) se sont avérés utiles dans la reconnaissancedes et à conséquenceshydrologiquesde changementsrelatifsà la température,aux précipitations d'autresvariablesclimatiques(Arnell,1992;Mimikouet al., 1991;Xu et Halldin,1997;Xu et Singh,1998).Pour une évaluationdétailléede l'écoulement de surface,toutefois,les modèles conceptuelsà paramètreslocaux sont utilisés(Modèlede calcul de I'humiditédes sols de Sacramento; Burnashet al., 1973). L'intégrationdes schémaslocaux présentecependantcertaineslacunesen ce qui a trait aux (tableau1.1; écartsentrela résolution des MCG et cellerequisepour les besoinshydrologiques Xu, 1999).Les MCG traitentdes processusdont la résolutionhorizontalese situe entre 200 et 600 km alors que les modèleshydrologiquestraitentsouvent des processusse produisantà une échelleinférieureà celle du bassinversant,donc bien en-deçàde celle des MCG. Par ailleurs,les échellestemporellesles plus fiables des sorties issues du MCG sont d'ordres généralement saisonnieret annuelalorsque les modèleshydrologiques à un pas fonctionnent de tempsd'unejournée.De plus,il y a une discordance d'échelleverticaleentreles MCG et les 10 besoinshydrologiques, attribuable à la plus grandeaptitudedu MCG à simulerle climatde la troposphèrelibre que le climat de surface,alors que les modèleshydrologiques dépendent principalementde variablesde surface. Une troisième lacune du schéma d'intégrationdes donnéesissuesdu MCG et de modèleshydrologiques a traitaux capacitésdes MCG à simuler les variablesjugées pertinentesà la modélisationhydrologique(p. ex.: précipitations, ruissellement, humiditédu sol, etc.)(Loaicigaet a1.,1996). Ainsi,il s'avèrenécessaired'obtenir des estimations fiablesdes sortiesdu MCG à une échelle,où les modèleshydrologiques sont utilisés.C'est ce que I'on appelle la mise à l'échelle.À cet effet, il existe deux approches pour mettreles sortiesdu MCG à l'échelle:la mise à l'échelledynamiqueet la fondamentales miseà l'échellestatistique. LI Tableau1.1 Performancesde simulation des MCG en fonction de l'échellespatiale,temporelle,verticaleet des variablesd'intérêt pour la modélisationhydrologique(Xu, 1999). Simulation acceptable Simulationlaissantà desirer Échellerégionale Echellelocale 0à50km Bonne simulation Noncorrespondance des échelles spatiales Echellemondiale 500 x 500 km 50x50km Noncorrespondance des échelles temporelles Moyennesannuelle et saisonnière Moyenne mensuelle Moyennequotidienne Noncorrespondance des échelles verticales 500 hPa 800 hPa Surfaceterrestre Noncorrespondance des variables utilisées Nébulosité Températuredu vent Précipitations Pression atmosphérique Humidité La performance des MCG diminue Influencedes variablessur la modélisation du débit T2 Évapotranspiration Humiditédu sol Ruissellement 1.5 LA MISEA L ' E C H E L L ED Y N A M I Q U E La mise à l'échelledynamiquefait référenceau modèle climatiquerégional(MCR) ou aux modèles à domaine limité (MDL) qui se servent des conditionsà grande échelle et des conditionsaux limiteslatéralesen vue de produiredes sortiesde résolutionaccrue.Les MCG sont utiliséspour tenir comptede la réponsede la circulationgénéraleà un forçageà grande échellealors que le MCR permetde représenterles effetsd'élémentsd'une échelleinférieureà celle du MCG, comme une topographiecomplexe,une couverturevégétalehétérogène,etc. Cela permet d'améliorerla simulationdes éléments régionaux comme la précipitation (Freiet al.,2003),les phénomènes orographique climatiques extrêmes(Fowleret al.,2005a)ou les effetsnon linéairescommeceuxcauséspar le phénomèneEl Niflo(Leunget al.,2003a).La mise à l'échelledynamiqueest un outil importantpour l'étudedes impactsdu changement climatique,car les signes indiquantun changementclimatiquerégionalqui en découlent s'avèrentbien différentsde ceux obtenusà partirdes MCG en raisondu forçageorographique et des répercussionsde I'ombre pluviométrique(Leung et al., 2004). En outre, la mise à l'échelledynamiquepermetd'obtenirune meilleuresimulationdes processusde précipitation qui résultenten de meilleuresreprésentations méso- climatiques, des statistiques climatiques climatiquesplus plausiblesen ce qui a et, par le fait même,à des scénariosde changements traitaux phénomènes à l'échellerégionale(Schmidliet al., extrêmeset à la variabilité climatique 2006). par rapportà la résolutiongrossièredes MCG Bien que les MCR constituentune amélioration pour ce qui est de l'évaluationrégionaledes répercussions des changementsclimatiques, il n'en demeurepas moinsque ces modèlessont grandementinfluencéspar les biaisprovenant la du MCG qui les piloteet I'importance des forçagesà l'échellerégionale,dont l'orographie, couverturevégétaleet le contrasteentre la terre et la mer (Wang et al., 2004). De plus, la variabilité des paramètres inhérents aux MCR constitue une autre source d'incertitude (Hangemannet al., 2004). En effet, des différencesrelativesaux schémas numériques,à la résolutionde la grilleainsiqu'à d'autresparamètresphysiquesdonnentlieu à des simulations différentesdu climatrégional(Bachneret al., 2008).Ces incertitudesont été quantifiéesà I'aide d'une comparaisonde plusieurs MCR. Les projets européens PRUDENCE (Predictionof RegionalScenarios and Unceftaintiesfor Defining European Climate Change Risks and Effects; Christensenet Christensen,2007) et ENSEMBLES(Hewittet Griggs,2OO4)sont d'excellents exemples de cette comparaison.Les MCR sont coûteux en ressourcesinformatiques(Xu, 1999). De plus, une divergencepeut demeurerentre les exigencesd'échellesspatialeet temporelledu modèlehydrologiqueet les sortiesdu MCR. Le cas échéant,il s'avèrenécessaire de procéderà une mise à l'échelledes sortiesdu MCR afin de pouvoirmener des études d'impact(Chenand Knutson,2008).Cettemise à l'échellepratiquéepourchacundes sitesest effectuéeà I'aided'uneapprochestatistique de miseà l'échelle. 1.6 La miseà l'échellestatistique La mise à l'échellestatistiquereposesur la prémisseselon laquellele climatrégionaldécoule d'une interactionentre la circulationatmosphérique ou océaniquegénérale,la topographie régionale,la répartitionentre la terre et la mer ainsi que I'utilisation des sols. Ainsi, le climat régionalest perçucomme étant un processusaléatoirequi dépendd'un régimeclimatiqueà grandeéchelle,lequelest représenté mathématiquement commesuit: R : F{À} ( 1 - 1) Où R représentela variabledu climat régionalou local (prédictant),L représenteune variable climatique à grande échelle (prédicteur)et F représente une fonction déterministe ou qui dépendde L et qui est mesuréede manièreempiriqueà partirde sériesde stochastique donnéesobservées(Coulibalyet Dibike,2OO4). SelonVon Storchet al. (2000),trois hypothèses implicitessont émiseslorsquela mise à l'échellestatistiqueest utiliséeen vue d'évaluerles changementsclimatiquesrégionaux: . Les prédicteursassociésau prédictantlocal doiventêtre reproduitsde façon adéquate par le modèleclimatiqueaux échellesspatialesutiliséespour produirela réponsede la mise à l'échelle.Ainsi,les prédicteursdoiventêtre choisisen fonctionde leur pertinence par rapportau(x) prédictant(s)cible(s)et de la justessede leur représentationpar les (Wilbyet Wigley,2000). modèlesclimatiques . La relationentre les prédicteurset le prédictantdemeurevalideen dehorsde la période d'ajustement . Les prédicteurschoisis doivent être en mesure de représenterl'évolutiondu climat (Busuioe c t a l . , 1 9 9 9 ;C h a r l e se t a l . , 1 9 9 9 b ) . L4 Le choixdes prédicteurs et de leurdomaineconstitueun aspectimportantde la miseà l'échelle empirique.L'exigencede base en ce qui concernele prédicteurest qu'il soit informatif.Or, cette propriétéest déterminéeà l'aide d'une analysestatistique,notammentla corrélationentre les prédicteurset un prédictant.Aussi, un prédicteurpourraitne pas sembler pertinentdans un modèlede mise à l'échellequi porte sur le climatactuel,mais les changementsà venir du prédicteurpeuvent s'avérerd'une importancecapitaledans l'évaluationdes changements (Wilbyet al., 1998).Dansle cadred'uneévaluation exhaustive de 29 prédicteurs de climatiques réanalyses,Cavazos et Hewitson (2005) ont découvert que les prédicteursrelatifs à la circulation(p. ex.: pressionau niveau de la mer) se caractérisentpar de longuesséries d'observations et sont mieux simuléspar les MCG. Cependant,dans la mise à l'échelledes valeurs de précipitation,ces prédicteursne parviennentpas à représenterles principaux mécanismesde précipitation baséssur la thermodynamique et sur la teneuren vapeurd'eau, rendantnécessaireI'ajoutde variablesd'humidité(p. ex: humiditérelative)(Charleset al., 1999). Dans une autre étude portant sur la mise à l'échellede la températureet des précipitations dans le sud du Québec,Canada,Jeonget al (2012imettentI'accentsur le choix des prédicteurs.lls constatentque les rneilleursprédicteursdes températuresquotidiennessont I'humidité spécifique, la hauteurgéopotentielle à différentsniveauxet la température de I'airà 2 m, tandisque la pressionau niveaude la mer et les composantes U et V ont montréun meilleur quotidiennes. potentielen tant que prédicteursdes précipitations Wilby et Wigley (2000)ont égalementdécouvertque la corrélationmaximaleentre la pressionau niveaude la mer et les précipitations ne se trouve pas toujoursentre la stationla plus procheet les pointsdu modèle, et d'étendue ce qui suggèreque le choixdu domainedu prédicteuren termesd'emplacement dont l'échellea été réduite. régitla naturedes scénariosde précipitation ll existe une approcherelativementsimple et courantequi consisteà mettreen applicationles projectionsà l'échelledu MCG en applicantdes facteursde correction(FC). Cette stratégieest appelée < la méthode des perturbations) ou < I'approchedelta > (Prudhommeet al., 2OO2). Les différencesentre la simulationde contrôleet la future simulationdu MCG sont appliquées de baseen appliquantles facteursde correctionclimatiquepourchaquejour. aux observations Seloncetteméthode,on présumeque les MCG simulentde façon plus précisele changement relatif que le changementabsolu. Cette méthode ajuste uniquementles valeurs maximales, minimaleset moyennesdes variablesclimatiques, sanstenircomptede leurétendueou de leur variabilité.On présume égalementque la configurationspatiale du climat actuel restera la I'utilisation de cette même dans le futur. Pour ce qui est des donnéesrelativesà la précipitation, 15 méthode ne permet pas de répondre aux besoins en termes de chronologiedes périodes pluvieuseset sèches, laquelle pourrait s'avérer un élément importantdes changements climatiques(Nietoet Wilby, 2005). Parmi les approchesde mise à l'échellestatistiqueplus sophistiquées,on compte notamment le typage météorologique('weather typing'), les générateursmétéorologiques stochastiques et les modèlesde régression. 1.6.1 Le typage météorologique Le typage météorologique ou les systèmesde classification de la météo associentI'occurrence > donnée au climat local. Les catégoriesmétéorologiques d'une < catégoriemétéorologique peuvent être définiesde façon synoptique,généralementà I'aide de fonctionsorthogonales empiriques(FOE) obtenuesà partirdes donnéesde pression(Goodesset Palutikof,1998), d'indicestirésdes donnéesportantsur la pressionatmosphérique au niveaude la mer (p. ex.: (Fowleret al., 2000;Fowleret al.,2005b) Conwayet al., 1996),d'uneclassification hiérarchique ou encorede l'établissement d'ensembleset de règlesfloues (Bardossyet al., 2002; Bardossy et al., 2005) relativementaux champs de pressionatmosphérique.Les variablesde surface par les situationsmétéorologiques locales,généralement les précipitations, sont conditionnées quotidiennesen dérivant les distributionsde probabilitéconditionnelledes statistiques probabilitéd'une occurrencede précipitation observées(p.ex:p (pluie-pluie), à la suite d'une journée pluvieuseou nombre moyen de jours pluvieux)associéesà une configurationde circulation atmosphérique donnée(p. ex.: Belloneet al.,2000). 1.6.2 Les générateurs (WGEN) météorologiques stochastiques présentent Lesgénérateurs météorologiques éléments en commun stochastiques de nombreux avec les modèlestraditionnelsde mise à l'échelleaxée sur la circulation.Le générateur Richardsonconstitueun exemplede WGEN (Richardson,1981). ll a été conçu en vue de simuler des séries chronologiquesquotidiennes de la quantité de précipitations,des températuresmaximaleset minimalesainsi que le rayonnementsolairedans les conditions par les configurations climatiques actuelles.De plus,au lieu d'êtreconditionnées de circulation, toutes les variablesdu modèlede Richardsonsont simuléesde façon conditionnelle à une quotidiennede la Climate occurrencede précipitation. Le modèlede générationmétéorologique ResearchUnff (CRU) élaborépar Jones et Salmon(1995),puis modifiépar Watts et al. (2004) constitue un second exemple de générateur météo. Ce dernier permet de simuler les 16 précipitations à I'aided'une chaînede Markovde premierordre à partirde laquelled'autres variablessont générées,dont les températuresminimaleset maximales,la tensionde vapeur, la vitessedu vent et la durée d'ensoleillement. Le principaldésavantagedes WGEN a trait à leur conditionnement à partir des relationsclimatiqueslocales.En effet, cela pourraitfaire en sorte que les générateursne puissentpas s'appliquerautomatiquement à tous les climats. Toutefois,la mesuredans laquellecette limiterestreintleur utilitén'a pas encoreété évaluéede façon approfondie. Le rendementrelatifde diversWGEN a été évaluépar Semenovet al. (1998),lesquelsont constaté que le générateurLARS-WG (Long Ashton ResearchStation Weather Generator; Racsko et al., 1991) permet de mieux reproduireles moyennes de températureet de précipitation mensuelleaux États-Unis,en Europeet en Asie que le générateurWGEN en plus complexes. raisonde son plus grandnombrede paramètreset I'utilisation de distributions Par contre, les deux générateursne parviennentpas à modéliser de façon adéquate la variabilitéinterannuelle des moyennesmensuellesni à reproduireles périodesde gel et de grandechaleurétantdonné leur traitementsimplistedu facteurde persistance. Dans le cadre d'une autre étude, Qian et al. (2005) ont évalué les générateursLARS-WG et AAFC-WG (Agricultureand Agri-FoodCanada Weather Generator;Hayhoe, 2000) pour en cerner les le modèle AAFC-WG serait plus efficaceà différencesde rendement.Plus particulièrement, reproduirela distributiondes périodespluvieuseset sèchesque le LARS-WG. 1.6.3 Les modèles de régression Les modèles de régression constituent I'approche la plus répandue pour associer des prédicteursà grande échelleà des prédictantsà l'échellelocaleou régionale.Cette approche de rapportslinéairesou non linéairesentre les élémentsd'échelle comprendl'établissement inférieureau maillagedes MCG (prédictants) et des variablesindépendantes disponiblesà l'échelledu maillageou dont la résolutionest grossière.Les approchesde ce type de mise à de transfert.Les méthodesles plus l'échellevarientselon le choixdes fonctionsmathématiques courammentemployéescomprennentla régressionmultiple(Murphy, 1999), I'analysede corrélationcanonique(Hertiget Jacobeit,2008; Huth,2004)et les réseauxneuronaux(Craneet Hewitson,1998;Von Storch,1999).La relativesimplicitéde mise en application et d'utilisation de relationsdéfiniesentre les variablesd'une échelleà I'autreconstituele principalavantagedu quant au choixdes modèlede régression.Cependant,ses faiblessesont trait à sa sensibilité L7 variablesindépendantes ainsi qu'à la fonctionde transfertet à la présomption de validitédes paramètresdu modèledans de futuresconditionsclimatiques.En outre,la mise à l'échelledes futurs phénomènesextrêmesà I'aidedu modèlede régressions'avèreproblématique,car ces événementsse situentsouventà la limiteou au-delàde I'ensemble de donnéesd'étalonnage. La principalefaiblessede ces approchesest donc qu'ellesne sont en mesure d'expliquer qu'unepartiede la variabilitéclimatique.Or, pour satisfaireà cette exigence,il a été proposé la variancedes valeurspréditesainsi(Karlet al., 1990): d'augmenter (1-2) jucrir;as"' Où 8: ! :"'cr(i-p-ài.r Dans cette équationyaug,ypréo les valeursajustées,prédites êt /oo"représententrespectivement et observées du prédictant.Au lieu d'avoir recours à I'approchepar augmentationde la variance,il serait égalementpossiblede traiter les valeurs < inexpliquées > comme étant e x i s t a n t e si r,r é g u l i è r eest i n e x p l i q u é eesn i n t é g r a nut n b r u i t( V o n S t o r c h , 1 9 9 9 ) : -l- &ruif t!'*p : ]?"ae (1-3) ll existe une différencefondamentaleentre I'augmentationde la variance et I'ajout d'une composantealéatoire.En effet, les statistiquestelles que la corrélationdans I'espaceeVou le tempsdê y^,esontentièrementrégiespar la variationde x (prédicteurs) alorsque )'.{f; présente une variabilitéspatialeet temporellequi n'est régie qu'en partie par la variablex à grande échelle.Wilby et al. (2002)ont élaboréun outil d'aide à la décisionaxée sur la régression multipleappelé le modèle de mise à l'échelle statistique('StatisticalDownscalingModel' ou SDSM).Le SDSM alliele générateurmétéorologique stochastique aux modèlesde régression. ll a été utilisédans le cadrede plusieursétudesportantsur la miseà l'échelleafind'évaluerdes (Dibikeet al., 2008;Gachonet al., 2005;Gachonet Dibike.,2007;Nieto scénariosclimatiques et Wilby, 2005). Un second outil, appelé Outil de mise à l'échellestatistiqueautomatique ('AutomaticStatisticalDownscaling')et basé sur le SDSM a été créé par Hessamiet al. (2008). L'ASD permetune miseà l'échellestatistique automatique comprenantle choixdes prédicteurs et l'étalonnagedu modèle,la générationde scénarioset I'analysestatistiquede ces derniers. Pour ce qui est de la régressionlinéairemultiple,ce modèle permetde réduireles effets de la colinéarité entre prédicteursgrâce à la méthode de régression pseudo-orthogonale(ou 18 méthodede régressionridge).Hessamiet al. (2008)ont opté pour cet outil plutôtque pour le SDSM pour la mise à l'échelledes régimesde températureet de précipitation dans I'estdu Canada.Ni le SDSM,ni ASD n'ontprésentéun bon rendementpourtoutesles saisonset tous les moisétudiés.Toutefois,I'utilisation de plusieursmodèlesde miseà l'échellestatistique et de donnéesprovenantde plusieursMCG pourraitaiderà mieuxévalueret modéliserI'incertitude associéeaux indicesclimatiques. Les réseauxneuronaux(RN) sont de plus en plus utilisésdans le cadredes étudesde mise à l'échelle(Hewitsonet Crane,1994;Hewitsonet Crane,1996;Hsu et al., 1997;Karunanithi et a l . , 1 9 9 4 ;M a r k u s e t a l . 1 , 9 9 5 ;T i s s e u iel t a 1 . , 2 0 1 0 ; Z h u e t a l .1, 9 9 4 ) ,p a r t i c u l i è r e m e n t l o r s q u e l a relationentre les variablesde circulationà grandeéchelleet les variableslocales(p. ex.: les précipitations) est non linéaire(Frenchet al., 1992;Navoneet Ceccatto,1994;Tohmaet lgata, 1994; Zhang et al., 1997). Les réseaux neuronauxconstituentune approche proposée par McCullochet Pitts (1943) pour mieux comprendreet reproduirele fonctionnementdu cerveau humain. En mathématiques, les RN sont souvent perçus comme un outil d'approximation universelle.Comme ils sont capablesde percevoirdes liens entre des configurations données, les RN peuventrésoudredes problèmescomplexesà grandeéchelledont ceux qui ont trait à la reconnaissance de formes,à la modélisationnon linéaire,à la classification, à I'associationet au contrôle.Pour < entraîner> le réseau,une règle d'apprentissage doit d'abord être définie. Les règles d'apprentissage appartiennent à I'une des deux catégories suivantes: I'apprentissagesuperviséou I'apprentissagenon supervisé.En apprentissagesupervisé,la règle d'apprentissageest accompagnée d'une série d'exemples, soit I'ensemble d'apprentissage, de < comportements> adéquats.À mesureque des donnéessont présentées au réseau, les sorties de ce dernier sont comparéesà des valeurs cibles. Ensuite,la règle d'apprentissage est utiliséeen vue d'ajusterles paramètresdu réseaupour faire en sorte que les sortiesdu réseau se rapprochentdes valeurscibles. En apprentissagenon supervisé,les poids et les biais varient uniquementen fonction des entrées du réseau, de façon à les regrouper selon leurs similitudes.ll n'y a aucune valeur cible. Plusieurs algorithmes d'apprentissage ont été proposésafin d'améliorerle fonctionnementdes RN. Avec I'apparition des algorithmesde rétropropagation de I'erreur,les RN sont maintenantlargementutilisésdans les domainesde la neurophysiologie, de la physique,du géniebiomédical, du génieélectrique, de I'informatique, de l'acoustique, de la cybernétique, de la robotique,du traitementde I'image, des finances,etc. De plus, les RN s'avèrentutiles dans des domainesdel'hydrologie, pluie-débit,la prévisiondu débit, la modélisation notammentdans la modélisation des eaux souterraines, la qualitéde I'eau,I'assistance techniqueà l'établissement de politiquesrelatives L9 hydrologiques les sérieschronologiques à la gestiondes eaux, la prévisiondes précipitations, et I'exploitationdes réservoirs (ASCE Task Committee on Applicationof Artificial Neural Networksin Hydrology,2000b). Malgré les avantages qu'ils présentent, les réseaux neuronaux traditionnelscomportent plusieurslacunes,dont le risqueque le réseaureste bloquédans des minimumslocauxet la subjectivitédans le choix de I'architecturedu modèle (Suykens,2001). Afin de régler ces problèmes,bon nombre de nouveauxalgorithmesont été proposés (Neocleouset Schizas, 2002).L'apparitionde RN basés sur un noyaude convolution,appelés< machinesà vecteurde soutien> ('SupportVector Machines';MVS) (Corteset Vapnik, 1995; Cristianiniet ShaweT a y l o r , 2 0 0 0H ; a y k i n , 2 0 0 3S; a s t r y , 2 0 0 3T; r i p a t hei t a | . , 2 0 0 6 ;V a p n i k ,1 9 9 5 ;V a p n i k ,1 9 9 8 )a donné fourni une solution adéquate à ces problèmes.Pour un vecteur d'apprentissage {{",yriËt} ,l'équationde la régressionà vecteurde soutiencorrespondà: y{x,w} : XËrwi x ff{x,,x} + b (1-4) où i{{xg,x} est la fonctionnoyau, ra : {*.q,*2,"..,wx}et *';'s sont les poidsutilisésdans la régression à vecteurde soutien b est une constante(biais) est qu'elletente de La principalecaractéristique de la MVS, dans un contextede classification, réduireI'erreurde I'ensemble d'apprentissage tout en augmentantla margeentredeux classes entraîneune (dansI'espacedéfinipar le noyaude convolution). Celaévitele surapprentissage, généralisation adéquateet assure la parcimoniedu modèle,lequel dépend uniquementde quelquesvecteursprovenantdes exemplesd'apprentissage connussous le nom de < vecteurs majeurssur le de soutien>. Malgréla réussitede la MVS, un certainnombred'inconvénients plan pratiqueont été constatés(Tipping,20Q1): Le nombre de vecteursde soutienrequis augmentede façon linéaireavec le nombre de vecteursd'apprentissage. a Les prédictionsne sont pas probabilistes. a L'estimationdu paramètreerreur-margeimpliqueune étape de validationcroisée,ce qui mobiliseune partiedes donnéeset nécessitedes calculssupplémentaires. La fonctionnoyau doit répondreaux exigencesde Mercer,c'est-à-direqu'il doit s'agir 20 d'un noyau symétriquecontinu d'un opérateurintégralpositif(Smola et al., 1998; T i p p i n g2, 0 0 1 ) . Ces limites sont corrigées par la machine à vecteur de pertinence(MVP). La MVP est simplementun modèlestochastique bayésienspécialiséqui utilisela mêmefonctionde noyau, dépendantdes données,que la MVS. Avec l'apparitiondes méthodesde mise à l'échelle,une approcheà deux étapesa été adoptée dans l'étuded'impactdes changements climatiques sur le débit:(1) Les sortiesdu MCG sont locales,notammenten ce qui a traitaux utiliséesen vue de générerdes conditionsclimatiques précipitations et à la température.On parle alors de mise à l'échelle.(2) Les données climatiques misesà l'échellesont intégréesdans un modèlehydrologique en vue de projeterles changementshydrologiquesen fonctiondu climat futur. Ce cadre appelé < cadre de mise à l'échelleindirecte> fait I'objetde la prochainesection. 1.7 Le cadre de mise à l'échelleindirecte Dans un spaceétudié,I'application du cadrede mise à l'échelleindirectepermetd'intégrerles facteursphysiques(p. ex.: topographie,couverturedu sol, etc.), lesquelsinteragissentavec le climat et influencentle trajet d'écoulement(p. ex.: infiltration,interception,etc.). Ce cadre permetaussi d'évaluerles variationsdu débit en fonctiondu climatà venir (Tisseuilet al., 2010). Toutefois,ce cadre est influencépar certaines incertitudesquant à la structuredu modèleclimatiqueglobalou régional,à I'approchestatistique de mise à l'échelle,ainsiqu'à la structureet au paramétragedu modèle hydrologique.Généralement,I'importanceque revêt chaque source d'incertitude dépend (i) de I'intervalle de temps; (ii) du prédictant;(iii) de la saison;et (iv)de la régionétudiée(Dobleret al., 2012).Plusieursétudesse sont penchéessur ces sourcesd'incertitudeet ont obtenudes résultatsmitigés.Par exemple,Quintana-Segur et al. (2010)ont découvertdes différencesmarquéesparmi trois approchesde mise à l'échelleet de correctionde biais lorsqu'ilsont évalué les impactsdes changementsclimatiquessur I'hydrologiede bassinsde la Méditerranée.Des résultatssemblablesont été constatéspar Stoll et al. (2011), Teutschbeinet al. (2011) ainsi que Chen et al. (2011a).À I'opposé,van Roosmalenet al. (2011)n'ont remarquéque des différencesmineureslorsqu'ilsont comparé les valeursprojetéesdes eaux souterraineset du débità I'aidede deux méthodesde correction de biais.Goslinget al. (2011)ont étudiéles conséquences des changements climatiques sur le 21. débit à I'aide de sept MCG et deux modèles hydrologiquesdistribute.Or, I'incertitude Dans le cadre du MCG s'est avéréesupérieureà celle du modèlehydrologique. structurelle d'une autre étude, Bae et al. (2011) ont analysé les répercussionsdes changements combinésà un certain climatiquesà I'aidede trois modèles hydrologiques semi-distribués peutdonnerlieuà des nombrede MCG. lls ont découvertque le choixdu modèlehydrologique différencesmarquéesquant à la variationdu débit, et ce, avec le même forçage climatique. lorsqu'ilsont constatéune grande Bastolaet al. (2011)en sont arrivésaux mêmesconclusions incertituderelativementaux modèles hydrologiquesdans le cadre d'une étude portant sur quatrebassinsversantsen lrlande.Par ailleurs,Poulinet al. (2011)ont démontréque I'effetde d'un la structuredu modèle hydrologiques'avère plus importantque I'effetde I'incertitude paramètredans le cadred'une étude d'impactdes changementsclimatiquesdans un bassinversantoù la neigeprédomine. Davisonet Kamp (2008)ont étudiéla capacitéde six modèlesutiliséspour modéliserle débit d'étiage.Les processusrelatifsà I'eau souterraine,aux milieuxriverainset aux canaux et qui ont une incidencesur le débitd'étiageconstituaient le cæur de l'étudeplutôtque les processus comme le ruissellementde surface et l'écoulementhypodermique,lesquels interviennent principalementdans les débits de crue. L'étude a permis de conclure qu'une révision approfondiede la représentationdes processus physiques qui régissent le débit d'étiage s'avèrenécessaire.De plus,chacunde ces processusdoit être examinéplus attentivementafin de trouver une façon de le paramétrer.En outre, lorsque I'eau souterrainejoue un rôle prépondérant dans le débitd'étiage,il est recommandé de combinerles modèleshydrologiques aux modèlesd'eauxsouterraines. 22 2 PROBLEMATIQUE ET OBJECTIFSDE RECHERGHE L'enjeu que représententles répercussionspossiblesdes changementsclimatiquessur le régime hydrologiquedes rivièresa beaucoupété étudié, mais le débit d'étiagefait rarement l'objetde tellesétudes(Smakhtin,2OO1).La plupartdes étudesont trait à la mise à l'échelledes valeursdu débità I'aided'un modèlehydrologique et au calculdes valeursextrêmesde l'étiage à partir des valeurs dont l'échellea été réduite (p. ex.: les périodesd'étiage de sept jours (Maureret al., 2010)ou I'indiceQ95 (débitexcédé95 % des jours (Nietoet Wilby,2005))).Ce cadrede mise à l'échelleà deux étapesappelé< approcheindirectede mise à l'échelleu (AI), pourraitêtre limité par I'incapacitédes modèles hydrologiquesà saisir les processusqui régissentle débit d'étiage,les incertitudesrelativesà l'étalonnagedes modèleshydrologiques et la mise à l'échelledes variablesdu climat local intégréesdans ces modèles(Davisonet Kamp, 2008; Fowler et al., 2005). ll est égalementpossibled'aborderle problèmeque représententces sources d'incertitudeen établissant un lien direct entre les variables atmosphériquesà grande échelle et les indices hydrologiquesdu débit d'étiage. Cette approche,appelée< approchedirectede mise à l'échelle, (AD) fait souventI'objetde critiques en raisond'une simplification excessivedu cycle hydrologiqueet parceque cette approchene tient pas suffisammentcompte des réservesen eau et des échangesentre le sol et l'eau souterrainedes bassinsversants (Xu, 1999). Malgré tout, cette approchea déjà été choisie pour procéderà une mise à l'échelledes valeursdu débit obtenuesà partirdes prédicteurs atmosphériques à grande échelle (Cannonet Whitfield,2002; Ghosh et Majumdar,2008; Phillipset al., 2003).De plus,dans le cadre d'une étude portantsur les répercussions de la variabilitéclimatiqueà grande échellesur le débit d'étiageau Canada,Bonsalet Shabbar (2008)ont constatéque le faibledébitdes coursd'eaudes régionscôtièresde I'estdu Québec présente une corrélationpositiveavec le mode annulairenordique ainsi qu'une corrélation négativeavec le phénomèneEl Niflo-oscillation australeet la téléconnexionPacifique-Amérique (PNA) avant les années 1970. Toutefois,après cette période, la corrélationest devenue positive.Ces résultatsencouragentI'explorationde I'approchedirecte de mise à l'échelledu débit d'étiageà partirdes prédicteursatmosphériques à grandeéchelle.À la lumièrede la pertinence et de la rareté des études portant sur les répercussionsdes changements climatiquessur le régimeà l'étiage,les objectifssuivantsont été choisispour de cettethèse: 23 Comparerles cadres de mise à l'échelledirecte et indirectequant à leur capacitéà expliquer la variabilitédes indices hydrologiquesqui décrivent les caractéristiques d'étiagede troiscoursd'eaudans I'estdu Canada. Comparerle rendementdes modèlesstatistiquesutilisésen vue de mettre à l'échelle des indiceshydrologiques de débitd'étiageselonI'approchedirectede mise à l'échelle indirectede miseà l'échelle. et des variablesclimatiques localesselonI'approche Prédireles indiceshydrologiques du débit d'étiagede périodesfuturesen tenantcompte des forçagesimposéspar des modèlesclimatiquesmondialet régional. 2.1 Originalitédu projetde recherche Tel que mentionnédans I'introduction, il existebien peu d'étudesd'impactdes changements climatiquessur le débit d'étiagecompte tenu de son importancedans plusieursdomaines d'applicationliés aux ressourcesen eau. Le caractèreuniquedu présentprojet résidedans la mise en applicationd'approchesde mise à l'échelledirecte et indirectedes indicesde débit d'étiagepossiblementpertinentssur le plan biologique.Une revue de la littératurerévèle que jusqu'à present, I'approchedirecte n'a pas été exploréede façon aussi exhaustiveque les particulièrement approchesindirectes, en ce qui a traitau débitd'étiage.En outre,la plupartdes approchesindirectes un calcul de miseà l'échellequi portentsur le débitd'étiagecomprennent des indicespertinents(obtenusà partirde CDC ou de CFDÉtellesque Q95, Q90, etc.)à partir d'unesimulation du ruissellement. L'utilisation de la MSABet de la RLM dans la miseà l'échelle des indiceshydrologiques choisisconstitueégalementune nouveauté.Quant au choix des prédicteursà I'aidede la programmation génétique(PG) dans I'approchedirectede mise à l'échelledes variablesclimatiques locales,il s'agitégalementd'uneméthodequi n'a jamaisété évaluéeauparavant. 24 3 PLAN DE MISEEN APPLICATION La sectionqui suit décritles diversélémentsdes approchesde mise à l'échelleévaluéesdans le cadre de la présenteétude. La premièresous-sectiondécrit les modèlesstatistiquesutilisés pourla miseà l'échelledes lHs dans I'approche directeet pour la miseà l'échelledes variables météorologiqueslocalesdans I'approcheindirecte.La secondesous-sectiondécrit le modèle hydrologiqueutilisédans I'approcheindirecte.La troisièmesous-sectiondécritle cadre de mise à l'échelle.La quatrièmesous-sectiondécrit les indicesde performanceutiliséspour I'analyse quantitativedes résultatsdes deux approches.La cinquièmesous-sectiondécrit les modèles globalet régionalutiliséespour prédireles indiceshydrologiques climatiques du débitd'étiage de périodesfutures 3.1 Modèlesde miseà l'échellestatistique Les modèlesstatistiqueschoisisen vue de mettreà l'échelleles indiceshydrologiquesde débit d'étiagede I'approchedirecteet les variablesclimatiqueslocalesde I'approcheindirectesont respectivementla méthode stochastiqued'apprentissagebayésien (MSAB) et la régression linéairemultiple(RLM). La MSAB est mise en applicationsous la forme d'une machineà vecteurde pertinence(MVP; Tipping,2OO1)et la RLM sous la forme d'un outil de mise à l'échellestatistiqueautomatique(AutomatedStatisticalDownscaling,ASD; Hessamiet al., 2008). Pour la mise à l'échelledes précipitations, la méthodePG sert à la sélectiondes prédicteurs.Les formulationsmathématiquesdes modèles(MSAB, RLM et PG) sont décrites dans la sectionqui suit. 3.1.1 Apprentissage Bayésien (AB) qui tiennent La théoriede probabilitébayésiennevise à concevoirdes modèlesprobabilistes préalables portantsur le phénomèneétudiéainsique des données comptedes renseignements en vue d'établirdes prédictions optimalesà I'aidede ces modèles.Selonla règlebayésienne, la probabilité du modèleHl conditionnelle à la donnéeD (p(H1lD)) s'exprimeainsi: 25 p{& ls} oep{Ifr}p{Fiifr} (1-5) p(H1) représentela plausibilitéa priori de Hr alors que p(DlH1) renvoie aux prédictions effectuéespar le modèle relativementaux données. Le cadre bayésien présente plusieurs avantages (MacKay, 1994). Tout d'abord, une fois I'espace modèle défini, le théorème de Bayes sur la probabilitépermet d'obtenirune réponse unique qui tient systématiquement préalablesportantsur le phénomèneétudiéainsique de ceuxtirés comptedes renseignements des donnéesobtenues.Ensuite,I'inférencebayésiennerépond au principede vraisemblance (Berger,1985) selon lequel les inférencesne dépendentque des probabilités imputéesaux donnéesreçueset non aux propriétésdes autresensemblesde donnéesqui auraientpu se réaliser,maisdont ce n'estpas le cas. De plus,la comparaison des modèlesbayésiensincarne le principemêmedu rasoird'Occam,soit le fait de privilégier les modèlesles plussimples. 3.1.1.1 Modèlede régressionparcimonieux Pour obtenirun modèlede régressionparcimonieux(Tipping,2001).,nous devons chercherà prévoiry en fonctionde x selon l'équationsuivante: y:ftx,wi+.:*r#+€ (1-6) Dans cette équation, s*'*lf{Û,o:/ et *+:: {w6,u:1,..., *+'*r}représenteun vecteurde poidset la matricede conceptionde M x (M+1) avec * : {*{xr},*txz},..., *{.rÆ}jr (1-7) ou *{x, } : i1, ff {x;,r r}, K {x u,x r}, ...,ff {-r;,x,1gfitet Jf{tt,&J constituentdes fonctionsnoyauxpourj=1, 2,...,M. Ainsi, une fonctionde base est définie pour chaque exemplede x: (où i=7, 2,...M) dans I'ensemblede données.La machineà vecteurde pertinence(MVP) est en fait une MSAB spécialiséequi a recoursà la même fonctionnoyaude base, dépendantedes données,que la 26 machine à vecteur de soutien (MVS). Dans le présent projet, la fonction noyau gaussienne suivanteest utilisée: r r:Jr = er? /lnr rur, l,.r-xii::1 ,"" I (1-8) La vraisemblance de I'ensemble de donnéesest expriméeà I'aidede l'équationsuivante: ptylw,#): {::ro:3-T..t{-ijt#} (1-e) L'estimationde la vraisemblancemaximale de ur et de oz entraîne souvent un sévère surajustement. Pour limiterla complexitéde la fonctionde vraisemblance, une contrainteest préalablement imposéeaux paramètresw. ll s'agitlà d'une information a prioriqui contrôlele caractèregénéral du système d'apprentissage.Généralement,des hyperparamètres* sont utiliséspourcontraindre la distribution a priorigaussienne de probabilité des poidsw: = }Jfo:f{wglt,si 1} p{."w1æ} ( 1- 10 ) Une telle représentationimpose une préférencepour les fonctions moins complexes.Pour compléterla hiérarchisation a priori, on définit les hyperloisa priori de æ des caractéristiques ainsi que la variancedu bruit (d). Ces valeurs constituentdes exemplesde paramètres par exemple,Berger,1985): d'échelle. Ainsi,les loisa priorisontdes loisgamma(consulter, et ou p{æ}= ffpç Ca*rna{o;lo,b} ( 1 - 11) p{-s}:Gc'mntaffile,d} (1-12) S:s-:et &*mm*{u1l s, b} : F {a}-L b* ua-1 *-bu f n: {î *-1e-rdr (fonctiongamma). Dans le cas de lois a priori soient non-informatives, les paramètresse voient accorder une f a i b l ev a l e u r( p . e x . a : b = c : d : 1 û - { . ) . E n d o n n a n ut n e v a l e u rn u l l eà c e s p a r a m è t r e isl , (sur une échellelogarithmique). est possibled'obtenirdes hyperloisa propriuniformes Comme toutesles échellessont equi-vraisemblables, les résultatsne dépendentdonc pas de I'unitéde mesure des valeurscibles.Ainsi, selon la règle de Bayes, il est possiblede calculerles inconnuesa posterioriàpartirdes distributions a priori définiessans valeurinformative: 27 p{*,u"*t[yJ: p{yl*,a,o}p{w, (1-13) n,ot}f f p{y[*,*,*t]p{*,rr,o:ldwdadoz p(w,rr,62lyi à partirde cetteéquation,car on ne ll n'estpas possiblede calculerdirectement peut évaluerl'intégralede droite.On décomposedonc la loi a posterioriainsi. t*tt,s,r t t ly] : ptwly, n, ozlp{a,* [y] (1-14) En outre,la distributiona posferioriducoefficientde pondérationpeut être expriméeainsi p{w[y, &, s1 : {p{y[r.r,ç"3ptwla]] fpLvlu,"t] : {t;r}-{s+:}iz}fl-ti'rexp {r-L/z{,* - }r}rI-ri* - *i} (1-1s) Dans cette équation,la covariancea posteriorietlamoyennesont: g : {o-:tFT+ +,+1-1 ;r : o-?E@Ty (1-16) O ù A e s t d é f i n ic o m m eA = d i a g ( a 6 " c 1 , . . . , & wA3i.n s i ,s i I ' o nc o n s i d è r el e s é q u a t i o n s( 1 - 1 4 )e t (1-15),le problèmese résumeà trouverI'hyperparamètre a posteriorile plus probable,ce qui revientà maximiserp{æ,oz[y] * p{ylæ,o2}pto)ptnt} tenantcomptede a et *e û ?. Pour "n ce qui est des hyperloisa priori,il est nécessairede maximiserle termepfolcr,n], lequel grâceà l'équationsuivante: s'avèrecalculable { ptyla,,sn) : j v{xl*,r2}p{w[a]dw : {zzr}-#ttlnt l + e.a-l ot !-tlt*op t-Lf?sr {62I + &A-Lqt}-ty} (1-17) Les modèlesbayésiensqualifientl'équation(1-17)de fonctionde vraisemblance marginaleet sa maximisation de maximum de vraisemblance de type ll. Par ailleurs, pour maximiserp{tlu",#},une approche par gradient est utilisée. Pour æ, on procède à la différentiation de l'équation(1-17) qui doit être égale à zéro et un réarrangementdes termes donnelieuà l'équation suivante: : yils:7 c{f;oar"*ar: 28 (1-18) Dans cette équation,p; correspondau r'-ièmecoefficientde pondérationmoyen a posteriori obtenuà partirde l'équation(1-16).De plus,les valeursde y; peuventêtreexpriméesainsi: (1-1e) Xi:1-ëilf,; Dans cette équation,ff;; représentele r-ièmeélémentde la diagonalede matricede covariance du coefficientde pondérationa posterioride l'équation(1-16), calculé à partir des valeurs actuellesde q et de s3. Chaquey; Ë [t,1] peut être interprétécomme étant la mesure de la w;. Quant à la variancedu bruit,la déterminationpar les donnéesdu paramètrecorrespondant différentiation entraîneune nouvelleestimation: = | lt - oerll 1or)nouveau -iir'r - (1-20) L.y,) dans laquellele M du dénominateur indiquele nombrede pointsde données.Le résultatqui découle de cette optimisation,soit la maximisationde ptyls.,crsl est que de nombreux élémentsde s tendent vers I'infini,et donc que yy ne présenteque quelquescoefficientsde pondérationnon nuls, considéréscomme des facteurspertinents.Pour un nouveau point de référencex",la distributionprédictiveest représentéepar l'équationsuivante: p{y- [y, exgp,tïcp] : f p{y, [*, tlro]p{*[Y, daçp,oâ"]d* Comme les deux termes de la fonction à intégrer sont gaussiens,il est facile de calculer I'intégratede cetteéquation: pfuruly,a p r, oluu) : trf{y, If ,, 4} avec f": (1-21) (1-22) îtt &{*") o3:oâr*É{:*,}rE*t*.) Ainsi, nous obtenons la moyenne prédictiveftx,,ft} ainsi que la varianceprédictivequi correspondà la somme de deux composantesde variance,soit le bruit prévu relativementaux données ainsi que celui attribuableaux incertitudesdans la prédictiondes coefficientsde pondération. 29 3.1.1.2 M o d è l e d ec l a s s i f i c a t i o np a r c i m o n i e u x L'algoritmedécrit dans cette sous-section(Tipping, 2001) est utilisé pour classifier les précipitations binaireest de prévoir en journéeshumideset sèches.L'objectifde la classification la probabilitéa posteriorid'une entrée donnéex de catégorie0 ou 1. D'ailleurs,il est possible d'utiliserla fonctionlogistique f{Y} : Ll{'t"+ e-stt (1-23) en vued'établirun lienavecla probabilité a posteriori nt, | I'tr* l)'*J \ : { ri \ \t. \f LYpl_,! 1 f- - \ 'l\1-.",l (1-24) F( r, r \-, t1r r ll s'agit là d'une distribution de Bernoullià deux classesde r* € {t,1} pour une valeurcible donnéequi équivautà 3'"*= T{.F*,w3et définiepar la somme du coefficientde pondérationet des fonctions noyaux de base {K{".x^,xi}}ff=1pour une série d'échantillons d'apprentissage, {x*1ff=0, soit )r{r*, ilr} : ws i Ei{r w,ff{r* , x,} (1-25) où rsr: ft4.1,*{:s,....r,rsçJrreprésente les coefficientsde pondération.En outre,la vraisemblance t : {\,t7,".-,tw}r correspondant d'uneséried'indicatrices à {x*}S=1eStensuitedéfinieainsi: P{t[w]: fl*=, f tyt**,w]]'* t{x - f{t{x*,w}}11-r* (1-26) Cependant,contrairementau modèlede régression,les coefficientsde pondérationne peuvent être introduitsde façon analytique.C'est pourquoiles expressionsfermées du coefficientde pondérationa posteriorip{wlt,u} ou fonctionde vraisemblancemarginalep(tla) ne sont pas Pource qui est des acceptées. Ainsi,il convientd'avoirrecoursà une méthoded'approximation. valeurs actuelleset fixes de s, les coefficientsde pondérationles plus probables$fup sont trouvéset conséquemment, ils donnentla positiondu mode de distributiona posteriori. p{s,[t, æ] acF{t[*r]p{*To3 (1-27) Celarevientà calculerla valeurmaximale,par rapportà w, de : tag{P{t[rir]e{*tsr}} : Efl=rfr* l*gy,,+ - }.*}] {t - t,*} log{x | *'a* 30 (-28) quadratique La méthodede Laplaceconstitue simplement une approximation du logarithme a posterioriautour (1-28)est dérivéeà deuxreprisespour de son mode.Par ailleurs,l'équation donnerl'équation suivante: v*v*.{og p{w[*, a] l*r*" : -{+rs'* Dans cette dernièreéquation,g: #o, : f{:'i"*i}[t +,4} (1-2e) dis7t\r.,F=,...$*)représente une matricediagonaleet - f fu'{**}}]. Cette matrice est ensuite rendue négative, puis inversée, gaussiennedes poidsa posterioricentrées résultanten la covariancef pour une approximation gaussienne,les hyperparamètres SUr!{-xp.À I'aidedes statistiquesf et u:*rode I'approximation q sont mis à jour à partirde l'équation(1-16),et ce, de la même manièreque pour le modèlede régression.Pour ce qui est du mode de piwlt,crj, en se basantsur l'équation(1-29)et sur le fait que V*?"*gp{wit,a) l,.ur : 0, on obtienL -l g : {.*r8.r+d}-1 (1-30) - w*sp=E{FrBt ) Comparativementà l'équation(1-16), on constate que I'approximation de Laplace fait correspondrece problèmede classificationà une régressionavec un bruit dépendantdes - f {yir*}}1. données(hétéroscédastiques, dont la variancepour €m est de fi": f ttt**];lt 3.'1.2Régressionlinéairemultiple(RLM) La RLM exprimeles prédictantssous forme d'une combinaisonlinéaire.Ainsi, le modèlede RLM peut être représentéà l'aidede la fonctionlinéairesuivante: Y ,: F o i F J t r . " i FrX,"+ a, (1-31 ) p o u ri = ' ,t 2 , . . . , M . Les su représententle bruit aléatoireindépendantpar hypothèseff{û,F:}, les Xi sont des prédicteurset { est un prédictant.La RLM est implantéedans I'outilde mise à l'échelle statistiqueautomatique(ASD; Hessamiet al., 2008) sous la forme de deux méthodesde sélectionde prédicteurs,soit la régressionmultipledescendanteet I'analysede corrélation partielle.Le présentprojeta eu recoursà la régressionmultipledescendante,laquelleconstitue 31 une méthode systématiquepermettantd'éliminercertains termes d'un modèle multilinéaire jusqu'àce que les termesqui restentsoientpertinentssur le plan statistique.La méthodeutilise d'abordun modèleinitial,puis comparela capacitéexplicativede modèlesde plus en plus petits.À chaqueétape,la valeurp d'unestatistique F est calculéeen vue d'évaluerles modèles avec ou sans un terme donné.En outre,le test F partiel,qui peut être utilisépour ajouterun prédicteurà une équationqui contientdes variablesq-7 ou à éliminerun prédicteurqui contient des variablesq: F : {ft; - Rn'-ri[o- q - r]lt1- Ë;t ( 1- 32 ) or), n correspondau nombred'observations, Ën ef&ç-r sont des coefficientsde corrélationentre la variablecritèreet l'équationde prévision, lesquelsprésententrespectivement des variablesq eI q - 1. Par ailleurs,si un terme n'apparaîtpas dans le modèle,I'hypothèsenulle veut que le terme présente un coefficientde zéro s'il est introduit dans le modèle. Or, si les preuves sont suffisantespour rejeterI'hypothèsenulle,alors le terme est ajoutéau modèle.Inversement,si un terme apparaîtdans le modèle,selon I'hypothèsenulle,ce terme présenteun coefficientde zéro, mais si les preuvesne permettentpas de rejeterI'hypothèsenulle,alors le terme doit être retirédu modèle.La marcheà suivreest la suivante: 1. Ajusterle modèleinitial. 2. Si un terme qui n'apparaîtpas dans le modèle présenteune valeur p inférieureà la valeurcritique,c'est-à-dires'il est peu probableque son coefficientsoit de zêro s'il était introduitdans le modèle,alors le termedont la valeurp est la plus faibleest ajoutéau modèle,puis cetteétapeest répétée.Si cela ne s'appliquepas, passerà l'étape3. 3. Si un termedu modèleprésenteune valeurp supérieureà la valeurcritique,c'est-à-dire s'il est peu probableque I'hypothèsedu coefficientnul soit rejetée,alors le terme dont la valeurp est la plusélevéeest éliminédu modèleavantde passerà l'étape2. Si cela ne s'appliquepas,cetteétapemarquela fin de la procédure. 3.1.3 Algorithme génétique pour la mise à l'échelle des précipitations L'algorithmegénétiqueest une méthodequi permetde résoudredes problèmesd'optimisation avec et sans contrainte.ll est basé sur les principesde la sélectionnaturellequi est à la base de l'évolutionbiologique.Pour ce faire, une premièresélectionaléatoired'une populationde 32 programmes(ou fonctionsmathématiquesreprésentéespar une structurearborescente)est faite, puis les branchesles plus performantesde cet arbre sont combinéesafin de produirela générationsuivante.Ce processusest répétéjusqu'à ce qu'une populationcontienneles fonctions mathématiquesqui peuvent accomplir la tâche d'estimationadéquatement.Le programmeGPTIPS (https://sites.qooqle.com/site/qptips4matlab/) a été utiliséafin d'accomplir cette partiedu projet. GPTIPSutiliseune méthodeuniquede régressionsymboliqueappeléemultigène(Hinchliffe et qui al, 1996).Cetteapprochefait évoluerdes combinaisons linéairesde fonctionsnon-linéaires 'd'arbres transformentles intrants.Typiquement,une population mathématiques'représente y de taille Nx1 à partird'une des fonctionsqui estimentun vecteurde variablesdépendantes matrice(n x M) d'intrantsX où N est le nombred'observations de la variabledépendantequ'on cherche à estimer et M est le nombre de prédicteurs.La /"'" colonne de X inclut N valeurs d'intrantspour le r"'" prédicteuret peut être désignée par xi. Dans le cas de la régression symboliquemultigène,chaque modèlesymbolique(et chaque membrede la population)est une combinaisonlinéairepondéréedes sortiesd'un certainnombre d'arbresgénétiqueset 'gène'.Par chacunde ces arbresest l'équivalent d'un exemple,le modèlemultigènede la figure 1.1 estime une valeur à partir des intrantsx, y, et z. Cette structurede modèle contientdes termesnon linéaires(parexemple,une tangentehyperbolique), maisa une structurelinéaireen ce qui a trait aux coefficientsa6,âr ànd â2.En pratique,I'utilisateur spécifiele nombremaximum de gènes G,", permispour un modèleainsi que la profondeurmaximalede I'arbreD,u,, de manièreà permettrede limiterla complexitédu modèleévolué. 33 . sqrt{a}} =âû* ar{{S.5.x}+tanh{y*e}} * au{{x+y} M*dêleMutrtigène F i g u r e1 . 1 Un modèle multigène pseudo-linéaireavec variable dépendante Y et prédicteurs x, y and z. Les coefficientsaa a1and âz sont obtenus automatiquementpar MVP and ASD. Pour chaque modèle, les coefficientslinéaires sont estimés à I'aide des données d'entraînement et les fonctionsdu ASD et du MVP.Conséquemment, le PG multigènecombine la puissancede la régressionlinéaire classique avec la possibilitéde représenterun comportementnon-linéairesans avoir à spécifierla forme de ce dernier au préalable.Les étapesde l'algorithmesont présentéesci-dessous: 1 . L'algorithme DansGPTIPS, débuteen créantune populationinitialetiréealéatoirement. cette populationinitialeest construiteen créant des individiuscontenantdes arbres de programmesgénétiquespossédantavec entre 1 et G,", gènes. 2 . L'algorithmecrée ensuiteune séquencede nouvellespopulations.À chaque étape, I'algorithmeutilisedes individusde la générationactuelleafin de créer la prochaine 34 population. Les étapes suivantes sont nécessaires à la création d'une nouvelle population: a. Chaquemembrede la populationactuelleest un intrantaux algorithmesMSAB et RLM et on leur attributune valeurd'un indicateurde performance calculé commesuit: fifnessr;* : ffa.y * ffo,*, - {run-u - #**.)= (1-33) où lfx,y et ffo.u, sont respectivementles nombres de jours secs et humides correctementclassifiéspar le modèle. Le terme {#*-:0,- ff**o}t pénalise les combinaisons ayant une seulede ces deux proportionsbien estimée,alorsque I'autreestimationest mauvaise.Pour la quantitéde precipitation, I'indicateur de performanceest: /i*ness*n = wea.rlt*.bsiÛ- Fi) (1-34) Où O et P sont les quantités de précipitationsobservées et simulées, respectivement. b. Sur la base de ces indicateursde performance,les 'parents' sont sélectionnés. c. Les individusde la populationayant les meilleursindicateursde performance sont passésdirectementà la générationsuivante(reproduction directe) d. La progénitureest crée à partirdes parentssoit en procédantà un changement figure1.2),soit par l'échangede gènes aléatoirechez un des parents(mutation, 'crossover', entre les deux parents(transfert,ou figure 1.3). e. Les enfantsdeviennentles parentsde la générationsuivante 3. Les opérations sont répétées jusqu'à I'atteinted'un critère d'arrêt. ll s'agit d'une combinaisonde bonnesperformancesavec une valeur maximalede frf*ess"g,*dê 2 et un minimalepourf!ârzess,*n de 0. Le nombremaximumd'itérationsa été fixé à 100. 35 Individu Original I' /'--}, \:) ,w,. "r*z æ'æ I û '*-j ,-t-u )-... L-.. fndividu Muté .æ. '"* ,r,æ... æ& a "e3{* æ{* a oo 'tr1':e' F i g u r e1 . 2 Deux différent types de mutations. L'arbre du haut est I'original. En bas à gauche, on a la représentation d'une mutation d'une seule branche terminale (3) par une autre branche terminale (a). C'est aussi une représentationd'une mutation d'une seule fonction (-) pour une autre fonction (+). L'arbre en bas à droite illustre un remplacementde toute une arborescence par une autre. 36 Parents '-w' ,X"{& ææ3 e €] c-ræ t, ''-f ,J) ù R éà Enfants Ça"qt? &. {& * *i* Figure 1.3 ? æq ,4. oo Opération de transfert dans I'algorithme génétique. Les sélections en gras pour les deux parents sont échangéespour créer les enfants. 37 3.2 Modèlehydrologique Le modèlehydrologique utiliséen vue de simulerun débit porte le nom de modèleSSARR (synthèsedu débitet régulation guided'utilisation du réservoir; du SSARR,1991).Le SSARRa d'abordété conçuen vue de répondreaux besoinsde la divisiondu PacifiqueNord du Corpsof qui cherchaità produiredes simulations Engineersde I'arméeaméricaine, hydrologiques sur le plan mathématiquepour une analyse des systèmes nécessairesà la planification,à la Le SSARRest un modèle conceptionet au fonctionnement des aménagements hydrauliques. numériquede I'hydrologie d'un bassin-versant. Le débitest simuléà un exutoireen évaluantles précipitations, I'accumulation de neige et la fonte de la neige.Dans I'ensembledu bassin,le débit peut être synthétisé en simulant les répercussionsdes voies d'écoulement,des dérivationsainsique de la régulationet de la retenuedu réservoir. Les donnéesd'entréerequisespourle fonctionnement du modèlesont les suivantes: Donnéescaractéristiques non variables:ces données portentsur des caractéristiques physiquescommeles zonesde drainage,la capacitéde retenued'un réservoirainsique qui ont une incidencesur le débit. les caractéristiques du bassinhydrographique Conditionsinitiales:ces donnéesprécisentles conditionsactuellesde tous les indices de ruissellement des bassinshydrographiques, le débitdu segmentde chaquetronçon du coursd'eau,de même que l'élévation et le débit sortantinitiauxdu réservoirou du lac. Donnéesvariablesdans le temps: ces donnéescomprennentdes donnéesphysiques expriméessous forme de séries chronologiques(p. ex.: précipitations, températurede I'air,donnéesrelativesau débit,donnéesrelativesà la régulationdu réservoiret autres élémentshydrométéorologiques). Diversesdonnées relativesà I'exécutiondu modèle: ces données précisentcertains élémentsdont la périodede calcul totale, les intervallesentre les voies d'écoulement particulières ainsique des instructions-machine servantà la gestiondes sortiespapieret des autrespossibilitésrelativesaux entréeset aux sorties. 38 SSARRcomprenddeux principaux sous-modèles: . Le sous-modèle du bassinhydrographique ./ moduleintégrépar bandesde neigehomogènes ,/ modulede la courbede régression o Le sous-modèlede régulationdu réseauhydrographique et des réservoirsconceptuel. Le sous-modèledu bassinhydrographique a recoursaux précipitations, à la températureainsi qu'à d'autresvariableshydrométéorologiques pour simuler le ruissellementdans le sousmodèlede régulation du réseauhydrographique. Le moduleintégrépar bandesde neigehomogènesdivisele bassinen un certainnombrede bandes ou de zones de même élévation.Chaque bande est ensuitetraitéecomme si elle qui lui sont constituaitun bassin hydrographique distinctqui présentedes caractéristiques propres.Le modulede la courbe de régression,quant à lui, comportedeux possibilités: le bassinuniqueet le bassindivisé.Le bassinuniquetraitele bassinen entierde même que les précipitations et la couverturede neigequi y sontassociées,tandisque le bassindivisésépare le bassin hydrographiqueen deux régions,soit celle couvertede neige et celle exemptede neige. La principaledifférenceentre le module intégrépar bandes de neige homogèneset le modulede la courbede régressionrésidedans le fait que le premiertient un inventairedes paramètresrelatifsà l'équivalenten eau et à I'humiditédu sol, et ce, pour chaque bande d'élévation.Ainsi, le module intégré par bandes de neige homogènestient compte des variations de température,des précipitationset d'autres paramètres météorologiquesen fonctionde l'élévation.Quantà la courbede régression,elle traitele bassin-versant comme une entité et réduit les régions couvertesde neige en fonctionde I'accumulationsaisonnièredu ruissellement.Dans le cadre du présent projet, le module intégré par bandes de neige homogènesa été utilisé. Le modèlede régulation et du réservoirfait circulerI'eaude I'amont du réseauhydrographique à I'aval en considérantle stockage du canal, du lac ou du réservoir,et ce, en mode d'écoulementlibre ou contrôlé.Une fois les paramètreshydrologiquesdes bassinsétalonnés, les caractéristiques des voies d'écoulementdoiventêtre établiesafin de pouvoirdéterminerde façon précisele débit à diverspointsen aval. Puis,le taux de variationdu débitdans un tronçon est calculéen fonctiondu temps en divisantd'abordledittronçonen une série de segments,ou < chaînede lacs >. Le débit sortantde chacundes segmentsest ensuiteutiliséà titre de débit entrantpour le segmentqui suit en aval. Cette procédurepar étape est suiviepour chacundes 39 segments et pour chaque période. La figure 1.4 présente un schéma des processus hydrologiques décritspar le modèleSSARR. Tenrperahrreef prôeipitaricnsur le bassin 'Fernpérature elc In x<rne Precipitati*n de Ia z*** frvapr.rtrcn*pirati*n Pluie ou neige Itieigc Aecunrulirtian ei:crverfûr* nivate Xon Fcntc par pltri*: ror ËÇ r*: Ëpaiss*urd* n*ige Fqrntet&*rrnique tcn{enu therrnieltr* St*ekage tle l"eau liguid* lntrilnt cl'humiditc: llilts Rui*selle:rr*rt Ëv:*p*transpiratiei* Flunriclitêel* *rl trtui*çellenre*t riirc*r I]êllit de bal{: Figure 1.4 Algorithme du module intégré par bandes de neige homogènes selon le SSARR (guide d'utilisationdu SSARR,1991). 40 L'estimationdes paramètresd'un modèle hydrologiquereprésenteune tâche ardue en raison de la naturenon linéairedes processushydrologiques et du fait que diversfacteursintervenant dans les modèles qui caractérisentles processusphysiquespeuvent présenterles mêmes effetssur le débit.Cela signifieque la variationde certainsparamètrespourraitêtre compensée par d'autres. Malheureusement, l'étalonnagemanuel des modèles dont les paramètres présententdes valeurs plausiblesentraînesouvent de piètres résultats.C'est pourquoides procéduresautomatisées axéessur des approchesnumériquessont de plus en plus utilisées. L'optimisation des paramètresde SSARRa été effectuéeà I'aided'un algorithmequi procèdeà une rechercheitérativede I'espacedes paramètresaxée sur des mesuresdu rendementet de (Liuet al., 1999;Rousseeuwet Struyf,1998;Zuo et Serfling,2000). fonctionsde profondeur Les fonctionsde profondeuront été définiespar Zuo et Serfling(2000):( pour une distribution F,en P,la fonctionde profondeur représente correspondante toutefonctionD(.;.)quifournitun classementaxé sur F, du centre vers I'extérieurdes points x dans Rd>. Supposonsque A représentela catégorie des fonctions de distributioncumulée de Rs et F, la fonction de distribution cumuléed'unvecteuraléatoiredonné(Z).SupposonsI'application suivante: û Û ; . ] : Ë d x  - +f i (1-35) Cette équationest bornée,non négativeet respecteles conditionssuivantes: 1. lnvarianceaffine: t{,4s + &;4r*+*} : *tx; fxi s'appliqueà tout vecteuraléatoireX de #, à toutematriceA non singulière de dimensiond x d, ainsiqu'à tout vecteurb de longueurd. 2. Maximalitéau centre. *t8; r3: F €  dont le centreest 0. *ffit{-x; F} s'appliqueà toute 3. Monotonierelativeau point le plus bas : Pour touteF Ë Â.dont le point le plus profondest 0, S{.x;F} < *{# * a{x - #3x;F} s'appliqueà æe[*,tj. 4. Fonctiondisparaissant vers I'infini:t{.r;F) convergevers 0 alors que la normede x tend vers I'infini,et ce, pourchaqueF Ë Â. 41. La fonction S{.;F}porte le nom de fonction statistiquede profondeur.La sous-routine d'optimisationmise en ceuvredans le présentouvrage (Thiémongeet Daigle, 2012) suit les étapesci-dessous: 1. Déterminer les paramètres à ajusteret puisdéfinirleurslimites. 2. GénérerM vecteursaléatoiresdans I'espacedimensionnel défini,au point1, par les limites des paramètresà ajuster.Ces vecteursconstituentI'ensembleXu. 3. Exécuterle modèlehydrologiquepour chacundes vecteursX;s et calculerle rendementdu modèlecorrespondant à chacun. 4. Déterminerle sous-ensembleX1ydes N vecteursde paramètresdont le rendementest le plusélevé(p.ex. : les 80 % dont le rendementest le meilleur). 5. La fonctionde profondeurest calculéeen fonctiondu sous-ensembleXlypour chacundes N vecteursde paramètres;les P vecteursayant les plus grandesvaleursde profondeur(p. Xp. ex., plusgrandesque le 50" percentile) et formentle sous-ensemble sontidentifiés 6. RéduireI'espacedes paramètresen le limitantpar les valeursextrêmesdes vecteursde Xp 7. Répéter les étapes 2 à 6 jusqu'à ce que la différencede rendemententre les modèles obtenus par Xy et Xp soit petite,ou jusqu'à ce que la taille de I'espacedes paramètres cessede changer. Calibrerles paramètressur la basede la qualitéde I'ajustement des débits des hydrogrammes, peut introduireun biais qui désavantagela de pointe de crue et des débits volumétriques représentation des débits d'étiage.Smakhtinet al. (1998) ont d'ailleursdéfini certainsdes problèmesliés aux critèrestraditionnelsde qualitéde I'ajustementet ont proposédes solutions qui s'appliquentaux étudesde modélisation du débit d'étiage.La courbedes débitsclassés (CDC), la fréquenceet la durée des faiblesaugmentations de débit au cours d'une période sèche,les taux de reculainsique les débitsvolumétriques de base sontautantde variablesqui peuventservirà évaluerle rendementd'un modèlepource qui est du débitd'étiage(Davisonet Kamp,2008).Si seul le critèredu débit d'étiageest utilisépour étalonnerle modèle,alors ce dernier est aussi susceptibled'arriverà la bonne réponse pour de mauvaisesraisonsque si l'étalonnagen'est effectuéqu'à partir du débit de pointe ou de toute autre fonctiond'objectif qui unique.Afin de résoudrece problème,il est possibled'avoirrecoursà un critèremultiobjectif tient comptetant des périodesd'étiageque de débit de crue (Moore,1993; Coulibalyet al., 2001). Dans le présent projet, les critères d'évaluationsuivantsont servi à l'évaluationdes performancesobtenusà partirdu modèleSSARR: 42 { D , * _:l _ -'l \= rl=.io-ôlip-Fi I (1-36) I*L.io- o;:ti: :ie-E : / \.. N À s t {_ 1-_ r ï l r i o , - P i r " Il'=,ioi-ôi' * \ st=a!. (1-37) .u'-l';- - : - 1 , n- ivtoDNÀSH- 1 -:;--T:U; I' (1-38) r u ' t = : . : + \ 3o çr1,{}6si0il _tod.p*}" L O G I \ - { S H- - r . - - I l = . 1 i o gi o i - t o c ' ' o l i t (1-3e) où n représente le nombrede joursdans la sériechronologique Oi et Pi représententrespectivement les valeursquotidiennesobservéeset simulées. les moyennesobservéeset simulées. Ô et F ils représententrespectivement Ces indicesont été quantifiéspour I'annéeentièreainsi que pour deux saisons(décembreà mars et juillet à octobre).Quatre indicesde rendementont été utilisésafin de couvrir divers aspects de la simulationdu débit d'étiageà I'aide du modèle SSARR. Le coefficientde détermination(R2) permet d'établir dans quelle mesure la dispersionobservée peut être expliquée par les valeurs prévues. Ainsi, une surestimationou une sous-estimation systématiquedu modèle pourrait exister malgré des valeurs de R2 élevées. L'amplitudedu coefficientde NASH se situe entre 1 (ajustementparfait)et --. Une efficacitéinférieureà zêro indiqueque la valeur moyennedes séries chronologiques observéesconstitueun meilleur prédicteurque les sérieschronologiques synthétiques de débitsobtenuesà partirdu modèle. Étant donné que la différenceentre les valeursobservéeset prévuesest élevéeau carré, les valeursde débit les plus élevéesont plus d'influence.Afin de résoudrele problèmede la différenceélevéeau carré et de la sensibilitéaux extrêmes,NASH est souventcalculéà I'aide du logarithmedes valeursobservéeset prévues(LOGNASH).Cela entraîneun lissagedes pointestout en maintenantles débitsd'étiageplusou moinsau même niveau.Tous les indices décritsprécédemmentquantifientla différenceentre les valeursabsoluesobtenuesà partirdes observationset des prévisions.Résultat,une surestimation ou une sous-estimation des valeurs les plus élevéesont généralement une plus grandeinfluenceque lorsqueles valeursles plus faiblessont surestiméesou sous-estimées. Afin de contrercela, la différenceentre les valeurs observéeset simuléesest quantifiéecomme s'il s'agissaitd'un écart relatif,ce qui réduit de manièresignificativeI'incidencedes différencesabsoluesdes débits de crue. D'un autre côté, 43 I'incidencedes différencesabsoluesles moins marquéeslors des périodesd'étiageest accrue, car ces différencessont significatives si ellessont traitéescommedes différencesrelatives. 3.3 Gadrede miseà l'échellestatistique Les variablesde réanalysedu NationalCenterfor Environmental Prediction(NCEP;Kalnayet al., 1996)constituentdes prédicteursatmosphériques à grandeéchelleservantà l'étalonnage des modèleset à la validationdes approchesutilisées.Ces variablessont disponiblesà une résolutionspatialed'environ2,5" x 2,5" (250 km x 250 km) et ont été traitées avant d'être introduitesdans les modèlesstatistiquessous forme de prédicteurs.Quant aux prédictants,il du débitd'étiage,et pour s'agit,pour I'approche directe,des indiceshydrologiques descripteurs I'approcheindirecte,des précipitationsainsi que de la température.Ce cadre est représenté sous forme de diagrammeà la figure 1.5. Les étapesdu cadrede mise à l'échellestatistique sont les suivantes: 3.3.1 Préparation des entrées . Les variablesde réanalysedu NCEP qui ont été choisies(voir tableau1.2) sont interpolées à la station hydrométriqueou à la station météorologiquepar interpolation bilinéaire, ce qui nécessited'établirune moyennepondéréedes quatre pointsles plusrapprochés dans la grille. . Pour ce qui est de I'approchedirecte,les moyennesannuelles,saisonnièreset mensuellesde ces variablessont calculéeset leur corrélation avec les lH de débit d'étiageest évaluée. . Quant à I'approcheindirecte,les valeursquotidiennesdes variablesde réanalyse du NCEP sont vérifiéesafin d'établirune corrélationavec les précipitationset la températureobservéesà la stationmétéorologique. 3.3.2 Mise à l'échelle . qui présententune corrélationsignificative(o < 0,05) Les variablesatmosphériques avec les lH subissentune analysede corrélationcanonique(ACC; Busuoicet al, 2007).Ensuite,les résultatsdes variablescanoniquessont soumisà la MVP à titre de prédicteurs.L'ACC vise à rechercher une combinaison linéaire parmi les prédicteursqui présententune corrélationla plus élevéepossibleavec le prédictant. 44 Avec I'ASD,les variablesqui présententune corrélationsignificativesont soumises (RMD;McCuen,2003). à une régression multipledescendante Pourla miseà l'échelledes précipitations, en plusde I'ACCet de la régressionpas à pas, le PG a aussi été testé en générant des populationsde programmes représentés par des arborescenceset en utilisant différentes méthodes de combinaison (reproductiondirecte, mutation et transfert) pour les meilleures fonctionsafin de créer une nouvellepopulation.La nouvellepopulationétait alors MVP et ASD. utiliséeen intrantdans les algorithmes 3.3.3 Calcul des lH du débit d'étiage . Dans le cadrede l'AD, les lH du débitd'étiagesont obtenusdirectement à l'étape de la miseà l'échelle. o Pour ce qui est de I'Al, les précipitationset la températuremises à l'échellesont introduitesdans SSARR en vue de simuler les débits, à partir desquelssont calculésdes lH d'étiage. o Pour évaluerles incertitudes liéesà l'étapede la mise à l'échelle,une validation partielle a été effectuée. Celle-ci consiste à utiliser les valeurs observées de température et de précipitationsà I'entrée du SSARR. Cette approche sera désignéepar la suite par' < Approchede validationpartielle) (AVP). 3.3.4 Approchesutilisées Les cinq approchesmisesen ceuvredans le présentprojetcombinentles deux modèles statistiques de miseà l'échelle(MVP et ASD) et les deux approchesde miseà l'échelle (AD et Al): AD à I'aidedes modèlesstatistiques . M V P( A D 1 ) . ASD (AD2) (SSARR)aux entréessuivantes: Al qui combinele modèlehydrologique r les valeurs de précipitationset de températuremises à l'échelleà I'aide de la M V P ( A l 1 )e t r les valeursde précipitations misesà l'échelleà I'aide de I'outil et de température ASD (Ar2) 45 L'lntroductiondes valeurs observées(précipitationset température)dans SSARR en vue de simuler les débits et, par le fait même, les indices de débit d'étiage.Cette approchedonneune basede comparaison en éliminantles biaisinhérentsaux données de réanalyseet à la mise à l'échelleet porte le nom de < Approche de validation partielle) (AVP). lppr"czxltc âçz6tntrh* fllrt:ç:îe îsrliretfe Le* çari*trl*:l de r*analy*e du f'lfEF tÂf3] l.-*s valri:rtrls* atra**phêriqu*x 1""';TTe surrÉlaftrln I un* een*ôlnti*rr rigni fie ttrvc rlui prts*nt*nt Rcsrcrsi',r \ i \**r: ?rlulilplc 'i'i,'Ë111" / \ taîfff,.. / { rtlt {.prôdiçreucr} \ flr*dicte{rrx "$êle*ticrnn*:*J I T:f{::"91:-*Æt:i::::-i: - ---J Mvp J ,ru,, â ,.4pz6tr'r*:&e ale" \.'&lê$att€tst gztxtiel{e i *o*rorrrr*u-,1 {}t:p} tes lt-t 4* d&bitd'*ria{rc I ' L.va pré*ipit:ci*rr: *:r 1* Ée:*,p*rarr*'e *ba*:rv* rt ** Le* llI de ç!*trit el'&iag* : -.*.*.--1- I I * liv:rËuari*rn *l*s i*Eliccg de pr:rlbmxrnc* { R&.Ë{}M" *tM!{ *rrt! !t'} F i g u r e1 . 5 Cadre de mise à l'échelle statistique décrivant les algorithmes de la mise à l'échelle directe, de la mise à l'échelle indirecte et de la validation partielle.PG a seulementété utilisé pour les précipitationsdans Al. 46 Tableau 1.2 Prédicteursdu NCEPutilisés dans le cadre de la mise à l'échelle. Numéro Nom du prédicteur Températuremoyenneà 2 m Pressionmoyenneau niveaude la mer Humiditéspécifique à 1000hPa Humiditéspécifique à 850 hPa Humiditéspécifique à 500 hPa Humiditérelativeà 1000hPa Humiditérelativeà 850 hPa Humiditérelativeà 500 hPa Vent zonalà 1000hPa 10 Vent zonalà 850 hPa 11 Vent zonalà 500 hPa 12 Vent méridienà 1000hPa 13 Vent méridienà 850 hPa 14 Vent méridienà 500 hPa 15 Vent verticalà 1000 hPa 16 Vent verticalà 850 hPa 17 Vent verticalà 500 hPa 18 Hauteurgéopotentielle à 1000hPa 19 Hauteurgéopotentielle à 850 hPa 20 Hauteurgéopotentielle à 500 hPa 21 Degrés-jourde chauffage 3.4 Méthodesde validationet mesuresdu rendement La validationd'un modèlede prévision,peut être décomposéeen fonctiondes contributionsde trois types d'erreurdistincts(Gemanet al., 1992).(1) les erreursattribuablesau bruit aléatoire; (2) les erreursattribuablesà une différenceentre les valeursobservéeset les valeurssimulées (biais); et (3) les erreurs attribuablesà I'instabilitéde l'algorithmed'apprentissageet à I'applicationde ce dernier à un ensemblede données fini (variance).Les modèles qui présententle meilleurrendementarriventà réduireà la fois le biais et la varianceen vue de minimiserI'erreurde généralisation. L'approchede validationclassique,appelée < validationcroisée> (Stone, 1974), permet de puisd'évaluer disponibles, calibrerun modèleà partird'un ensemblede donnéesd'observation observées. le rendementdu modèleen comparantses prévisionsaux valeursindépendantes L'échantillonnage fractionnéconstitueune forme particulièrede validationcroiséequi consisteà I'autrepourle de donnéesen deux sous-ensembles: diviserI'ensemble un pourI'apprentissage, contrôle. La forme de validation croisée la plus poussée est la validation croisée par (VCR)qui consisteà omettreun cas à la fois et à établirle modèlestatistique rééchantillonnage à partirdu restede I'ensemblede données,puis d'estimerla valeuromiseà I'aidedu modèle. le rendementdu Tous les N cas disponibles sont omis puis estimésà tour de rôle.Finalement, modèleest calculéà partirdes erreursd'estimationdes cas omis. Ainsi,dans le Les lH de débitd'étiagechoisispourle présentprojetsontannuelset saisonniers. cadre de I'approche directe, le nombre total d'échantillonsdisponibles pour procéder à l'étalonnagede la MVP et du ASD est égal au nombretotal d'annéespour lesquellesdes du donnéesont été recueillies. C'est pourquoiI'ADest validéeà I'aidede la VCR. L'estimation rendementdes approchesdirectesde mise à l'échelledes indiceshydrologiquesa été réalisée à I'aidedes indicesde rendementsuivant:la racinerelativede I'erreurquadratiquemoyenne (RREOM),le biaismoyen relatif(BMR)et le coefficientde détermination(R2) 48 t^ - u ;- p ; - o' / I'i=l\ RREQM: J (1-40) -- !, . n i Û t - F ti !i::i n, i BMR: *t:L { et 'T tt-63i.P-F3 ;rL,{s-fi"EL,iF-4* Où (1-41) i' (1-42) (d'années), N représente ici le nombretotald'échantillons t; et Pi indiquentrespectivement les r-ièmesvaleursobservéeset prévues; # et p représententles moyennesobservéeset prévues. Dans le cadre de I'approcheindirecte,la mise à l'échelle est effectuée pour les valeurs quotidiennesde précipitationset de température,préalablementà leur introductiondans fractionné. La division SSARR.Cellemiseà l'échellea été validéeà I'aided'un échantillonnage des sériesd'étalonnage et de validation(C1 et C2) est illustréeau tableau1.3. Comme les valeursde précipitations et de températurepeuventêtre nulles,le calculde la RREQMet du BMR entraînedes erreursde type < divisionpar zéro >. La mise à l'échellede ces variablesest donc quantifiéeà partir du coefficient# et des indicessuivants:la racine relativede I'erreur quadratique moyennecorrigéepour I'intervalle des valeurs(RREQMç);et le biaismoyenrelatif corrigépourI'intervalle des valeurs(BMRç). -lN-. o,-P,r= .-j=l_F---_ RR.EQM*: *at**çgÏi* (1-43) *"ls;-ril B M R '. : ntê !"v'rlt I È (1-44) Dans ces équations,< intervalle) correspondaux valeurs maximalesobservéesmoins les valeursminimalesobservées. 49 Tableau1.3 Division des données météorologiques disponibles en ensembles d'étalonnage et de validation. Deux combinaisons d'ensembles d'étalonnageet de validation ont été définies ; elles sont désignéespar C1 et C2. Ensembles Type Romaine Moisie Janv.1964à déc. Étalonnage 1969 Oct. 1980à sept. 1990 Ouelle Oct. 1969à août 19 8 1 Combinaisonl (c1) Janv.1970à déc. Validation 1976 J a n v .1 9 7 0à d é c . Etalonnage 1976 Oct. 1990à déc. 1996 Oct. 1982à sept.1991 Oct. 1990à déc. 1996 Oct. 1982à sept.1991 Combinaison2 (c2) Validation J a n . 1 9 6 4à d é c . 1969 Oct. 1980à sept. 1990 Oct. 1969à août 19 8 1 3.5 Projections Le MCG élaborépar l'lnstitutde météorologie Max-Plancket le MCR né de la collaboration entre le Réseaucanadienen modélisation et diagnostics du climatrégional(MDCR),le Centre pourl'étudeet la simulation du climatà l'échellerégionale(ESCER)de I'UQAM,Environnement Canada (CCmaC)et le consortiumOuranosont été utiliséspour prévoirles futurs lH de débit d'étiage.ECHAMS(Roeckneret al., 2003) représentela cinquièmegénérationdu modèlede circulationgénérale ECHAM. Selon sa configuration,le modèle assure la résolutionde jusqu'à 10hPa pour les études troposphériques I'atmosphère ou jusqu'à 0,01 hPa pour les études mésosphériques(le modèle est alors souventappelé ( MAECHAMSo). La taille de la grilledu modèleECHAMSest de 1,875'de latitudex 1,875ode longitude.Les donnéesutilisées font partie du projet ENSEMBLES(http://www.ensembles-eu.orq), lequel est appuyé par le sixième programme-cadrede la Commissioneuropéennetitre de projet intégré de cinq ans (2004 à 2009) dans le cadre de la sous-prioritéthématique < Changement planétaireet écosystèmes>. Ce pro1et vise à élaborer un système de prévision d'ensemble des 50 changementsclimatiquesaxé sur les systèmesterrestresmondialet régionalde pointeà haute résolutioncréésen Europe,lesquelsont été validésà partirde grillesde donnéeseuropéennes à hauterésolutionqui ont fait I'objetd'un contrôlede la qualité.Le but est de produirepour la première fois une estimationprobabilisteobjective des incertitudesquant aux projections climatiquesfuturessur une échellesaisonnièreà décennale,ou même sur des échellesplus longues. Le Modèlerégionalcanadiendu climat (MRCC;Jiao et Caya,2006) utilisédans le présent projet est axé sur le MCCG3 et suit les concentrationsobservéesdes gaz à effet de serre et des aérosols(GES+A).Quatrevaleurshorairesdes prédicteurschoisisobtenuespar le MRCC à une résolutionde 0,5ode latitudex 0,5ode longitudeont été tiréesdu site DonnéesAccès Intégration(http://loki.qc.ec.oc.calDAl/rcm CRCM-f.html).Les futuresémissionsde gaz à effet de serre(GES)sont le produitde systèmesdynamiquesdes plus complexes.Ellesdépendent le développementsociodes facteursdéterminantstels le développement démographique, économiqueet le changementtechnologique.En outre, leur évolution est grandement incertaine.Offrantun choixde représentations d'évolutionspossibles,les scénariossont perçus comme un outil valable permettantd'analyser la façon dont différents éléments peuvent influencerles émissionset d'évaluerles incertitudesliéesà ces derniers.Ce projetemploietrois scénariosd'émissionssoit: A1B, A2 et 81, lesquelssont décritsbrièvementau tableau 1.4 (lPCC,2000).Les projections sont comparéesà I'aidedu changementrelatif(CR) de médiane et de variabilitédes indices des périodesfutures suivantes:2021 à 2050 (années 2020) et 2051-2081(années2050), par rapportà la périodede base (1961 à2010). Le CR est calculé ainsi: CR: ç'eleur fi.ature prêv*re -çaleur de base de Ia période vatreur de base de na période 51 (1-45) Tableaul.4 Scénarios d'émissions recommandés par le Groupe d'experts intergouvernementalsur l'évolution du climat (lPCC,2000)afin d'évaluer les résultatsfuturs relatifsaux émissions. Famille Groupe de scenarios A1 A1C Croissance faible démographique M 82 B1 A1G A1B A1T A2 B1 82 faible faible faible élevée faible modérée Croissancedu PIB très très élevée élevée très élevée très élevée modérée élevée modérée Utilisation d'énergie très très élevée élevée très élevée élevée élevée faible modérée Changement d'affectation des terres faibleà faibleà modéré modéré faible faible modéré à élevé élevé Disponibilitédes élevée ressources Rythme et direction des rapide progrès technologiques élevée rapide modérée modérée faible rapide 52 rapide lent faible modéré modérée modéré modéré 4 nÉcror.r ÉruorÉe La zone d'étude est concentréeautour de trois rivièresde I'est du Canada, soit les rivières Romaine, Moisie et Ouelle (figure 1.6, tirée de Joshi et al., 2013). Ces trois rivières se déversenttoutesdans le fleuveSaint-Laurent. Les rivièresRomaineet Moisiese trouventsur la rive nord du fleuve alors que la rivièreOuelle se situe sur la rive sud. Ces rivièresont été choisiesen raisonde leur capacitéà entretenirdes populationsde saumon de I'Atlantique (Sa/mo salar), une espèce menacée dans certaines régions (Comité sur la situation des Les bassinsversantsdes rivièresRomaine, espècesen périlau Canada(COSEPAC),2011). Moisieet Ouelleont des superficies de 13,000,19,000et 795 km2,respectivement. -,-..:.-.._ . '-'.-.,.' . }n-,:..,:r'- -; r " , " ! F,...-l .,!. :1 * t r---T- Ouebeclr I t^-t. t" .'., - - J - .1.;-ï lrf ._ :;i'- . , i",{ .l: \: È-':'F i- OeêanAt La Pocatièr'e Har.l'e-Saint-Pierre Figure 1.6 Garte de la zone d'étude illustrant I'emplacementdes stations hydrométriques (cercles) et météorologiques(carrés)des rivières Romaine, Moisie et Ouelle. (figure tirée de Joshi et al., 2013). 53 Les localisationsdes stations hydrométriqueset météorologiqueschoisies pour la mise à l'échelle apparaissentà la figure 1.6. Les données hydrologiqueset météorologiques proviennent Les de la banquede donnéesd'Environnement Canada(http://climat.meteo.oc.ca). différentesstations sont décrites au tableau 1.5 (tiré de Joshi et al., 2013). Les années présentantun tiersdes donnéesde débitmanquantes(> 4 mois)ont été exclues.La figure1.7 présenteles courbesdes débits classésdes débits estivauxet hivernauxdes trois rivières.ll apparaîtclairementque les rivièresMoisieet Romaineprésententdes débitsd'étiagehivernaux plus marquésque leurs équivalentsestivauxalors que la rivièreOuelle présentedes débits d'étiage plus importantsen été. Ces résultatsconcordentavec ceux obtenus par Burn et al. (2008),qui ont remarquéque les rivièressituéesdans la partienord de I'estdu Canada,qui connaissentdes périodesprolongéesde basses températures,présententleurs plus faibles débits pendantI'hiver.Les rivièresplus au sud, cependant,présententdes débits d'étiagetrès élevée et marquéspendantl'été en raisondes faibles précipitations, d'une évapotranspiration plus faibleque celle des rivièresdu nord qui font I'objetde la d'une probablesous-affluence présenteétude. En analysantles courbesdes débits classés,il est égalementévidentque la différenceentre les débits estivaux et hivernauxdes rivières Romaine et Moisie est plus prononcéeque celle de la rivièreOuelle.Les valeursdu coefficientQ95 des débitsestivauxet hivernauxde la rivièreOuelle s'élèventrespectivementà 0,65 et 0,86 m'/s. Pour les rivières Moisieet Romaine,ces valeurss'élèventà 222,5 m3/set 60,3 m3/s,et à 140 et 42,9 m3/s, respectivement. 54 Descriptiondes stations et données hydrométriques(tiré de Joshi et al., 2013). Tableau 1.5 Superficie Station Latitude drainée Longitude étudiées (km') Romaine 5 0 " 1 8 ' 2 8N " 6 3 " 3 7 ' 2 1O " 1 30 0 0 Moisie 50"21'1'N 66'11',25" O 1 90 0 0 Ouelle 47"22'52"N 69"57'29'O 795 1 9 6 1à 2010 1 9 6 6à 2010 1 9 6 1à 2010 1 9 6 7 ,1 9 9 9 , 2 0 0 0 , 2 0 0 7 1967, 1981, 1982,1996 v; iE ô $a5 05 $o oq u1J 2007 I 1 o P =c DO odt Annéesexclues (Superficre 13000Km') Romarne (superfrcre 19000Km2) Morsre 0)! Années 0. ^ro rÀE { 10 rt n ' u 0 10 1C' Débrt 1rn3s'1tr (Suærfroe 795Km") Ouelle -Ëte *Hruer tc rt l,l' c (m3s-1) Débrt Figure 1.7 Courbes de débits classés estivaleset hivernalesdes rivières Romaine,Moisie et Ouelle. 55 Les conditionsmétéorologiques observéesaux bassinsversantsdes rivièresRomaineet Moisie ont été enregistrées à deux stationsmétéorologiques chacunealorsque pour la rivièreOuelle, une seule station a été utilisée.Le choix des stations a été établi en fonction du nombre d'annéesau cours desquellesdes donnéesétaientdisponibles.Les stationschoisiessont décritesau tableau1.6. Tableau1.6 Station Descriptiondes stations météorologiquesqui ont servi à I'exercicede mise à l'échelle. Latitude Longitude Elévation Années (m) disponibles Fermont 5 2 '4 8 '0 0 .0 0 0 'N 67'05'00,000" o 594,40 5 0 '1 3 '0 0 .0 0N 0" 6 6' 16' 00.000" o 54,90 51"52',02.000" N 6 3 ' 1 7 ' 0 1 . 0 0O0 " 588,90 63' 36' 41.000" O 37,80 (F) Sept-lles (s) Lac Eon (L) HavreSa i n t - 5 0 " 1 6 '5 5 .0 0 0 'N Pierre(H) La Pocatière 47"21'21,000"N 7 0"01' 55,000" o (P) 56 31,00 Oct. 1980à déc. 1996 Oct. 1980à déc. 1996 Janv. 1964à déc. 1976 Janv. 1964à déc. 1976 Oct. 1969à sept. 19 9 1 La figure1.8 illustrela température annuellemoyenneet les précipitations annuellesmoyennes enregistréesaux stations météorologiques.Ces moyennes ont été calculées à partir des données de 1964 à 1976 pour les stationsdu Havre-Saint-Pierre et du lac Éon (rivière Romaine).Les moyennesont été calculéesà partirde donnéesenregistrées sur 16ans, soit entre1981et 1996,pourles stationsFermontet Sept-Îles(rivièreMoisie).Finalement, la station de La Pocatière(rivièreOuelle)a recueillides donnéespendant21 ans, soit de 1970 à 1990. En observantla figure1.8,on remarqueque la température annuellemoyennediminueentreLa Pocatière(4,1"C), au sud, sur la rivièreOuelle,et Fermont(-3,8oC),au nord, sur la rivière Moisie.Les précipitations totalesannuellesmoyennesles plus élevéesont été observéesà la stationde Sept-Îles(1143,5mm) tandisque les plusfaiblesont été enregistrées à la stationde Fermont(789mm),toutesdeuxsituéessur la rivièreMoisie. &.--' ût pË ffi, 5b $tr ôn 'æ €q3 ---. î:27iîÇ2. ,ti.,:,,æ k* eT qâ I lt ttt rF* 15*: {q 3ç t@:- .x* -: -*: , & t, E E i cu- I o9 {E Figure 1.8 t, g: .-.; H 5ta{ie*s !- Températures et précipitations annuelles moyennes enregistrées aux météorologiques.Les lettrescorrespondentaux stations décrites au tableau 1.6. 57 CHOIXDESINDICES HYDROLOGIQUES DE DEBITD'ETIAGE 5 La sélectiondes indiceshydrologiquesde débit d'étiageutilisésdans le présent projet a êté faite en fonctiondes travauxde Daigleet al. (2011),lesquelsont procédéà la caractérisation des régimesd'étiagedes rivièresde I'estdu Canadaà I'aided'une analyseen composantes principales(ACP).Un total de 71 lH, liés à la descriptiondes débitsd'étiageet enregistrésà partir de 175 stations hydrométriques,ont fait I'objet de cette analyse. Les trois premières principales (CP)comptaientpourplusde 75 o/ode la variancetotaledes données. composantes Visant une sélectiond'un nombre limitéd'lH utilesà la descriptiondes étiagesde I'Est du Canada,les critèressuivantsont été suivis: . Les lH choisisdoiventcontribuerfortementaux CP1, CPz et CP3 (r.e.expliquerune proportionimportante de la variancedes lH de débitd'étiage). . Deux lH séparéspar un anglede 0o ou de 180"dansI'espacedes CP sont redondants et I'undes deuxdoitêtre privilégié. . Les lH choisis ne doivent présenteraucune autocorrélation(corrélationtemporelle). -0.2 à L'autocorrélation interannuelle relevéedans les lHs se situaitdans I'intervalle 0,2. À partir de critères énoncés précédemment,six indices appartenantaux quatre catégories suivantesont été sélectionnés: . Amplitude . AMPI: Les valeursminimalesdu débitobservéesau mois de mars pourchaque année(Ls1Km2;. . AMP2:indicede débitde base,soit le rapportdu débitmensuelle plusfaiblesur le débitannuelmoyen(sansunités). . Temporalité . T: le jour julienmoyendes septjournéesau coursdesquellesles débitsles plus faiblesont été observésau coursde I'année(jourjulien). . Variabilité . V: l'écarttypedu jourjuliende ces septjournées(enjours). 59 . Durée . D1: le débitle plusfaibleobservésur une périodede 90 joursdivisépar la valeur (sans unités). médianede toute la périoded'enregistrement o D2: le débit le plus faible observésur une périodede 90 jours, de juillet à octobre, divisé par la valeur médiane de toute la période d'enregistrement (sansunités). Tous les indices,à I'exception de D2, sontdes valeursannuelles.D2, quantà lui,est calculéde juilletà octobre.La figure1.9 présented'ailleursdes diagrammesqui illustrentla distribution de ces indicespourchacunedes rivièresétudiées.En observantladitefigure,il apparaîtclairement que les indicesde la rivièreOuellesont ceux dont la variabilitéest la plus grande.En outre,de tous les indicesappliquésà cette rivière,un nombre maximalde horsainsest retrouvépour présentela variabilité maximale.De plus, I'indicede variabilité, alorsque I'indicede temporalité la rivièreOuelleprésenteune distribution des débitsd'étiage(fin de bimodalede la temporalité I'hiveret fin de l'été;figure2.3, chapitre2). Par conséquent,lorsqueles septjournéesde plus faible débit sont répartiesau cours de ces deux saisons,I'indexde temporalitéconnaît une augmentation. Par exemple,pource qui est de la rivièreOuelle,cinqjoursde l'été1973et deux jours de I'hiverde cette même année constituaient les sept journéesau cours desquellesle débit enregistréétait à son plus bas. Si I'on compare les données des rivières Romaine et Moisie,on remarqueque les indicescorrespondants sont semblablesen termesde variabilité. Les valeursmédianesdes indicesAMP1, AMP2, D1 et D2 de la Romainesont supérieuresà celles de la rivière Moisie,mais pour ce qui est des autres indices(T et V), les valeurs médianesdes deux rivièressontcomparables. 60 ' 1&i <* =s d'l' ' u J < uu J = â o.:i ff 3a * * r.r: -....t.,- m r'-: tl I - j{ È _ enn II tl e v v 150 g 1&' g s*: I-T *;.' é. *"e: :3 t ....-- hdi# F i g u r e1 . 9 >; 8, |---1 Rêmaine -.. -:: r*-r II .i En, n v ........t:.:a' - {r. " g 04 GI sj ça r::1 TM. € gn*, I L--J .:, * & 6 p43 û{, ttt ....:.::. ::.:::.... ..... û{*}l* n. {-:: *.Aw Diagrammesen hamac des indices hydrologiqueschoisis pour les rivières Romaine,Moisie et Ouelle (tirés de Joshi et al., 2013). Copie originale très pâle 61 6 nÉsulrATs 6.1 Approche directe de mise à l'échelle Tel que mentionné dans les sections précédentes,I'approchedirecte de mise à l'échelle consistenotammentà établirun lien entre les variablesclimatiquesà grandeéchelleet les indicesde débit d'étiage.Les intrantsdu MVP et du ASD ont été choisisparmi les valeurs annuelles,saisonnières ou mensuellesdes variablesà grande échellequi présentaientune corrélationsignificative {c: *.05J avec les lH. Ces valeursont ensuiteété soumisesà une analysede corrélationcanoniqueet à une régressionmultipledescendanterespectivement. Les résultatsobtenusde I'approchedirectede mise à l'échellesont abordésau chapitre2. ll s'avère que la plupartdes variablesprésentantune corrélationsignificative avec les lH d'étiagesont liéesà I'humidité et aux vents(vertical, zonalet méridien). Les résultatsde I'approchedirecte indiquentclairementque pour chaque rivière et chaque indicede débitd'étiage,la MVP s'est montréeplus efficaceque I'ASD.Dans chacundes cas, la différenceentre les valeursde RREQM,BMR et R2obtenuesen mode validationà I'aidede la MVP et du ASD est plus grande (dans la plupartdes cas d'un facteurdeux) que la différence observéeentre ces mêmes valeurs en mode d'étalonnage.La RREQM et le BMR obtenues pourles lH de la Romaineet de la Moisiesont inférieures à cellesde la rivièreOuelleet ce, tant que de validation. en moded'étalonnage Parmitousles indices,I'indiceV obtenupourla rivière Ouelleprésentela RREQMet le BMR les plusélevés.Les valeursde la RREQMpourcet indice sont respectivement de 1,70 et 1,29 (MVP)et de 7,51 et 4,92 (ASD).Pour ce même indice, I'ASD a donné lieu à des valeurs de V négativesdans les ensemblesd'étalonnageet de validation.Une façon d'éviterI'occurrencede valeurs négativesest de transformerI'indicede variabilitéen prenant le logarithme.La mise à l'échellea ainsi été effectuéesur ces valeurs logarithmiques,et les valeurs prédites obtenues retransforméesen utilisant la fonction exponentielle.En plus d'éviterles valeursnégatives,la méthodea amélioréles performances performances pourla MVP.PourI'indicede variabilité des deux modèles,avecde meilleures de la rivièreOuelle,les valeursde RREQM,RMABEet R2 sont de 0,71, 0,49 et 0,86, alors que pour I'ASD,on obtient0,93, 0,70 et 0,64, respectivement. Quantaux autresindices,les plus fortesdifférences entrela RREQMet le BMRont été observéesdans les donnéesenregistrées à la rivièreOuelle.Les résultatsobtenusà I'aidede I'ASD se sont amélioréslorsquele choix des 63 prédicteurs la RLMamélioréen'estpas a été fait grâceà une ACC suivied'uneRLM.Cependant, parvenueà surpasserla MVP.De plus,parmitousles indiceschoisiset danstous les cas de figure (la figure 1.10 ne porte que sur les résultatsde validation de la rivièreOuelle),une différence à I'indiceV. marquéeentrela MVPet la RLMavecACC (RLMACC)a été observéerelativement tr tll * *,.. f*........ ? -... ?*.r: tl:|:æ*.-. -- .:,.:.sé* *.... ,,13z*u -..--.î7ii1w* ."....::::tæ *.... ....- *.*... i.ll.::.::l .'KT _ælI _æl _Kl-=æl -............û. -...'""." A!!{p1 AMT2 TV t{"Td**shydrotoçiqu*s ASD â Figure 1.10 6.2 //:w, q-. nur'mcc Û1 '*æ æ? I*ut Résultatsde validation des modèles de mise à l'échelle(MVP,ASD et RLMACC)obtenus pour la rivière Ouelle. Approcheindirectede miseà l'échelle Cette sectiondécrit les résultatsde I'Al pour les rivièresà l'étude.Les résultatssont discutés La premièrerésumeles résultatsde mise à l'échellede la température dans trois sous-sections. et des précipitations.La seconde décrit les simulationsfaites avec le modèle SSARR aux échellestemporellessaisonnièreet annuelle.La dernière sous-sectionrésume les résultats obtenus par I'approcheindirectepour laquelle les précipitationset températuresissues du processusde mise à l'échellesont utiliséesen intrantsau modèleSSARRafin de générerdes débitssimulésavec lesquelsles indicesd'étiagesontcalculés. 6.2.1 Mise à l'échelle des valeurs de précipitations et de température Les résultatsde la mise à l'échelledes températureset précipitations sont discutésen détails au chapitre3. Les prédicteurssélectionnéspour la températureet les précipitations sont listés dans le tableau1.6.Tel que mentionnédans la section3, les variablesNCEP,significativement corréléesavec la températureet les précipitations,ont été sélectionnéespour constituerle 64 modèle. Afin de tenir compte de la préférencepour des modèles parcimonieux,le modèle contenanttous les prédicteurscorrélés(M_all)a été comparéavec celui contenantseulement les cinq meilleursprédicteurs(M5). Le critère d'Akaike (AlC) a été utilisé pour faire cette comparaison.M5 a permis d'obtenirune valeur plus faible d'AlC et les résultatsdes deux modèles(M5 et M_all)sont comparablespour la températureet les précipitations. ll n'y a que dans le cas de la stationde Sept-Îles,où M5 a produitde meilleuresvaleursd'indicateurs de performanceque M_all pour les précipitations. Le nombrede prédicteursa donc été augmenté pas à pas dans le cas des précipitations et c'est le modèle qui utilise les 10 meilleurs prédicteursqui performele mieux. pourles combinaisons Les résultatsde validationde la miseà l'échellede la température C1 et C2 sont présentésdans la figure1.11.Les résultatsmontrentque les deux méthodes(MVP et ASD) ont bien performépour toutes les stations(R' t 0.9). Pour toutes les stations,MVP a mieux performéqu'ASD. Les valeursdes RREQMc,BMR6 et R2 obtenus pour le MVP et I'ensembleC1 à Sept-Îlessont de 0,075,0,055et 0,91 et pour ASD, de 0,087,0,066et 0,89, respectivement. La mise à l'échellede la températureest systématiquement mieux réussieque celle des précipitations.Les corrélations obtenues pour la température sont toujours supérieures à 0,9 alorsqu'ellesvariententre0,3 et 0,7 pourles précipitations. 65 Tableau1.6 Prédicteurssélectionnéspour la mise à l'échellede la températureet de la précipitation.Les numéros des prédicteursréfèrentau tableau 1.2. Stations/Variables Température Précipitations Fermont (F) 1 1, 4 , 1 2 , 1 , 1 3 1 3 , 7 , 6 , 5I, 1 Sept-lles (S) 11,4,12,1,13 6 , 7 , 1 9 , 5 , 1153, ,10 , 2 0 , 9 , 8 Havre-Saint-Pierre 1 1, 4 , 1 2 ,,11 3 19 , 15 , 5 , 1 3 , 6 1 1, 4 , 1 2 , 1 , 1 3 7,6,10,13,5 1 1 , 4 , 1 2,,113 15,19,7,13,6 (H) Lac-Eon (L) La Pocatière(P) ** ut q,* æ rï r&J rf û1 i.,' - t.S$' *] ç *.t5: æ æ s' t,' rv ^4 \,4 *.1. t.s: +,t' Figure 1.11 '.. : ': , a .. lt û.05 * : /:, . t0-û: 5 ', ' : tt,r,r, t'{:'; r'rt' ltttt : ,:,:, , .r':;:1 , lr,, 7 ;n. €,:i:: SHLF"F*HLP suauons : 7:t 7' slations MVP ASO Résultatsde validation de la mise à l'échelle de la températureobtenus par le MVP et I'ASD, pour les combinaisons Cl et C2. Les barres blanches et grises représententrespectivement I'ASD et le MVP. Les noms de stations sont représentés par des lettres sur I'axe horizontal (voir le tableau 1.6). 66 En incluantI'algorithmegénétique,les combinaisonsdes méthodesdécritessont PG et MVP (MVPPG)et PG et RLM (RLMPG),MVP et ASD. Les résultatsde validationpourC1 et C2 sont montrés à la figure 1.12. Des améliorationsmineures sont observées pour MVPPG, comparativement à MVP. On peut constaterque la prédictionde la proportionde jours secs est meilleureque celle des jours humides.Le pourcentagede jours secs correctementidentifiés varie entre 80 et 90%, tandisque celuides jours humidesvarie de 50 à 7O%.La plus grande proportionde jours humides correctementidentifiésest observée à la station de Sept-Îles (> 80%), pour toutes les méthodes.Les résultatsdes classificationsde jours secs varient légèrementd'une stationI'autre.Ainsi,pour C1 à HavreSt-Pierre,la proportionde jours secs correctementidentifiéspar MVPPGest de 1% supérieureà celle de MVP. Pour C2 cependant, la différenceest négligeable.À la stationde La Pocatièreen C1, le RLMPGa mieux performé que I'ASD tandis que c'est I'inverseen C2. Dans certainscas, comme à Fermonten C1 et Havre St-Pierreen C2, I'ASD a mieux performé que les autres méthodes. Pour les jours humides, le MVPPG a donné de meilleursrésultatsà toutes les stations. Pour Sept-Îles, MVPPG a identifiécorrectement6% et 3% plus de jours humides que MVP en C1 et C2, respectivement. RLMPGa permisune meilleureclassification des jours humidesque ASD dans certainscas (Fermontet Sept-Îlespour C1, Havre St-Pierre,Lac Éon et La Pocatièrepour C2), alors que ASD a mieux performéque RLMPG dans certainscas (Lac Éon pour C1 et C2). ASD et MVP ont eu des performancessimilairesà toutes les stations.Par exemple,pour Fermont,MVP a correctementidentifié71, 82 et 52o/odes jours totaux,secs et humides,respectivement, tandis que ces proportionspour ASD sont 71, 87 et 45%, respectivement.Les résultatspour la validationen C1 etC2 sont présentésdans la figure1.13.De toutesles méthodes,MVPPGa donné de meilleursrésultatsà toutesles stations.Des améliorationsnotoiresont été observées à Sept-Îleset Lac Éon pour C1. Les RREQM",BMR" et R2 obtenuspour MVPPGà Sept-Îles sont de 0,06, 0,029 et 0,43, respectivement. Pour C2, des améliorations importantessont observéesdans les résultatsobtenusà Sept-Îles,Lac Éon et Havre St-Pierre.Les RREQM", BMR"et R2obtenuspourMVPPGen C1 sont0,072,0,37et 0,35,respectivement. Les meilleurs résultatsont été obtenusà La Pocatièrepour les deux combinaisons.Les valeursde RREQMc, BMRçet R2du MVPPGen C1 sont de 0,045,0,025et 0,29 et pourC2, de 0,049,0,021et 0,27, respectivement. ASD a donnéde meilleursrésultatsque RLMPG,principalement à caused'une meilleureproportionde jours humidescorrectementclassés.Les résultatsobtenusà Lac Éon pourles deuxcombinaisons en sont un exemple.Les valeursde RREQM6,BMRçet R2pourC1 67 avec ASD sont 0,083,0,044et 0,33 tandisque pour RLMPG,elles sont 0,085,0,050 et 0,23, respectivement. gâ 'e ::&%:& ï. ilËils ,& '&A*xr,, ,:e /".â v1 1a 100 ,r,, Ê^ .. ,MVP * 1St ËEâ ï :tâitâfli Ças* , ffirnav**c .. fxr-rxra 5S n ', ', gËË Filil Ëâî &:{&::$ 1tg g a Êtoo ËftLp Stâ&**s Figure1.l2 S{âfts'1â Résultats de classification des jours secs et humides pour la mise à l'échelle des précipitations avec PG comme méthode de préparation des intrants. Les résultats sont présentéspour les périodesde validation de Cl et C2 (tableau1.3).Les noms de stations sont représentéspar des lettressur I'axe horizontal(voir le tableau 1.6). ul {} S.1,"-* æ a1 t3., û_*5, tv {V &.-- td :'&:&ë':&::. *.û5: {J : € {B : f'ï;* l-* k û.s. g: g '!-êgil:h € rsHLP"çsl'tt-P . ou - g ",.foË&,fo8r rp*rsl**fftxt** F i g u r e1 . 1 3 Résultats des régressions pour les taux de précipitations mis à l'échelle avec le PG comme méthode de preparation des intrants. Les résultats présentés correspondent aux périodes de validation de C1 et C2 (tableau1.3).Les noms de stations sont représentéspar des lettres sur I'axe horizontal(voir le tableau 1.6). MVP permet de développerdes modèlesparcimonieuxpuisque cette approcheutilise moins d'échantillohsafin de faire ses estimations.Le pourcentagede vecteurspertinentsutiliséspour la mise à l'échellede la températureet de la précipitationsont de 1 à 5o et de 1 à 7o/o, respectivement. Cependant,le temps de calculet la mémoireinformatiquerequisepeut rendre son application difficilepourles étudesde miseà l'échelle. ASD nécessitemoinsde mémoireet de temps de calcul.L'utilisation de langagestel que C ou C++ pourraitaider à diminuerle temps de calcul, de même que I'accès à des machines plus puissanteset ayant plus de mémoire 6.2.2 Simulation des débits à l'aide du modèle SSARR Le modèleSSARRa été étalonnéà I'aided'une sous-routined'optimisation, décriteà la section 3. Des quatre critèreschoisisen vue de quantifierle rendementdu modèleSSARR,il s'avère que MODNASHconvientle mieuxà la mesuredes capacitésde modélisation du débitd'étiage (Krause et al., 2005). Par conséquent,les paramètresont été optimisésen comparantles valeursde I'indiceMODNASH.Les variablesmétéorologiques mises à l'échelledont il a été question dans la section précédentesont introduitesdans SSARR pour simuler un debit (figure 1.14). En observantles valeurs de MODNASH obtenues,on remarqueque les simulationshydrologiquesdes rivièresMoisieet Romainesont mieux réussiesque cellesde la rivièreOuelle.Pour C1, les valeursde MODNASHsont respectivement de 0,87,0,89 et 0,41 aux rivièresMoisie,Romaineet Ouelle.Pour C2, ces mêmesvaleurss'élèventrespectivement à 0,8, 0,9 et 0,23. Les débits hivernauxsont mieux simulés que les débits estivaux. Par exemple, à la rivière Moisie, les valeurs hivernale et estivale de MODNASH sont respectivement de 0,73et 0,16 (C1) et de 0,66et 0,32(C2). 69 /t .lf -.n - I !I ;I-I-r; .II !I ËI . 'I *I IJ I . .r a . 1 ITII! T I c: {: ti 1' 9ns {D "- * 1 II .I û 1; ô.5 fl, '* * ,&:::e,"& ': *'â, ?zW '.:.* t 7:&J WJ LOGI{AsH 0 t{Â.$H [.TAçF{ÂSH R? ucusre flnornain€ Figure 1.14 ,,,,,&J*W *W t-. 0,5, z&l-K.*Kl:*w &*.*t, t'- VA 'gir.gll ?,, HASI{ MÛÛf{A$H ftâ *wJ t"s&Èi[As]d Icuetle Résultats de la simulation à l'aide du modèle SSARR pour les trois rivières, pour les deux combinaisonsCl et C2 des ensembles de calibrationet de validation). 6.2.3 Comparaison des approches indirectes de mise à l'échelle Les figures1.15à 1.17présententles résultatsde la miseà l'échelleindirectedesd lH obtenue respectivementaux rivièresMoisie, Romaineet Ouelle. ll est difficilede conclurequant à la de la MVP ou de I'ASD.Par exemple,en ce qui a traità la RREQMet au BMR pour supériorité l'indiceD2 de la rivièreRomaine,il s'avèreque la MVP présenteun meilleurrendementque C2. Pour I'ASDpour la combinaison C1, alorsque le contrairese produitselonla combinaison ce même indice,à la rivièreMoisie,la MVP surpasseI'ASDen termesde rendement.Quantà la rivièreOuelle,pourI'indiceD2, les deux méthodesont donnélieuà une RREQMet à un BMR comparables. Aux rivièresRomaineet Moisie,les meilleursrésultatsdes deux combinaisons ont trait à I'indiceAMP1. Cettefois encore,dans les deux cas, les deux méthodesont donné lieuà une RREQMet à un BMR comparables. Pource qui est de I'indiceV à la rivièreOuelle,le rendementdes méthodesa chutéde façonconsidérable. Les valeursde la RREQMet du BMR se sont élevéesà plus de cinq et le R2 s'est abaissésous les 0,2, et ce, pour les deux pour ce qui est de I'indiceT à la Romaine(C1),des deux méthodes combinaisons. Finalement, présententun rendementsemblablequantà la RREQMet au BMR, mais pour le R2,il s'avère que I'ASDsurpassela MVP. 70 ct ê4 v4 s.5 '*.' u, 7â | I -',, 0_5 d 8.?: â t *.1: .' &, 1: û *.s: 1,,a 0( U Jl *,4, *.2: û eâitF1&&*FâT 1l t1 tJ' t2 Indieç,âhydr*tegique* In{,lce5 hydrologlques nevp -...,._ Figure 1.15 Indices de performance des lH d'approche indirecte pour la rivière Moisie pour les deux combinaisonsdes ensemblesde calibrationet de validation. .'' *,2. .; * i*|,t 7 *-"r '' *.1, 7:,,, ,, Z* 7,'j;', n- , ' ; . e,wpl&wp? v ff Ê2 Ëndic*ghydæ4rqu** 7f*e,*w Figure 1.16 , ', *'i t AMPf Aâ&P? T V Û1 W" l*dceeftydre*eglq$€€ ASt lndices de performancedes lH de I'approcheindirectepour la rivière Romainepour les deux combinaisonsdes ensemblesde calibrationet de validation. 71. 3û rl lÀt - lÉ. û' 15: 1*: ...,?&:::...-,..,.& 1t, ',:., a.:,:a 1S *. lt; -tlt, Figure 1.17 ,..a.e::. .. .. tatkar. 7:' -....:t;;'..: r2t.......--..-....':*....:,..,,-...1ft..:. &' *.4, ? * e: : l û *&..:............&:':.,.... 1 ,,.. .r:,,, : -;-., .,-*,,,.. {t.'. :::.;a,'-.'l?:.' t.5: , lt. ô - tt vt 1J *'t Âr!481ÂMp?T tnd;ç*ç&ydra**çique* '7tdvp î:-:'. l:,:: :. ..: V D1 AMPIAti,lP2 T Ir*dic*s|t$r*l*ç4a*eç .;-: t2 gs* Indices de performance des lH de I'approche indirecte pour rivière Ouelle pour les deux combinaisonsdes ensemblesde calibrationet de validation. de I'approchedirecte,de I'approcheindirecteet de 6.3 Gomparaison la validationpartielle La comparaisonde I'approchedirecte,de I'approcheindirecteet de la validationpartielleest abordéeau chapitre4. Les résultatsen découlantsont illustrésaux figures 1.18 à 1.19. En observantles résultatsobtenus, il apparaîtclairementque I'ADl surpassetoutes les autres approches.Par exemple,pour I'indiceT à la rivièreRomaine(C1), les valeursde la RREQM obtenuesà partirdes approchesAD1, AD2,AVP, Al1 et Al2 sont respectivement de 0,07,0,14, 0 , 4 7 , 0 , 5 3e t 0 , 5 3 .L e s v a l e u r sd u B M R s o n td e 0 , 0 6 ,0 , 1 2 , 0 , 4 5 , 0 , 5 1e t 0 , 5 2e t l e s v a l e u r sd e R2 respectivement de 0,80, 0,30, 0,23, 0,07 et 0,23. Pour ce même indice,la MVP utiliseun de nombredonnéesde calibrationcorrespondant à 4 à 6% du nombrede pointséchantillons pourproduireses prévisions. I'ensemble de calibration Tel que mentionnédans les paragraphesprécédents,il est difficilede départagerclairementles performancesdes approchesAl1 et Al2. Pour I'indiceT des rivièresRomaineet Ouelle, les Pour deux méthodesont présentéune performanceéquivalentepour les deux combinaisons. De ce même indiceà la rivièreMoisie,l'Al2 a surpasséI'Al1 dans les deux combinaisons. même, il n'est pas possiblede conclureque I'AVPest systématiquement supérieureà la Al. Par exemple,pour ce qui est de I'AMP2de la rivièreOuelle,I'AVPa surpasséles deux approches indirectesavec la combinaisonC2 alors que le contrairese produitavec la combinaisonC1. 72 Malgré le fait que I'AVP emploie des valeursobservéesde précipitationset de température, cette approchea été surpasséepar I'approcheindirectedans bien des cas. Par exemple,à la rivièreRomaine,il y a une différencemarquéeentre le rendementde I'AVP et de I'approche indirectepource qui est de I'indiceV. 73 -,xl 1û: *.- -,: :,::ii? e.. *,:]:l*s.* *::':î?æ..-......... *....1:lL|.w * t( 1t: 5: u k *.s, *".......- ...;-..-.-.x AMPl I AMP? --,=&I' I lÊ, )ti*,J *2 sr 'IAVPreN1 nffz Isor Comparaison des indices de performance des lH pour la combinaison C1 appliquée à la rivière Ouelle. Les approches comparées sont les suivantes : réduction directe à I'aide de la MVP (ADl) et du ASD (AD2); réduction indirecte à I'aide du modèle hydrologique SSARR et des valeurs observées (AVP) et mises à l'échelle des précipitations et de la température à titre d'entréesselon deux méthodes,soit la MVP (Al1) et le ASD (Al2). Figure 1.18 tti g {3 't*,, *: â a *: *i.....:.t::r,**... ..*:,.:::,t&,: I *. l; *.:':Z;**... lz::::.**.. . ..-.,. :',** x{s *. *....:.ta'.&* ;..-;:';&* *l-:;L":æ* a tr tr *.*: - I - I I {t S....taâX*- Aft,tPT J:.2::.:** Âfdp? lnor Figure 1.19 *: *X* '*-' ''- ' 1.. L,âI* J,.**lJï'& D1 ï11 xçz :lLl,::::i,;: xveKnnt W fr*w Comparaison des indices de performance des lH pour la combinaison C2 appliquée à la rivière Ouelle. Les approches comparées sont les suivantes : réduction directe à I'aide de la MVP (AD1) et du ASD (ADz); réduction indirecte à I'aide du modèle hydrologique SSARR et des valeurs observées (AVP) et mises à l'échelle des précipitations et de la température à titre d'entréesselon deux méthodes,soit la MVP (Al1)et le ASD (Al2). 74 6.4 Projections L'approcheAD1 étant celle qui a présentéla meilleureperformance,c'est cette approchequi a été utiliséepour produireles futuresprojectionsdes indicesde débit d'étiage.Pour des fins de validation, les lH de débitd'étiageont été calculéspour la périodede référencede 1961à 2010 cumulées(FDC)des lH à partirdes sortiesdu MCG et du MCR. Les fonctionsde distributions obtenusà partirdes donnéesdu NCEP,les sortiesdu MCG et du MCR ainsique les données observéessont comparéesaux figures1.20à 1.22.Bienque la FDC obtenueà partirdu MCG semblebien correspondreaux observations,il s'avèreque les valeursles plus faibleset les plus au fait que souvent,les biaisées.Ce biaispeut être attribuable élevéessont considérablement modèles de mise à l'échelle statistiquene parviennentpas à reproduirela variance des variablesmodélisées. LJ nç 9o 80 0r5 0? c25 c3 AMP2(Sansunitél 1($ 12û 140 T (DateJutienne) f) 0510 v uours) 15 0t 02 03 04 8; 06 unité) D1(Sans -ECHAMs-CRCM NCEP Figure 1.20 05 08 | 12 {ê unitè) 02 (Sans Observè Gomparaisondes lH observés et simulés à partir des sorties du MGG et du MCR, ainsi que des données du NCEPpour la périodede référence,soit de 1961à 2010,à la rivière Romaine. 75 1 n 05 ro oo 5 AMP11rn3s'r1 I 0 . 1 02 û.3 04 P2{Sans unrtê) 10û 200 300 400 TtDâte Julienne) 1 I 1 05 0 il\ 50 V {Jours) tt D1(Sans unrtè) -NCEP *ECHAMS Figure 1.21 D2[Sans unrtè] -CRCM Observê Comparaison des lH observés et simulés à partir des sorties du MGG et du MCR, ainsi que des données du NCEPpour la période de référence,soit de 1961à 2010,à la rivière Ouelle. I 1 I ft o 0s 05 ft r00 rsc pt (m3s"1) zoo8r 05 il 015 t2 025 03 (Sans AMP2 unitèl 1 Fru Ëo 80 100 120 140 160 I (Date Julrenne! ,I 05 n- Uq V{Jours} Figure 1.22 Dl (Sans unrté) *ECHAMS Obærvêe -CRCM NCEP 1 \2 08 D2(Sans unrtè) Comparaison des lH observés et simulés à partir des sorties du MCG et du MCR, ainsi que des données du NCEP pour la période de référence,soit de 1961à 2010,à la rivière Moisie. 76 Les diagrammesde hammacillustrantles projectionsdes lH de débit d'étiagede la rivière Romaine(obtenusà partirdu modèleECHAMSet du MRCC)sont présentésaux figures1.23et 1.24. L'approcheAD2 montrant une performanceraisonnabledans la mise à l'échelledes indices de la rivière Romaine,elle a été utiliséepour produiredes projectionsà partir des sortiesd'ECHAMSsoumisaux scénariosA1B, A2 et 81 (figure1.25).Les résultatsobtenus pour les autresrivièresse trouventau chapitre4. Aucun changementde positionmarquén'est non négligeables observédans les diagrammes des changements de hamac.Toutefois, dans la médianeet la variabilitédes indicespeuventêtre remarqués.Par exemple,pour la rivière Moisie(voirles graphiquesau chapitre4), tous les scénariosont prévuune chutede la médiane et de la variabilitéde I'indiceT et ce, pour toutesles périodesfutures.Bien que ces projections soient informativesdans une certainemesure,elles ne permettentpas de dresser un portrait clairdes futursscénariosliésau débitd'étiage. 77 E n c Stl €El z. { *S: ll, !4Sr ,g gl & r3&: rt&, *&: & .F *.el {J Û: q s.3: e2, 1r1 S . t , ,:,,.... .....-::.,..... Â:3û*,4?5*a*1Ëûc &t&?*aÂl&â& ,,..-..."-,,, -.'-..."-,---..-.,..,.::s{f*;&Âlg*& P&2&ââW S1æ *1S&* Les@ri*&sdeb;næ l-esp.*rbde*de ternp* F i g u r e1 . 2 3 Diagrammeen hamac des lH de débit d'étiage prévus à la rivière Romaine,tels qu'obtenus à partir du modèle ECHAMSsoumis aux scénarios AlB, A2 et 81 pour les années 2O2O(2021 à 2050)et 2050 (2051à 2070).Hist réfèreà la période 1960-2010. n2 :.i tI S*-er {\{ e Û4 è-ç l:....... u.1 E anr à tvL g, ql ? & *1 7* 1& fi'ë x3û 6c € T@ U * *& Aa {t3 8t ë.'- a *.3: *'â', &.T; ,&: 11tsÎ rËos l"{ret l4ist C&***5*s tR*!*!*s L*s @ride* dê t*rnÊ€ Figure1.24 Diagramme en hamacdes lH de débitd'étiageprévusà la rivièreRomainetels qu'obtenusdu MRCCsoumisaux scénariosA1B,A2 et 81 pour les années2020(2021à 2050)et 2050(2051à 2070).Histréfèreà la période1960-2010. Copie originale très pâle 78 r3 --^An c{ Ë nrc ug' 5n- cn . ' . d c-- -lE : AI\ {D F 150 .9. *5 * 3æ: {ç: € =e3; tg & |....,.......: :.-.-. .{p :!: e- ruJ Cjæ 4: ".. {1, trd ,q?æ**"4Ê&5te&?tû6 Â45& Et*$* &tS* 1 4. *ig l-e* @'hde* d* teæp* Figure 1.25 5- â!85&r Ââ?SâÂt$&e 61*** e?S?Ce t M Lsù ^Àâ^r{æ 16rwËt da al'À rrmu u,Ë tËrrrlJJ Diagrammeen hamac des lH de débit d'étiage prévus à la rivière Romainetels qu'obtenus pour DD2 du ECHAMSsoumis aux scénariosA1B, A2 et 81 pour les années 2020(2021à 2050)et 2050 (2051à 2070).Hist réfèreà la période 1960-2010 79 7 DISCUSSION La comparaisondes résultats des approches directe, indirecte et de validation partielle présentée dans la section précédenteindique clairementque parmi toutes les méthodes évaluées,I'AD1(approchedirecteavec MVP) se démarquedes autreset constituela meilleure approchede miseà l'échelle. Cependant,cela ne vaut pas pourles approchesdirectesde mise à l'échelleen général.En effet, I'indiceV à la rivièreMoisie illustrebien cette affirmation,car que de validation, les résultatsobtenusont révéléque les tant pourles ensemblesd'étalonnage deux approchesindirectesainsi que I'AVP surpassentf AD2. L'indiceD1 à la rivière Moisie, pour les deux combinaisons et de validation, et I'indiceV à la rivière d'ensembled'étalonnage Ouellepourla combinaison d'autresexemples. C2, constituent Quant aux approchesindirectes,elles sont affectéespar les incertitudesliées à la mise à l'échelledes variablesclimatiques localesainsiqu'à la simulationdes débitsà I'aidedu modèle SSARR.Les erreursengendréessont propagéesà traverschaqueétapede la méthodeet cela affecte la simulationdes indices hydrologiquesde débit d'étiagecalculésà partir des débits simuléspar le SSARR.Les deux approchesindirectesprésententun rendementéquivalent quant à la mise à l'échelle des variables de précipitationset de températures,avec un rendementsupérieurpour ces dernières.Pour les précipitations, les valeursde coefficientde (R2)sont comprisesentre de 0,3 et 0,7, ce qui est appréciableconsidérantla détermination difficultéà modélisercette variable.Pour la même variable,la programmationgénétiqueest apparuecommeune meilleureméthodede séiectionque la régressionpas à pas descendante comme pour la régression,la et I'analysede corrélationcanonique.Pour la classification MVPPG(PG combinéeà la MVP)a mieuxperformrique les autresapprochesenvisagées. Ces améliorationssont probablementdues au fait que la régressionpas à pas descendanteet l'analysede corrélationcanoniques'appuienttoutesdeux sur des relationslinéairesentre ies prédicteursei les prédictants,et donc ne tiennentpas compte de prédicteursqui pourraient avoir une faiblecorrélationlinéairemais une fortecorrélationnon-linéaireavec les prédictants. La modélisationdes débits d'étiage à I'aide de modèles hydrologiquesdéterministesest fortementinfluencéepar la plus ou moins bonne représentation des processusqui régissentles débitsd'étiagesont introduitsdans la structuredu modèleutilisé.Par exemple,la rivièreOuelle connaît des débits d'étiage marqués en été en raison d'une forte évapotranspiration et de 81 faiblesprécipitations doubléesd'un apportd'eausouterrainemoinssoutenuen été. Quantaux rivièresMoisieet Romaine,les débitsd'étiagehivernauxsont attribuablesaux périodesde froid prolongées. et Ces processusont lieusur une vastegammed'échellesspatialeset temporelles la capacitédes modèleshydrologiquesà cet égard est variable(Davisonet Kamp, 2008). Le modèle SSARR représenteles processusdu débit d'étiageà I'aidede valeursconstantes(p. ex: taux de fontependantune périodede pluie)ou mensuelles(p. ex. : intensitédes chutesde pluie par rapportà I'indicedu taux d'efficacitéde l'évapotranspiration (tTEÉ),ITEÉ mensuel, taux de fonte effectifmensuel),ce qui pourraitrestreindresa capacitéà expliquerla variabilité des débitsd'étiage.De plus, les valeurslimitesinitialesdes paramètresdu modèleainsi que grâceà I'algorithme leur optimisation ont égalementune incidencesur les résultatsissusde la modélisation.Le choix des valeurs limites initialesdes paramètresdu modèle repose sur la connaissance des propriétésdes bassinshydrographiques du modélisateur. et sur I'expérience Le rendementde la routined'optimisation dépenddes réglagesinitiauxdes paramètres,du nombre d'itérationsdans I'explorationde I'espacedes paramètresainsi que de la mesure de performance (coefficients NASH,LOGNASH,R2et MODNASH)quia été optimisée. Dans certainscas, comme pour les indicesV et AMP2 de la rivièreMoisie,il apparaîtque les deux approchesindirectesde mise à l'échelleont surpasséI'AVP. Les valeursobservéesde températureet de précipitations utiliséespour I'AVP sont en fait des moyennesau bassindes mesuresacquisesaux stationsmétéo.De leur côté, les valeursmisesà l'échellesont obtenues à partirde la moyennepondéréedes valeursdes quatrepointsdans la grilledu NCEP les plus rapprochés des stations météo. Ainsi, il se pourrait que comparativementaux valeurs observées,les valeursmisesà l'échelledes variablesclimatiquesse rapprochentdavantagede que les approchesindirectesprésententun la véritablemoyenneau bassin,ce qui expliquerait meilleurrendement. Les indicesde rendementemployéspour quantifierles résultatsde la mise à l'échellesont la RREQM,le BMR et le R2.Dans biendes cas, on remarqueque diversesconclusions émergent quant au rendementdes différentesapproches,selon qu'ellesreposentsur le R2, sur la RREQMou le BMR. La racinede I'erreurquadratique moyenne(REOM)est la racinecarréede la somme de la varianceet du biais au carré. Statistiquement, les procéduresqui cherchentà minimiserle biais peuvent faire augmenterla variance.Conséquemment,deux modèles peuventavoir le même REQM mais un biais différent.L'utilisation du REQM comme unique mesurede performancepeut cacher une partiede I'information. C'est pour cette raisonqu'une 82 mesurede biais tel que la Biais Moyen Absolu (BMA) est utile pour comparerla performance des modèles.Le désavantagelié à I'utilisation du coefficientde détermination 1R2;,si I'on ne tient compteque de lui, résidedans le fait qu'il ne permetque de quantifierla dispersion.Par systématiquement les prévisionspeut conséquent, un modèlequi surestimeou qui sous-estime tout de même arriverà des valeursde R2 intéressantes.La variabilitéde I'indiceV à la rivière Ouelleconstitueun bon exemple.Dansce cas, il apparaîtque I'AD1a donnélieuà des valeurs supérieures de la RREQMet du BMR (> 1 dans les deux cas),maisà des valeursraisonnables du coefficientde déterminationR2.soit 0.77. 83 8 CONCLUSION L'objectifdu présentprojetétait de comparerla capacitédes approchesdirectes,indirecteset de validationpartielledans la mise à l'échelledes indiceshydrologiques du régimed'étiagede rivières de I'est du Canada. Pour les approches directes, la méthode stochastique d'apprentissagebayésienet la régressionlinéairemultipleont été utiliséespour modéliserles lH à partirde variablesatmosphériques. Ces deux méthodesstatistiquesont aussi été utilisées pour la mise à l'échelledes valeursde précipitations et de températureutiliséespour I'approche indirecte.Des projections des lH ont été obtenuesà partirde trois scénariosd'émission(A18, A2 eT81) soumisau modèleECHAMS(MCG)et d'un scénario(A2) soumisau MRCC (MCR). qu'ila été possiblede tirerà la suitedu projet: Voiciles conclusions 1 . L'AD1 (AD basée sur I'apprentissage bayésien)a surpasséles autres approches.Son meilleurrendementa trait aux valeursdes critéresde performance,à la différenceentre les résultatsd'étalonnageet de validation(capacitéde généralisation) ainsi qu'à I'utilisationd'un plus petit nombre de paramètres pour établir ses prévisions (parcimonie). 2 . Le rendementde I'approchedirecteest fortementinfluencépar les modèlesstatistiques utilisés.En effet, la régressionlinéairedirecte (AD2) s'est, dans certainscas révélée moinsperformanteque les approchesindirectes. 3 . Les approchesindirectesprésententdes résultatsmitigés.Ces approchessont affectées par les incertitudes liéesaux variablesclimatiques localesmisesà l'échelleainsiqu'à la simulation des débitspar le modèlehydrologique. 4. Pour la mise à l'échellede la températureavec I'approcheindirecte,MVP a mieux performéqu'ASDà toutesles stations.La miseà l'échellede la température a donnéde meilleursrésultatsque celle de la précipitation. À toutes les stations,des améliorations pour la mise à l'échelledes précipitations(occurrenceet quantité)ont été observées quand le PG est utilisé pour la sélectiondes prédicteurs,conjointementavec MVP (MVPPG).RLMPGn'a pas mieuxperforméque ASD, dans plusieursdes cas. MVP et ASD ont eu des résultatscomparablespour la mise à l'échelledes précipitations. Ceci peut indiquer que des relations non-linéairestelles que celles établies par la programmâtion génétiquesont mieux adaptéesà la sélectionde prédicteursque les méthodeslinéaires. 85 5 . Pour certainsindices,il apparaîtque les approchesde validationpartielleont été surpasséespar les deux approchesindirectes.Cela pourraitêtre attribuableà la nature localiséedu modèlehydrologique SSARR.Ce modèleutilisela moyenneau bassindes valeurs de précipitationset de températureobservées.Ainsi, il pourraitarriver que la moyenne des valeurs observées de ces variables ne représente pas le bassin hydrographique aussibienque les valeursmisesà l'échellecorrespondantes. 6 . Les projectionsdes lH de débit d'étiageobtenuesà partirdu modèleECHAMSet du MRCC révèlentdes changements quantà la moyenneet la à variabilité des indicesdes tranches de temps futures de 2021 à 2050 et de 2051 à 2080. Toutefois, il est impossiblede tirer des conclusionsdéfinitivesquant à ces projections,car les scénarios ne sont issusque d'un MCG et d'un MCR. 86 9 RECOMMENDATIONS Voici quelques recommandationsd'avenuesà explorer suite au travail présentédans cette thèse: 1 . La sélectionet la miseà l'échelled'autresindicesd'étiage,en particulier ceuxprésentant une autocorrélation temporelle. 2 . En plus des méthodesdirecteset indirectesprésentées,une troisièmeconsisteraiten la mise à l'échelledirectedes débits,suiviepar le calculdes indicesd'étiageà partirdu débitmis à l'échelle. 3 . La comparaisondes performancesde MVP utilisantdifférentesfonctions de noyau (linéaires, polynomiales, Laplace, etc) et I'analyse des projections futures correspondantes. La validationcroisée(Stone,1974)fournitune méthodesimpleet efficaceà la fois pour la sélectionde modèleet de l'évaluationde la performanceet est largementutiliséepar la communauté.Dans une étuderéaliséepar Shabbaret Kharin(2007),il a été suggéré que I'utilisationde techniquesde validationcroisée pour évaluer la performancede I'ACC en prévisions saisonnières opérationnellespeut surestimer la véritable performance.Une façon d'évitercette surestimationest de laisser une zone tampon autour de I'annéede prédiction(Zeng et al., 2012).Cette méthode,appelée< double validationcroisée>, pourraitêtre testéedans des étudesfutures. 5 . La distributiondes valeursdes prédicteursdans un climat futur à gaz à effet de serre d'un accru est généralementdécaléepar rapportà la distributionactuelle.L'application modèlede mise à l'échellestatistiquecalibréen tenantcomptedu climatactuelpour impliquedonc généralement d'extrapoler des relationsempiriques. fairedes prédictions Or, des modèles empiriques non linéaires peuvent se comporter de façons très différentesen mode d'extrapolation(Hsieh, 2009). Dans la présenteétude, le choix différent. d'un noyau autre que gaussienconduiraità un comportementd'extrapolation C'est l'une des limitesde la présenteétude,qui pourraitêtre exploréeen utilisantdes fonctionsde noyaudifférentes. 6 . L'une des hypothèsesfondamentalesde la réductiond'échellestatistiqueest que les relationsempiriquesdéveloppéesentre les prédicteurset les paramètresprévuspour le climat actuel devraientdemeurerdans le futur. Comme ces modèlesstatistiquessont calibrésen fonctiondes variablesde réanalysedu NCEP et que les projectionsfutures 87 sont obtenuesà partirdes sortiesd'un MCG, il aurait été instructifd'évaluerla fidélité des modèlesdans leursimulationdes prédicteurs NCEP.Cela n'a pas été fait dans les travauxen cours; en effet, I'objectifici était d'obtenirun pourcentagede changement dans les indicesd'étiagepour les deux périodesfuturesconsidéréeset non pas d'en arriver à des valeurs futures absolues.Certainesétudes se sont penchéessur les écartssystématiques existantsentre les sortiesGCM / MRC et les variablesNCEP.Par exemple, Jeong et al. (2012) ont trouvé des différences importantesentre les caractéristiquesstatistiquesdes sorties du modèle MCCG3 et des valeurs de réanalyses de NCEP,notammentpource qui est des valeursde la vorticitéà1000hpa, 850 et 500 hpa, de la composanteU de la vitesseà 1000 hPa, de la températurede I'airà 2 m et et la directiondu vent à 1000 et 500 hPa de niveau.On recommande donc, comme avenue à explorer,de procéderà une correctiondes sortiesdu modèle pour la projectiondes indicesd'étiage. ECHAMS/CRCM 7. Une mainièred'estimerI'adéquationdes résultatsdes occurrencesde précipitations simulées est le score de Brier (Stefanove at al, 2002: Krishnamurtiet al 2012). En particulier,I'utilisationde ce critère de performancedans le cas de I'applicationdes méthodesprobabilistes génériqueset le RVM pourraitindiquer tellesque les algorithms la supérioritéde ces méthodepar rapportaux autrestestées,en comparantles scores de Brier aux MAE obtenus par les autres méthodesnon-probabilistes. ll est donc recommendépour les travauxfuturs. 88 PARTIE2: ARTICLES CHAPITRE 2 DATABSEDCOMPARISON OF SPARSEBAYESIAN LEARNING AND MULTIPLE LINEARREGRESSION FOR STATISTICAL DOWNSCALING OF LOW FLOWINDICES DeeptiJoshil,AndréSt-Hilairel, Anik Daiglet't,Taha B.M.J.Ouardal'2 t tttRs-ete, Universityof Quebec, 490 de la Couronne, Quebec G1K 9A9, Canada ([email protected], [email protected], [email protected]) 2 Masdar Instituteof Science and Technology,PO Box 54224, Abu Dhabi, United Arab Emirates([email protected]. inrs.ca) ae, taha.ouarda@ete. ' CégepGarneau,1600boulevardde I'Entente, Québec,G1S 4S3, Canada Corresponding Author:DeeptiJoshi Articlepubliédans Journalof Hvdroloqv(2012)488:136-149 The work done in this article is the result of the combined efforts of its authors. The implementationof the mathematicalalgorithmsin MATLAB was performedmostly by Deepti Joshi with significantcontribution from Anik Daigle.With the help of all the co-authors,the preparationof relevantdatabases,evaluationof the resultsand draftingof the initialversionof the manuscriptwere done by Deepti Joshi. All the co-authorsadvised in the developmentof methodologyof the work, analysisof the resultsand in draftingthe article 91 ABSTRACT This study attemptsto comparethe performanceof two statisticaldownscalingframeworksin downscalinghydrologicalindices(descriptivestatistics)characterizingthe low flow regimesof three rivers in EasternCanada- Moisie,Romaineand Ouelle.The statisticalmodels selected are RelevanceVectorMachine(RVM),an implementation of sparseBayesianLearning,and the AutomatedStatisticalDownscalingtool (ASD),an implementation of MultipleLinearRegression. Inputs to both frameworksinvolveclimate variablessignificantly(o=0.05)correlatedwith the indices. These variables were processed using Canonical CorrelationAnalysis and the resultingcanonicalvariatesscoreswere used as inputto RVM to estimatethe selectedlow flow indices. In ASD, the significantlycorrelatedclimate variableswere subjected to backward stepwisepredictorselectionand the selectedpredictorswere subsequentlyused to estimatethe selected low flow indices using multiple linear regression. With respect to the correlation betweenclimatevariablesand the selectedlow flow indices,it was observedthat all indicesare influenced,primarily,by wind components(Vertical,Zonal and Meridonal)and humidity variables (Specificand Relative Humidity).The downscalingperformanceof the framework involvingRVM was found to be betterthan ASD in terms of RelativeRoot Mean Square Error, RelativeMean AbsoluteBias and Coefficientof Determination. In all cases,the former resulted in less variabilityof the performanceindicesbetweencalibrationand validationsets, implying bettergeneralization abilitythan for the latter. Keywords: Downscaling,Low flows, Canonicalcorrelationanalysis,Sparsebayesianlearning, Multiplelinearregression 93 INTRODUCTION Canadaexhibitsa considerablediversityin land use and climatewhich resultsin differencesin processesaffectinglow flows at differentgeographiclocations.Informationon low flows is requiredfor several purposessuch as industrialneeds, agriculturaldemands,water pollution control requirementsand environmentalflows. In addition, low flows play a crucial role in riparianecosystemand salmonmigrationdue to their impacton the reductionof habitatquality and quantity(Frenetteet al., 1984).In a comprehensivereviewon low flow hydrologySmakhtin (2001),indicatedthat climatechangemay have greatereffectson low flows than high flows. ln a recent study, Burn et al. (2008), found differencesin low flow characteristicsand their associatedimpactsbetweensix regionsacrossCanada.In Quebec,the timingof low flows was found to transitfrom a unimodaldistributionof late winter flows in the northernportionof the province,to a bimodaldistribution(both late winterand late summerflows)in the centralpartsof the province,to a unimodaldistributionof late summer flows in the southern portion of the province.During winters, low flows occur as a result of storage depletionfollowingfreezing temperatures,whereas,occurrenceof summer low flows is attributedto low precipitationand increasedevaporationdue to highertemperatures. A numberof hydrologicalindices(Hls) characterizing differentaspectsof the low flow regimeof a river, have been proposed.These indices have been extensivelyused in water resource developmentand providea convenientdesktopmethodto assessflow thresholds(Arthingtonet al., 2006; Monk et al., 2006; Richteret al., 1998).The developmentof Hls dependson the nature of objectivesin hand and applied methodology(Olden and Poff, 2003).The most commonlyused hydrological indicesinclude7Q10,7Q2, Qgsand Qeoflows (Riggset al., 1980; Smakhtin,2001;Tharme,2003),where subscriptsindicatepercentilesand normalfonts indicate return periods.In Canada, the indices 7Q10, 7Q2 and 30Q5 are the most widely used characteristicsfor determining the waste load assimilative capacity and water supply managementduring droughts. In recentyears, low flow indiceshave been used in ecological flow studies.The naturalflow paradigm(Poff et al., 1997),is a frameworkto assessecological flow needs that is based on the notionthat in an alteredhydrologicalregime,flows should be managedsuch that key characteristics of the naturalhydrogramare reproduced.In this context, low flow indicesare grouped in five categories:Amplitude,Frequency,Duration,Timing and Variability.Using indicesfrom each category in the context of the study of climate change 94 impactson low flows offers the advantageof providingkey ecologicallysensitiveinformation withouthavingto generatedailyflow time series. For a betterunderstandingof potentialfuture changesdue to anthropogenicactivities,several studies investigatedthe presenceof trends in low flow indices(Adamowskiand Bocci, 2001; Burnand Elnur,2OO2;Ehsanzaehand Adamowski,2007;Yue et al, 2003;Yue and Pilon,2OO3: Zhang et al., 2001 ). Keepingin view the adverseeffectsof climatechangeand the relevance of low flow informationin water resourcesmanagement,Smakhtin(2001),gave emphasisto the need to quantifythe impactsof climatechangeon low flows.Typically,future climatechangeis modelledwith severalhypotheticalscenariosgeneratedby GeneralCirculationModels(GCM). The inabilityof the GCMs to capturesub-gridscalefeatures(suchas topographyand land-use), due to its coarse spatial resolutionmade it unsuitablefor climate change impact studies. Therefore,the climate research community focussed on the developmentof 'downscaling techniques'to shorten the gap between large and local scale climate data. To date, impact studiesof climatechange on hydrologyare investigatedthrougha two step process.The first step involvesusing GCM outputsto generatelocal climateconditionssuch as precipitation and 'downscaling'. temperature,which is known as The downscaledlocal climate data are then introducedas input to a hydrologicalmodel to projectthe hydrologicalchanges that may be broughtabout by future climate (Drogueet al., 2004; Flato et al., 2000; Loukas et al., 2OO2; N a s ha n d G l e i c k 1 , 9 9 1 ;R o ye t a l . ,2 0 0 1 ;S i m o n o v iacn d L i , 2 0 0 3 ) . Downscalingmethods (Wilby et al., 2004) are divided into two categories:dynamicaland statistical(also known as empirical)approaches.Dynamicalapproachesinvolve running regional climate models (RCMs) with GCM outputs as boundaryconditionsto simulate processesat much finer scale in comparisonto GCMs. However,RCMs are computationally expensivein additionto the possibilityof being appliedto iimitedperiodsand regions.The currentwork relieson StatisticalDownscaling(SD) approaches.These approachesderivethe relationships betweenbroadscalevariables(predictors), obtainedfrom reanalysisdata, and fine scale surface conditions (predictands).The variables that are strongly related with the predictandor responsevariablemust be selectedas predictors.Futureprojectionsfrom GCM or RCM are then used in theserelationships to estimatethe changesin the responsevariable.SD methodscan be classifiedinto three types:weatherclassification approach,weathergenerators and regression basedmethods. 95 methodswere amongthe earliestdownscaling approaches(Kimet al., 1984;Wigley Regression linearor nonlinearrelationships et al., 1990).These approachesgenerallyinvolveestablishing between predictorsand predictands.Several studies have shown that accountingfor nonlinearity in the relationshipsbetween the predictors and predictandscan result in better downscalingability.Examplesof such methods include-ArtificialNeural networks(Hewitson and Crane, 1996), kernel based neural networkssuch as Support Vector Machines(SVM) (Cortesand Vapnik,1995;Cristianini and Taylor,2000;Haykin,2003;Sastry,2003;Tripathiet , 9 9 5 , 1 9 9)8. a l . ,2 0 0 6 ;V a p n i k 1 The two-stepmodellingframeworkcombiningGCM outputsto a hydrologicalmodel is usually constrainedby the gaps existingbetweenGCMs abilityand spatialresolution,and the need of hydrologicalmodellers.Accordingto Xu (1999),there are spatial,temporaland verticalscale mismatchesbetween GCMs hydrologicalmodels. In addition to that there are mismatches betweenGCMs accuracyand the hydrologicalimportanceof the variables.For example,runoff, soil moistureand evaporationare not well representedby GCMs but are of extremeimportance in hydrologicregimes. Apart from these gaps, the data requirementof these hydrological fully distributedmodels,are large. Davisonand Kamp (2008),in a brief models,particularly review,analyzedsix modelsdevelopedand/orused in Canada,in terms of their abilityto model low flow processes.The modelsvariedin their abilityto incorporatelow flow processessuch as drawdown of storage in lakes, stream channels and wetlands, riparian evapotranspiration, freeze-upand bank storage.One way to overcomethe drawbacksassociatedwith the two step approachcould be to establisha direct link betweenbroad scale climatevariablesand low flow indices.Such a directlink is criticisedbecauseof an over-simplification of the hydrologicalcycle and ignoranceof the factorsaffectingstreamflowvariabilitysuch as land use . In a reviewon the impactsof largescale climatevariabilityon low flows over Canada,Bonsaland Shabbar(2008) found that low streamflowsfor rivers in Eastern coastal regions of Quebec are positively correlated with Northern Annular Node and negatively correlated with El-Nino Southern Oscillation(ENSO) and Pacific North American pattern (PNA) before 1970s but positively correlated with PNA aftenruards.Such a study implies a link between the variables atmosphericprocessesand low flow indices. characterising To our knowledge,directdownscalingof low flow indices,linkinglow flow indicesto large scale atmosphericpredictors,has never been investigatedbefore.Hencethe objectiveof the current work is to test the abilityof two downscalingframeworks,to downscalelow flow Hls. The first framework involves an implementationof Sparse Bayesian Learning (SBL) which is a probabilisticBayesianapproachwhereas the second involvesan implementationof Multiple 96 LinearRegression(MLR).SBL is a recentlydevelopedapproachand basedon literaturereview, the numbers of applicationsof SBL for downscalingpurposes,particularlyin North America were found to be scarce.MLR, on the other hand, has been appliedin many downscaling (Hessamiet al., 2008;Wilbyet studiesinvolvingpredictands temperature such as precipitation, al., 2OO2)and runoff(Nietoand Wilby, 2005).The downscalingabilitiesof the two frameworks will be tested for the low flow Hls correspondingto three rivers in EasternCanada-Romaine, Moisie ancl Ouelle. The following section describes the background and mathematical formulations behindthe approaches. 97 2 DOWNSCALTNG STATISTICAL A diverserange of statisticaldownscalingmethodshave been developedin recentpast. Details of the generaltheory,limitationsand practicesof these methodshave been discussedin detail ( G i o r gai n d M e a r n s 1 . h e s es o u r c e sg r o u p , 9 9 1 ; W i l b y a n dW i g l e y , 1 9 9 7X; u , 1 9 9 9 ) T elsewhere downscalingtechniquesinto four main types: (1) dynamicalclimate modeling,(b) synoptic weather typing, (c) stochastic weather generation, or (d) regression based approaches. Regression-based downscalingmethodsare frequentlyused. These methodsrely on empirical relationshipsbetween local-scalepredictandsand regional-scalepredictor(s).Driven by the need to provide a decision support tool for the rapid developmentof single-site,ensemble scenariosof dailyweathervariablesundercurrentand futureregionalclimateforcing,Wilby et al. (2002),developeda Windowsbaseddecisionsupporttool known as StatisticalDownscaling Model(SDSM). 2.1 AutomatedStatisticalDownscalingTool Inspiredby the SDSM approach,Hessamiet al. (2008) developedan automaticstatistical downscaling(ASD)tool. ASD is a regressionbasedapproach,capableof performingstatistical from predictorselectionto modelcalibration,scenariogenerationand downscalingautomatically statisticalanalysis of scenarios.The automationis designed to replace SDSM's subjective method of predictorselection,requiringsignificantinput on the part of the user, with a more objectiveapproach.lt allowstwo methodsof predictorselection:backwardstepwiseselection (McCuen,2003)and partialcorrelation (Afifiand Clark,1996).ln additionto MLR, it coefficients also allows the use of ridge regression(Hoerl and Kennard,1970) which accountsfor the collinearityof the predictors,which can make the least square estimatesof the regression coefficients unstable.Fulltechnicaldetails,includingmodelvalidationand usage,are described by Hessamiet al. (2008). 2.2 SparseBayesianLearning Severalstudieshave shown that accountingfor non linear relationbetweenthe predictorsand predictandcan improvethe goodnessof fit (Huth et al., 2008). For this reason,ArtificialNeural Network(ANN) based downscalingtechniquesgained wide recognition(Crane and Hewitson, 1998;Wilby et al., 1998).The abilityto generalizea relationship from given patternsmakesit possiblefon ANNs to solve large-scalecomplex problemssuch as non-linearmodelingand classification(ASCE Task Committee on Artificial Neural Networks in Hydrology,2000b; Govindarajuand Rao, 2000). While accuracyin predictionsis universallyvalued,a recent interest in the notion of sparsity divertedthe focus of the researchcommunityon learning algorithmstrvhichuse fewer parameters.One of the significantdevelopmentsin this directionis SupportVe,ctorMachines(SVM),a machinelearningalgorithm.SVM (Cortesand Vapnik,1995) have founcl wide applicationin the fields of pattern recognitionand time series analysis. However,despiteits success,SVM sufferedfrom severaldrawbackswhich were overcomein SparseBay'esian Learning(SBL)algorithms. SBL (Fauland Tipping,2OO2) enablesexploitinga probabilisticBayesianlearningframeworkto derive accurate predictionmodels which utilise dramaticallSr fewer basisfunctionsthan SVM for a comparableproblem.A detaileddescriptionof the theoreticalbackgroundof SBL and the mathematicalformulationsof the algorithmare shownin appendix1. 2.2.1 RellevanceVector Machine RVM (Tipping,2001)makespredictions basedon functionsimplemented by SVM. SVM makes predictionsbasedon the function r : f{x; *,t'}: fpra.,ff{x,x,} + wo (2-1) where K{-a:*:}is a kernelfunction,effectivelydefiningone basisfunctionfor each examplein the trainingset. RVM is a Bayesiantreatmentof (2-1).The most compellingfeatureof RVM is that, while capable of generalisationperformance,it supports sparsity by utilisingfewer kernel functions(Chenet al.,2008). 99 3 STUDYAREAAND DATARESOURCE The study area comprisesof three rivers in Eastern Canada- Romaine,Moisie and Ouelle. Moisie and Romaineare locatedon the North shore whereas Ouelle is locatedon the south shoreof the St. LawrenceRiver.The currentstudyfocuseson thesethree riversas they sustain AtlanticSalmon(Sa/mo salar)populations,which has been regardedas an endangeredspecies (Committeeon the Statusof EndangeredWildlifein Canada,2011). The locationsof dischargeand meteorologicalstationson each of these rivers are shown in figure2.1. Both Moisieand Romainehave one hydrometricstationand have two meteorological stationslocatedwithinthe limitsof their drainagebasins.RiverOuellehas one dischargeand station,with the former lying within and the latter lying outsidethe limitsof one meteorological i t s d r a i n a g e b a s i nT.h e d e t a i l s o f t h e h y d r o m e t r i c s t a t i o n s a r e g i v e n i n t a b l e 2 . l . T h e s o u r c e o f flow and meteorological data for each of the three stationsis the EnvironmentCanadadatabase (http://www.climate.weatheroffice.qc.ca ). For the flow data, years with one{hird of the data (>4 months)missingwere excluded. L00 1 r .i., n ,] w] 'l Océan "{tlantique l i\Ioisie ) 1. La Pocatièle \: J T":r- ( a{ * i i ./3 ../ .ï 4M; Sept- Har,r'e-Saint-Pierre F i g u r e2 . 1 The study area map showing the locationsof dischargeand meteorologicalstations on each river. The squares and circles denote meteorologicaland discharge stations, respectively. Table 2.1 Descriptionof dischargestations. Station Latitude Romaine 50"18'28'N Longitude Gatchment Area(Km2) Years Years Excluded 63"37',21" W 13000 19612010 2007 Moisie 5 0 " 2 1 ' 1N " 6 6 " 1 1 ' 2 5W " 19000 19662010 1967,1999,2000,2007 Ouelle 47'22'52"N 69'57'29'W 795 19612010 1 9 6 7, 1 9 8 1, 1 9 8 2 , 1 9 9 6 101 The precipitationand temperature(daily average) normalsof the meteorologicalstationsare shown in figure2.2. Due to limiteddata availabilitythe normalsfor Lac Eon and HavreSt-Pierre meteorological stationswere calculatedfrom 1964-1976(13 years) and 1964-1984(21 years), respectively.For the rest of the stationsnormalswere calculatedfor 30 years (1971-2000).The meteorological stationsat Sept-llesand HavreSt-Pierreare locatednear the dischargestations on Moisieand Romaine,respectively.Spatialdifferencesin temperatureare evident between to Moisieand Romainein the Northshoreand Ouellein the southshore. stationscorresponding is observedat stationLa Pocatiere(18.0"Cin July)on The maximumdailyaveragetemperature Ouelle,followedby Sept-lles(15.5"Cin July)on Moisieand HavreSt-Pierre(14.1"Cin August) on Romaine.The minimum daily average temperatureis exhibited by Fermont (-23.0"C in on January)on Moisie,Lac Eon (-18.2"Cin February)on Romaineand La Pocatiere(-10.3oC) Ouelle.ln additionto that, potentialevaporation(plotsnot shown)shows an increasefrom north to south (Burn et al., 2008). Highestannual precipitationis observedat station Sept-lles (1156mm)and lowestat stationFermont(806.5mm). The flow regimeof each river is shown in figure2.3. The daily mean specificflow is indicatedby darkerlinesand the dottedlines representdaily mean flow plus and minusthe dailystandard deviation.Winter low flows are prominentfor Romaineand Moisie.The minimumspecificflow 2; is slightlylower than the same for Romaine(-5.39 Ls-1Km-2;. The for Moisie(-4.5 Ls-1Km hydrogramcorrespondingto river Ouelle revealsthe presenceof two low flow seasons (late is highestin the caseof Ouelle. winterand latesummer).In additionto that,dailyflow variability 102 $ 'ç {} Tet: SS:Ja* feb Wr May ,Cpr * :a !4 "e r rr.;r-,Wt:æT "!a* fls& â'{*r W W :, :f*rNçnt*t*c Figure 2.2 Jsl At:g $€p Sc{ Nenr &€t r *&::&::'&'wÉ: G&::'*k 're g * Jun Juc Js{ Âu* &p ûft !{av -' ûêe Ë*n Çfræ*rc StPienaW'Sepl.llee i...-....]La Fcætt*r* Precipitation and Temperature normals of the meteorological stations. For Lac Eon and Havre-St Pierre normals are calculated for 1964-1976and 1964-1984respectively.For the remainingstations normals correspond to 1971-2000. *A:13,W{nrÊ 1W " r"l r* 1ffi. 1fl*: â3 !'7 gt -â : &, J t*0 ?*fl 3*û Juf*nFay ?m {l !*s SÂ:?95Knf 2æ 3æ Julb*ûay * g:a îsû * I -t 1ût zw 3æ 4ûs Jpl!ætay Figure2.3 Mean specific hydrogramsfor (a) Romaine,(b) Moisie and (c) Ouelle.The dotted lines indicate daily mean specific flow plus and minus the daily standard deviation. The drainage area of each river is also indicated. 103 4 METHODOLOGY 4.1 Selectionof Low flow Indices Over 200 Hls have been definedand reportedin the literature(Clausenand Biggs, 1997; Extenceet al., 1999;Hughesand James,1989;Poff and Ward, 1989; Puckridgeet al., 1998; Richter et al., 1998). In a study, attemptingto characterizethe low flow regimesof rivers in EasternCanadausingdata from 175 dischargestations,Daigleet al. (2011) identified71 Hls as potentiallyrelevantfrom the low flow perspective.FollowingRichter et al. (1996) these indices were categorizedinto five groups describingdifferentaspects of low flow regime frequency,duration,variability magnitude, and timing.The numberof indiceswas reducedfrom 71 to eighthighlyinformative and low-correlated Hls usingPrincipalComponentAnalysis(PCA). The selected Hls were then tested for their ability to describe the regional features and differencesamong the low flow regimesof rivers in EasternCanada.Based on this work, non redundantHls, explainingmore than 75% of varianceof low flow Hls, were selectedfor the currentwork. To accountfor the impactsof temporaldependenceon the validityof statistical estimates,indicesexhibitingautocorrelation were avoided.In keepingwith the principlesof the naturalflow paradigm,the selectedindiceswere: minimumsof Marchflow valuesfor each year (A1),ratioof the lowestannualmonthlydischargeto the mean annualdischarge(A2),average Juliandate of the seven annualone day minimumdischarges(T), standarddeviationof the Juliandate of the seven 1-dayminimumdischarges(V),90-dayminimumdividedby the median of the entire record (D1) and 90-day minimum calculatedfor July-October,divided by the median of the entire record (D2).Theseindicesare shown in table 2.2. Figure 2.4 shows box plots correspondingto the selectedlow flow indicesfor each river.The medianand the outliers '+' are representedby a gray line and sign, respectively.The followingsectionbrieflydescribes some of the inferencesdrawnfrom these box plots. LO4 Table 2.2 Selectedhydrologicalindices definitionwith index code. lndex Description Timing A1 Minimumsof Marchflow valuesfor each year (Ls-1km-2) Yearly A2 Ratioof the lowestannualmonthlydischargeto the meanannualdischarge(unitless) Yearly T AverageJuliandateof the sevenannual1-day minimumdischarges(Juliandate) Yearly V Standarddeviationof the Juliandateof the seven 1-dayminimumdischarges(days) Yearly D1 90-dayminimumdividedby the medianof the entirerecord(unitless) Yearly D2 90-dayminimumcalculatedfor July-October, dividedby the medianof the entirerecord (unitless) 105 Seasonal Ë ,* r !d: {s s.3 1tl : nt a tl q 3 a' *.1 a *t trW: g ?5*: awt o a* r-"* tæi € -? Iwi > â" 58, 5&: lt u a ç e6 tJ* nA *t ^a :3 fi, WL : tt fr? é 4, r:3 fî-t 't.......... ...-.:...:.:........ M*iaie Figure 2.4 -::. -'- uia 61 *' ........................... ......:i:.... R*n:ain* Ouetle g, |rllæsiç f,srn*i*e Box plots of low flow indices using the entire availabledataset.The gray line representsthe median and the '+' sign shows the outliers. 4.1.1 SelectedLow flow Indices 4.1.'1.1 A1 (MinimumMarch Flows) For Moisie,the A1 mean and medianvaluesof the sample are 4.2 L/s/Km2and 3.8 Us/Km2, respectively.There are two outlierscorrespondingto the years 1968 (6.8 L/s/Km2)and 1981 (8.9 L/s/Km'; becauseboth the years have experiencedrainfalleventsin the monthof February leadingto 88.2 and 116 mm of rain,respectively. For the dischargestationon riverRomaine, There are two the mean and medianvaluesof the index arc 4.8 and 4.7 L/s/Km2,respectively. outlierscorrespondingto the years 1970 (7.4 Us/Km2)and 1981 (8.8 L/s/Km2).In the case of river Romaine,the station Havre St-Pierreexperiencedwinter rainfallevents in the month of to years 1970 and 1981 amountingto 60.6 and 76.10 mm of rainfall, Januarycorresponding respectively.For Ouelle,the mean and the medianvaluesof the index are 2.5 and 2.0 LlslKm2 and there is one outliercorrespondingto the year 2000 (10.2LlslKm2;.Among the three rivers, the index correspondingto Romaineshows the highestmedian value followedby Moisie and to range (lOR),it can be said that the indexcorresponding Ouelle.Basedon the interquantile For Romaine,the positionof the medianand the lengthof the Ouelleexhibitslargestvariability. top and the bottomwhiskersreflectproximityof the distributionof the sample,to symmetry.For Moisieand Ouellethe same factorsindicatepositiveskewness. 4.1.1.2 A2 (Baseflow Index) For Moisie,Romaineand Ouelle,the respectiveA2 mean (median)valuesof the sampleare 0 . 2 0 ( 0 . 1 9 4 ) ,0 . 2 2 3 ( 0 . 2 1 8 ) a n d 0 . 1 2 ( 0 . 1 1 1 ) .I n c a s e o f M o i s i e t h e r e i s o n e o u t l i e r correspondingto year 1968. In case of Romaine,there are two outlierscorrespondingto years 1962and 1974and so is for Ouelle,for the years1986and 2006. In all the cases,the lengthof the whiskersand the positionof the medianindicatereasonably symmetricsample.The median value is highestfor Romainefollowedby Moisie and Ouelle. In terms of lQR, the largest variability is exhibitedby Ouellefollowedby Moisieand Romaine. 4.1.'1.3 T (AverageJulian date of seven one day minimum) The mean (median)valuesof the samplesof the T indexfrom Moisie,Romaineand Ouelleare 1 1 3 . 6( 1 1 6 ) ,1 1 1 . 4 9( 1 1 3 . 1 5 a ) n d 1 8 2 . 6 1( 2 1 8 . 2 8 )r e s p e c t i v e l T y .h e b o x p l o t ss h o w t h a t t h e samples correspondingto Romaine and Moisie are comparableto each other in terms of variability and magnitudeof the median.On the otherhand,the samefrom Ouelleshowshigher medianand largervariabilityin comparisonto the rests.The largervariabilitycan be attributed to the bimodaldistribution of the timingof low flows (latewinterand late summer).In addition, for Ouelle, the positionof the box and the length of the lower whisker indicatea negatively skewedsample.For Moisieand Romaine,the samplesappearto be reasonably symmetric.For the former,the box plot is characterizedby two outlierscorresponding to years 1968and 1981. Dailyminimafor Moisieare observedin the monthsof Marchand April. For these years,rainfall eventsoccurredin February,shiftingthe daily minimato Januarythus decreasingthe index value. 1.O7 4.1.1.4 V (standarddeviationof the Julian date of seven one day minimum) For all the rivers,the box plotsof the V valuesare characterizedby severaloutliers.For Ouelle, 'outlier'years, in the daily minima appear in both of the low flow seasons,increasingthe variabilityof the corresponding Juliandates.The mean (median)valuesof the samplesfrom y .o r a l l M o i s i eR , o m a i n ea n d O u e l l ea r e 3 . 5 5 ( 2 . 1 6 ) , 3 . 5 0( 2 . 1 6 )a n d 1 6 . 3 6( 3 . 3 1 ) r, e s p e c t i v e l F the rivers, the box plots indicate positivelyskewed samples. The mean, median and the variabilityof the samples are comparablebetween Romaine and Moisie. The sample to riverOuelleexhibitshighestmedianand largestvariabilityin comparisonto the corresponding rest. 4.1.1.5 D 1 ( A n n u a l9 0 d a y m i n i m u md i v i d e db y Q 5 0 ) The mean (median)valuesof the D1 indexfor Moisie,Romaineand Ouelleare 0.19 (0.185), 0.22 (0.21) and 0.33 (0.31) respectively. The sample from Ouelle exhibitshighestmedian followed by Romaine and Moisie. Apparentlyfrom the box plots, Ouelle manifests largest variability followedby Romaineand Moisie.The samplesfrom Romaineand Moisieappearto be reasonablysymmetricwhereas the same from Ouelle is right-skewed.There are outliers to years 1970for Moisie;1962, 1967, 1970and 1978for Romaineand 1973and corresponding 1979for Ouelle. 4.1.1.6 D2 (90 day minimum for 52 divided by Q50) The mean (median)D2 values of the samplesfrom Moisie,Romaineand Ouelle are 0.796 (0.820),0.690(0.763) and 0.808(0.448) respectively. Romaineexhibitshighestmedianfollowed by Moisieand Ouelle.The largestvariability is seen in Ouellefollowedby Romaineand Moisie. For Romaine and Moisie,the positionof the boxes and the length of the whiskers indicate reasonablysymmetricsampleswhereasfor Ouelle,the sampleis positivelyskewed.There are no outliersin case of Romainewhile Moisiehas one (year 1968)and Ouellehas three (years 1984,1992and 2002).For Ouelle,thesewere the yearsin whichthe seasonal90 day minimum was twice the medianflow. 108 4.1.2 Predictor Selection One of the most importantsteps in a downscalingexerciseis to select appropriatepredictors. Wilbyet al. (1999)proposedthreemainfactorsconstraining (1) reliable the choiceof predictors: simulationof the predictorsby the GCM; (2) how readilyavailablethe GCM outputsare; and (3) the correlationstrengthwith the surfacevariablesof interest.For the currentwork, 21 variables were tested as potentialpredictors.The variablesat differentpressurelevels (1000,850 and 500 hPa)includedRelativeHumidity(RH),SpecificHumidity(SH),Zonal(U), Meridonal(V) and Vertical (ul) componentsof wind and geopotentialheight. Sea Level Pressure (SLP) and HeatingDegreeDays(HDD)were alsoconsidered. HDD indicatesthe numberof degreesthat a day's average temperatureis above a certain threshold(base temperature).For the current work the base temperaturehas been taken as 1oC.The full list of the testedpotentialpredictors is given in table 2.3. Reanalysisdata from the NationalCenter for EnvironmentalPrediction (NCEP; Kalnay et al., 1996) were used as large-scaleatmosphericpredictorsto calibratethe modelsand validatethe approaches.These datasetsare typicallyviewed as 'observed'largescaledata on a regulargridwith a spatialresolutionof approximately2.SX2.S (250 km X 250 km). Each NCEP variablewas interpolatedto each of the three hydrologicalstationslocations using bilinearinterpolation.For a given station,the interpolateddata are the weightedaverage of the data of four nearestpointslocatedon a regulargrid. L09 Table 2.3 NCEP predictors used in the downscalingframework. Number Predictor Names Meantemperatureat2m Meansea levelpressure Specifichumidityat 1000hPa Specifichumidityat 850 hPa Specifichumidityat 500 hPa Relativehumidityat 1000hPa Relativehumidityat 850 hPa Relativehumidityat 500 hPa Zonalwind comoonentat 1000hPa 10 Zonalwind componentat 850 hPa 11 Zonalwind componentat 500 hPa 12 Meridonalwind componentat 1000hPa 13 Meridonalwind componentat 850 hPa 14 Meridonalwind componentat 500 hPa 15 Verticalwind componentat 1000hPa 16 Verticalwind componentat 850 hPa 17 Verticalwind componentat 500 hPa 18 heightat 1000hPa Geopotential 19 Geopotentialheightat 850 hPa 20 heightat 500 hPa Geopotential 21 HeatingDegreeDays For each dischargestationcorrelationcoefficientswere computedfor the low flow indicesand the yearly,seasonaland monthlyseries of every climatevariable(listedin table 2.3). The variables showing significant correlation (o<0.05) were selected for further processing (described in the next subsection).Oneshould however note that significancedoes not necessarily implythat the variableis a usefulpredictorsincethe amountof explainedvariance may be low. These significantlycorrelatedvariablesare mentionedin the tablesshown in table 2.6. The numbersin bold representnegativelycorrelatedvariableswhereasthe normal fonts indicatepositivelycorrelatedvariables. L1,1, Table2.4 Predictands significantly correlated with selected low flow indices for river Romaine. Negativelycorrelatedpredictors are indicatedby bold numbers whereas normal fonts indicate positively correlated predictors. The mentioned numbers refer to NCEP reanalysis variables listed in table 2.3. A1 4,5,20 January February March 3,4,5,6, 9,10,12, 15,16,17, 19,20,21 2,3,4,6,7, 10,12,13, 14.18 10,12,13, 14 11 '10,14 April 3,4,7 10,11 5,14,15 3,8,9,10 3,4,16,17, 18 4,14 18 May 3,4,19 3,8 June 4,5,19,20 6,7,10, 1',1 2,18,19 July August 6,8 12,13,14 3,4,5,19, 20 September 12,13,15 13,15,21 5,8,13,20 October December 5,8,7,10, 11 Winter (DJF) 3,4,5,6,7,8, 9,10,11,12, 14,15 2,6,7,10, 11,13,14 Autumn (soN) Annual 15 20 November Spring (MAM) Summer (JJA) 12 4,5 1',1 13,14 3,4,10,11 3,4,5,9, 10,11,12, 16,17 9,10,11,1 6,17 3,5,15,16, 17 6,18,19,2 0 2,6,7,9 18,19,20, 12 3,4 10,11 5,7 13,15 3,4,5,19, 20 7,20 9,10,11,12, 9,12,2Q 13,14,16,17 r12 3,4,20 14 2,3,4,5, 9,10,11 16.18 3 , 4 , 51,0 , 11,20 T a b l e2 . 5 Predictandssignificantlycorrelatedwith selected low flow indices for river Moisie. Negatively correlated predictors are indicated by bold numbers whereas normal fonts indicate positively correlated predictors. The numbers mentioned refer to NCEP reanalysis variables listed in t a b l e2 . 3 . A1 January 1 0 ,8 February 3,4,6,9, 1 0 , 11 , 1 5 , 16,17 9,10,11, 15,16,17 1,2,6,7,10, 11,',12,13, 14,18 12,15,16, 17 3,4,5 10 3,4 3,4,5,8, 9 , 1 0 ,1 April 17 May 14 June July 7,8 11 August 9,15 September 8,14 October 13,17 November December 12,13,14 1, 1 1 ,1 7 Winter (DJF) 4,5,6,7,8, 9,10,11, 16,17 Spring (MAM) 2,7,10,1',1, 18,19, 11 2,12,13,14, 18,19,20 5,9,13,14, 15,16 10,11,16, 17 11,5 11,16,17 3,4,5, 10 11 12 12,13,14 (soN) 6,14 11 13,',t4,15 Autumn 11 12,13 13,15,17 5,17 Summer (JJA) Annual 8,19,20 7,10,11,13, 16 I 11_3 16,17 9 , 10 , 11 Table 2.6 Predictandssignificantlycorrelatedwith selected low flow indices for river Ouelle. Negatively correlatedpredictors are indicated by bold numbers whereas normal fonts indicate positively correlated predictors. The numbers mentioned refer to NCEP reanalysis variables listed in table 2.3. A1 January February 10 3 ,4 1,21 8,14 16,17 6,7,8 3,21 April 2,19 May 2,7,8,11,1 8,19,20 2,11,14,18, 19 June July 1,8,9 August 9,10 September 20,3 6,7 5,20 9,10,11, 4,5 16,'17 3,4,5, 9,12,20 November December Winter (DJF) Spring (MAM) 2,5,17,18, 19.20 1,13,15 3,4,5,11, 20, 5,20 1,15 Su m m e r (JJA) Autumn 11 (soN) 3,4,5,20 Annual 1,13,15 14 6,16,17 7,8,11,19 14 1,21 7,8,19, 20 6,7,5,12 8,12,13, 14,16 9,19,20 1.74 16,17 10 4.1.3 Statistical downscaling Framework For the downscalingframeworkinvolvingRVM, the selectedpredictorswere furtherprocessed using Canonical correlationanalysis. CCA (Brethertonet al., 1992) gives patterns (linear combinationsof the predictors)that share maximum correlationwith linear combinationsof predictands.Canonicalvariablesor scores were then used as input to RVM. RVM calibration involvesonlyone parameter, whichis the widthof the kernelfunctionused(o in Equation(2-11) in appendix1). Forthe currentworkthe Gaussiankernelfunctionwas used: ff{.r,,rr}- ex1{- ryr-" } (2-2) The selectionof the width is a crucial componentin selectingan appropriatemodel. Width valuesrangingfrom 0.1 to 4 were considered(Ghoshand Majumdar,2008). ASD implementstwo methodsof predictorselection:backwardstepwiseregressionand partial correlation.For the current work, the backwardstepwiseregressionmethod was used. The predictorsthus selectedin 80% or more of the total numberof calibrationsets,are mentionedin table 2.7. Leave One Out cross-validation(LOCV) was used to evaluate the prediction performanceof the models. LOCV consistsof omitting one case at a time and buildingthe statisticalmodelon the remainingdataset,and then estimatingthe omittedcase with the model. The set of all omitted cases forms the validationset. Therefore.for each river there were n calibrationsets and 1 validationset combiningall n "left-out"cases; where n is the numberof trainingpoints.The flowchartdepictingthe statisticaldownscalingframeworkis shown in figure 2.5. 115 Predictorsselectedusing stepwise regressionin the ASD tool. The mentionednumbers refer to NCEP reanalysisvariablesshown in table 2.3. Table 2.7 lndex Moisie Romaine A1 20 (February) 15(February) 1 0(Ma r ch) 8 (December) 1 0(a n n ual) 15 (February) A2 14(March) 7 (December) 17(February) 17(December) 13(November) T 1 1( D J F ) 11(MAM) 5 (December) 15 (October) 3 (February) 5(April) 9(August) 8(September) V D1 D2 Ouelle 11(DJF) 8(October) 7 (August) 18(JJA) 15(March) 3(September) 1 ( annual ) 3(April) 9(August) 19(Annual) e(soN) 3(February) 4 (February) 17( annual ) 8(January) 14 (January) 6 (February) 11(November) 20(July) 11 ( D J F ) 17(DJF) 13(SoN) 15 (February) 5 (DJF) 7(JJA) 2 (December) 5 (JJA) 20 (April) 3 (Ju ne) 6(July) 3(September) 10(February) 6(October) 116 8 (soN) 1 (January) 9(October) I{{lf:P re*nalysistlarc{plcdirtorsl , | *sn i ["{}rçlir}w i*rJic*i ''',,rr.;;;;;ii'*';lpr;T;À;;;e-'*1 i ::Y1ryY.:lT-*: Figure2.5 Statisticaldownscalingframework. 4.1.4 Performance lndices The downscalingefficiency of the two downscalingmethods was compared using three performanceindices-Relative Root Mean SquareError (RRMSE),RelativeMean AbsoluteBias (R2). Error(RMABE)andCoefficient of Determination ÊÆrVSE= R"&8ABE f I p:-l (2-3) .n iur-ëri .=r_il -_ _ i.Ê:1or-ol(Pi-Pi ['II-.{o'-or:EL.iP'-P]x \\'-^- (2-4) \ë I I / (2-5) / where n denotesthe total number of cases, S; and F; denote observedand simulatedvalues, respectively.S and F denoteobservedand simulatedmeans,respectively. 1.17 RESULTS sets are shownin figure2.6 and The mean RRMSE,RMABEand R2valuesfor the calibration the validationresultsare shown in figure 2.7. The numberof relevantvectorsand the selected and validation widthof the kernelfunction(in brackets)are shownin table 2.8. The calibration resultsclearlyindicatethat for each river and for each low flow index,RVM is performingbetter than ASD. In each case,the differencebetweenRRMSE,RMABEand R2valuesgivenby RVM and ASD for the validationset is greaterthan (twice,in most cases)the differenceobtainedfor the calibrationsets. In comparisonto Ouelle, both the methods resultedin lower values of as well as validationsets. RRMSEand RMABEfor Romaineand Moisiefor calibration RFdASE RA&,{Sg ' 1. -"----- :'- -'' -' 1- -' 04 02 Ëoa 6 Fo2 Ë6-rrr*l--*- û.s: *L,.' . 9 ^:,. . cru ç,'.. EE û 5 v -. . - 3 - - 4 ---- -g a la: .14 .: - 2 f' iA 1*A T Vû'!û2 f- l - - ^4 i.l I n - 4E 1- Ââ ail Knvna Figure 2.6 Mean RRMSE,RMABEand R2calibrationvalues for (a) Romaine,(b) Moisie and (c) Ouelle. White bars represent ASD results and gray bars represent RVM results 118 * -__ _-*_.$ry_g ': t.. ç1? &W, I*r: ;: J....*:....*. :-x.,.* u : âos ê: 5r ç:., t t * - * * - - t " .:g * 1 : '' .::.. ""----"' '. '- : *Sr , t 4: *.5' n 7 v< t *-r.l--i-0 â.----------- t 'a: { .4. *: tt: ;':.. ;"..;-&.:. *...;. Â1&?l vm*? ;, *,--,-,-r,,'-ê*  1 4 ? T V S 1 n? KnvN : &, &e r"r; :: fl'. ê,â Â1 Aâ î vû1 Â5n Figure 2.7 RRMSE,RMABEand R2validation results for (a) Romaine,(b) Moisie and (c) Ouelle.White bars represent ASD results and gray bars represent RVM results. T a b l e2 . 8 Number of Relevantvectors (% of total training points).The width of the kernel functions are indicatedin brackets. lndex A1 Romaine Ouelle 10-12%(2.8) 11-13%(3.4) 5-7%(3.6) 4%(3.6) 4-60/0(2) 7%(1.8) 4-6%(3.5) 8o/o(2.4) 3%( 2.5) 4%(1) 10-12%(3.2) 13%(0.7) 10-12%(3.5) 4-6%(1.3) D1 8 -1 2 % ( 2.5) 8-12%(2.8) 5%(2) 8- 10%( 3.3 ) lt is clearly evident from figures 2.6-2.7 that for each river, highest values of RRMSE and RMABE are observedfor V, for both RVM and ASD. The differencebetweenmean RRMSE. RMABEand R2calibration valuesgivenby RVM and ASD for indexV are0.437,0.36and 0.48 for Moisie,0.46, 0.38 and 0.76 for Romaineand 3.15, 1.84 and 0.22for Ouelle,respectively. For the validationset, the same are 0.75, 0.61 and 0.84 for Moisie,0.51, 0.43 and 0.84 for Romaineand 5.65, 3.64 and 0.71 for Ouelle,respectively. For both,calibrationand validation 119 sets, highest differencesbetween RVM and ASD are observedfor index V from Ouelle. In additionto that, for the remainingindices,highestdifferencesbetween RRMSE and RMABE valuesobtainedfor RVM and ASD are seen in the case of Ouelle.For the variabilityindexV from Ouelle,it is observedthat RVM resultsin highervaluesof RRMSEand RMABE(>1 in both the cases)but gives reasonablevaluesof R2 for both, calibration(0.87)and validation(0.80) sets. In the case of ASD, it is seen that negativevalues of V are obtainedfor calibrationand validationsets. The validationplots for V are shown in figure 2.8. Comparedto ASD, RVM results in small differencesbetweencalibrationand validationvalues of performanceindices. These differencesare highestfor the indicesfrom Ouellefor both RVM and ASD. Additionally, among the indicesfrom Ouelle,highestdifferenceis observedfor index V. For the same, the differencesbetweenRRMSE,RMABEand R2 calibrationand validationvaluesgiven by ASD are2.63,1.84and 0.56and thosegivenby RVM are 0.13,0.04and 0.07,respectively. fï h 18û â:c 8 t iJ 0 o{J & G 'IU Gaa ç: )r 64 z* @ ou & p û4t u ;â w&*æffi*û7*88W1t& Sber@ {Jufi*ad*yr} Figure 2.8 dayç} *bssfii*d {,it"t{æ* Observedversus predicted plot of the variabilityindex for Ouelle.The dotted line represents 1 : 1l i n e . The selectionof predictorsin the two frameworksis done differently.To analysethe effectsof predictorselectionon the performanceof MLR framework,stepwiseregressionwas replaced with CCA. The comparisonresultsfor the indicescorrespondingto river Ouelle are shown in in the prediction figure2.9. CombiningCCA with MLR (CCAMLR)showsmarkedimprovements and generalisationabilitiesof MLR framwork. Despite improvements,SBL frameworkis still Pronounceddifferences superiorthan CCAMLRin terms of goodnessof fit and generalisation. RRMSE,RMABEand are visiblein RRMSEand RMABEvaluesof indexV. The corresponding 120 R'values for usingSBL frameworkare 1.70,1.29 and 0.81 and for CCAMLRframework,they are 3.72,2.63and 0.75,respectively. Ëtj ,-- û] ç:. âs ,Y ll n' ttaw- K3.*.* IIJ ç. { g: j:--T; -æl*-xl-æ-_KI-*K * ios :-'_ É- Fl n - Â* lr A z T V û 1 * 2 KeCntotlnI SBL TiPALR Figure 2.9 RRMSE, RMABE and R2 validation results for river Ouelle using MLR, CCAMLR and SBL frameworks. The description of selected indices is given in table 2.2. 1.21. 6 DISCUSSION The currentwork is one of the first to comparetwo downscalingframeworksin capturingthe variabilityin low flow indicesusing atmosphericvariables.As explainedearlier,the selected indicesabide by the principlesof the naturalflow paradigm,as they characterizefour aspectsof the low flow regimeof the consideredrivers:amplitude,timing,durationand variability.The indicesdescribingthe Ouellelow flow regimeexhibitmore variabilityin comparisonto Moisie and Romaine.Such behaviouris attributedto the occurrenceof two low flow seasons (late summer and late winter) for Ouelle. Based on the correlationvalues between the low flow indices and large scale climate variablesat differenttemporal scales (yearly,seasonal and temporal),it was observedthat the variablesappearingmost commonlyas significantcorrelated with the selected low flow indices are humidityand wind components(Vertical,Zonal and Wind movementregulatesthe humiditylevelsof the atmosphere.For example,a Meridonal). west to east wind brings cold dry air (very low moisture)along with it, thereby reducing precipitation. Humidityvariables(SH and RH) are expectedto influencelow flow indicesas their variationaffectstemperatureand precipitationand hence riverflows.This has been highlighted with the use of humidityvariablesas predictorsin flow downscalingstudies (Cannonand Whitfield,2002;Ghoshand Majumdar,2008;Tisseuilet al., 2O1O). Comparingthe valuesof performanceindicesclearlyindicatedthat SBL performedbetterthan MLR to downscalethe selectedlow flow indicesof the consideredrivers.For all three rivers,the relativelysmall differencebetweenperformanceindicesvaluescorrespondingto calibrationand validationsets (figures2.6 and 2.7) re'flectedbetter generalisationability (less overfitting)of to Ouelle RVM as comparedto ASD. The higherRRMSEand RMABEvaluescorresponding presentin the indices(particularly V) from the same in can be explainedby the highervariability comparisonto those from Romaine and Moisie. Regressionbased statisticaldownscaling modelsoftencannotexplainall of the varianceof the downscaledvariable( Ghoshet al., 2008; Wilby et al., 2004). lmprovementsin the performanceof MLR frameworkwere observed by rerunningASD with CCA as the predictorselectionmethod.But the improvedMLR framework did not surpassRVM in terms of the evaluationcriteria.For all the rivers(validationplotsshown only for Ouellein figure2.9), noticeabledifferencesbetweenSBL and CCAMLRwere observed for index V, which exhibits the highest variability.The ability of SBL to better capture the 1.22 variabilitythan MLR is reflectedby the valuesof performanceindicesfor the low flow Hls from Ouelleas well as the variabilityindexfor all the rivers.In additionto that, in all cases,SBL supportedsparsityby using fewer relevantvectors(shown in table 2.8) in comparisonto MLR and CCAMLR,therebyleadingto lessercomputation time. It is observedthat SBL resultedin highervaluesof RRMSEand RMABE(t t ) but reasonable valuesof R21>0.80 for both calibrationand validationsets),for the variabilityindexcomputedfor Ouelle. In the observedversus predictedplots of the variabilityindex from Ouelle (shown in figure2.8), it can be seen that the clusteringof pointsaroundthe 1-1 line gave a reasonable valueto R2.The high valuesof RRMSE(1.79)and RMABE(1.28)were an outcomeof under predictionof lower values of the index. In the case of MLR, predictedvalues correspondingto certainlowervaluesof the indexwerefoundto be negative,leadingto highervaluesof RRMSE (7.44)and RMABE(4.94). 1,23 7 CONCLUSION This study proposesa direct downscalingapproachfrom atmosphericvariablesto low flow indices,which is less commonlyimplementedthan the approachinvolvingthe use of an intermediatehydrologicalmodel between GCMs and streamflow.This paper presents the of low flow indicesusingSBL and MLR,with NCEPclimatevariablesas predictors. downscaling This approachrelieson the assumptionthat the low flow indicesare influencedby atmospheric factorsonly. Such an assumptiondisregardsthe influenceof some physicalfactorssuch as soil and land use which affect the movement of water through the soil and which are at least partiallytaken into accountin a frameworkinvolvingthe use of a hydrologicalmodel.However, the resultsrevealedby the currentwork are encouragingand furtherdevelopmentsin the use of approaches are promising. directdownscaling the low flow regimeof Moisie,Romaine(both locatedon the Quebec Six indicescharacterising Northshore)and Ouelle(locatedon the south shoreof Quebec)rivers,which all sustainsalmon populations,were selected.Low flow indicesare of the utmost importanceto characterizeand assesspotentialimpactsof changinghydrologicalregimeson fish and associatedfisheries.The to Ouellewere found to show highervariabilityin comparisonto the ones indicescorresponding from Romaineand Moisie.The predictorscorrespondingto the selectedindiceswere identified on the basisof their correlationwith the climatevariables. For SBL and CCAMLRframeworks, input was prepared using CCA, whereas for MLR, stepwise predictorselectionmethod was used. In contrastto MLR, SBL is characterisedby a complexalgorithmbased on probabilistic Bayesianlearning.This complexitybecomesa drawbackin terms of computationtime in cases where the samplesize is large. Despiteits complexity,the probabilisticnatureof the algorithm accounts for the uncertaintiespresent in the predictions.In addition to that, the algorithm automaticallysets majorityof parametersto zero, leadingto a procedurewhich is effectiveat discerning thosebasisfunctionswhichare'relevant'formakinggood predictions. It was observedthat the climatevariablesshowingsignificantcorrelationwith the indiceswere wind componentsand humidityvariables.SBL not only outperformedMLR in terms of the values of the performanceindices but also involvedfewer parameters.The proximityof the values of the performance indices for calibration and validation sets indicated a good generalization capabilityof SBL. RerunningASD with CCA predictorselectionmethodimproved 724 the resultsof MLR frameworkbut SBL still showed betterperformance.This suggeststhat the performanceof MLR frameworkwas impactedby the consideredpredictorselectionmethod, but not to the extent of outperformingSBL. Markeddifferencesbetweenthe performancesof CCAMLRand SBL were observedfor the variabilityindexfor all rivers.The inabilityof SBL and MLR to capturevariabilitywas reflectedin the values of performanceindices,obtainedfor the low flow Hls correspondingto Ouelle and the variabilityindex for all rivers. The proposed methodologycan be used to project low flow indicesfor future years using GCM and RCM outputs.In additionto that differentways of preparingthe input for the regressionmodel (e.9. Classification and regression trees,combination of PCA andfuzzylogic)couldbe explored. 1.25 8 APPENDIX.I 8.1.1 TheoreticalBackgroundof Sparse BayesianLearning In an archetypicalregressionsituation,given a set of data {rof*}f=r, tne target samplesare consideredto be realisationsof a deterministicfunctiony, potentiallycorruptedby some noise process: 1 1= y { r ; , w } + s ; (2-6) Where ei, i=1,2,...nare random errors which are independentnormallydistributedrandom variableswith mean zero and constantvariances3 , The functiony is modelledas a linearlyweightedsum of M fixed basisfunctions{@*{x}}*=o: y{x;w}: Eff=6nr.; **t*3: where tS is the design matrixand w: +Fw (2-7) is the weight vector.The objectiveis to {wç,H'1,...,w*rJ infer valuesof the parameters/weights {**}'3=o such that the functiony modelsthe underlying generativefunction.A classicapproachto estimatey{x,w} is to minimisethe cost function: goi*) : L f?If;=, ;r* - I*=o **4*{r*}]= (2-8) Minimisationof squarederror leadsto a modelwhich exactlyinterpolatesthe data. One way to 'priori'prejudiceon the natureof the complexityof meaningfullylearnfrom data is to imposea functionswe wish to elucidate.A commonway of doing this is via 'regularisation'. In linear model framework,smootherfunctionshave smallerweight magnitudeand therefore,complex functionsare penalisedby includinga penaltyterm to the cost functiondefinedin (2-8). Hence, we now minimise 1.26 ?{"4 : E"{wJ*,IE*,{x{ where (2-e) tr*.{o}:7/ZIf=r**= (2-10) and the hyperparameterÂ.balancesthe trade off betweenhow smooththe functionis and how well the functionfits the data. In the probabilisticBayesianframework,an explicitprobabilistic model is definedoV€r €i, chosento be a Gaussiandistribution with mean zero and variance r3.Therefore, p{e,Ir2] : f,f{o,r:} (2-11) Consequently,using (2-6),p{"{trl&':,r:}: fftv, o:} and therefore,the likelihoodfunctionis given by: p{tlw,o2):izno:)-Ie* [-!']i"] tr-+*l l=] - \ . /!-i _r o _ - )- \ - "ï -. .e1a_l _ | [_ ^_r I where f={rr"...rru}r,w=ft*,o...w.v}rand $ is the N ( 2- 12) x (N+1) 'design matrix' with O : l*{xr},*{x23,.".,*i::à,X?, wherein 4{r:i : l1,K{xi,xr},f{{xu,xr},.,",Sf{x1"x;6}l? where f{{*,,&.i for j=l,2,...N is a kernel function, effectivelydefining one basis function for each examplex; (where i=1,2,...N) in the trainingset. Sincethe numbersof parametersin the model are equaltothe numberofequations(M=N),maximumlikelihood estimationof rarandr:would lead to severe over fitting.To control model complexity,insteadof the regularisationweight penalty,definedin (2-9),a'priof probability distribution, expressingour degreeof beliefoverthe valuesw mighttake, is definedas: 1j p{.wlæ}= ggpu;V{wilû,cc, (2-13) with æ a vector of N+7 hyperparameters.Such a representation,encodes a preferencefor smoother (less complex) functions. lmportantly, there is an individual hyperparameter 1.27 associatedwith every weight,moderatingthe strengthof the prior.The prior given by equation (2-13) is conditionedon c, so for full Bayesianconsistency,hyperpriorsare definedover {eas well as the remainingparametersof the model,the noise variances3, Once the prior has been overall unknownscan be definedas: defined,the posteriordistribution p{"}ç,ec,çzl*= p{tlw,æ.,rrJp{xr,a,623t'p{t3 Q-14) which cannotbe computedanalytically. Therefore,the posterioris decomposedas p{w,a,r:1t} : p{_wlr,tz, ru}p{a, r:;t} (2-15) The first term on the RHS of (2-15),denotingthe posteriordistributionover the weightsis given by p{wl e s, r* : {p{t lç",r3}p{xrlc}}lp{tl es,s?} : {?n}-{'t'+:i;':1g1-rl:**{-fl:{rar - *r}rE-1{w- fr}} (2-16) where the posterior covariance and mean are respectively: ! : {6-?çrô +,4)-1 Lr.: r-:EôTt (2-17) (2-18) where A is a diagonal matrix defined as diag (aç,u1,.,.,fls). posterior,which is the secondterm on the RHS of (2-15)is representedby The hyperparameter have valuesæruo,ofno.We a deltafunctionat its mode,i.e. al its most-probable pt æ,s 2|t:3w p {tl a, s z}p{n}p t,n=} (2-1e]' For the case of uniformhyperpriors,it is neededto maximizethe term p{titz,r?} only,which is computableand is givenby: p{tler.8z} : {p{tlw,ç4p{wla}dw : {Zv3-x/zlozI+ èA-t@r1-rl:ea? {-t1Ztr;o:f + @é-t*ti-trj (2-20) This quantityis known as the marginalizedlikelihoodand its maximizationis knownas the fype ll maximumlikelihoodmethod.For maximizingp{.31æ,64, a gradientbasedapproachis used. For s differentiating (2-20),equatingto zero and rearranginggives: ol**': yi{pl ( 2- 21) wherepg is the ith posteriormeanweightfrom (2-18)and the quantitiesy6 can be definedby: X; = 1- drjY,: (2-22\ With s;r the r-thdiagonalelementof the posteriorweightcovariancefrom (2-17)computedwith the currento and c:. Eachy; € [*"1] can be interpreted as a measureof how'well-determined' its correspondingparameterr+';is by the data. For the noisevariances:. differentiation leadsto the re-estimate: = lle- +*rll'l{g- EiF:} {o:3:as'u' (2-23) whereN in the denominator denotesthe numberof dataexamples. Hyperparameter estimationis typicallycarriedout with an iterativeformulasuch as a gradient ascenton the objectivefunctiongivenby (2-20).Inpractice,manyof the ra;'stendto infinityand from (2-13) it implies that p{w;lt,æ,oz} becomes highly peaked at zero. Therefore, the corresponding*+'gbecome close to zero and can thus be prunedand consequentlysparsityis realized.At convergenceof the hyperparameterestimationprocedure,predictionsare made based on the posteriordistributionover the weightsconditionedon the maximizingvalues s,*çr and r$u. For a new datum.:rr,, the predictivedistributionis given by: : î p{,t,l*,o$p3tr{wlt, p{r.lr,a4çp,sfip} æ*o,o,?uij aw (2-24) Sincebothtermsin the integrandare Gaussian,(2-24)can be readilycomputed,giving: : lv-{t,ly,, é } ptt-l f, æ* r,sf,1çu3 y, -- t*r &{x} with çl: oîtp+ S{xJrr${r,i 1.29 (2-25) This gives the predictivemean as y{x,,p} and the predictivevariance as the sum of two variance components:the estimated noise on the data and that due to uncertaintyin the predictionof the weights. 130 CHAPITRE3 STATISTICAL DOWNSCALING OF PRECIPITATION AND TEMPERATURE USINGSPARSEBAYESIANLEARNING, MULTIPLE LINEARREGRESSION ANDGENETIC PROGRAM MINGFRAMEWORKS DeeptiJoshil,AndreSt-Hilairel, Taha Ouardal'2, Anik Daiglel'3 t INRS-ETE, University of Québec, 490 de la Couronne, Québec G1K 9A9, Canada (ioshi.deepti@ete. inrs.ca, [email protected]) 2 Masdar Institute,Professor & Head - Water & EnvironmentalEngineering,PO Box 54224, Itbu Dhabi,UnitedArab Emirates([email protected], [email protected] ) t Cégep Garneau, 1600 boulevard de I'Entente, Québec, G1S 4S3, Canada (anik.daigle@ete. inrs.ca) Correspondingauthor:DeeptiJoshi Article soumis à StochasticEnvironmentalResearchand Risk Assessmentle I octobre2013 Ï'he work presentedin the followingarticle consists of the combined endeavoursof all its authors.The implementationof the mathematicalalgorithmsin MATLABwas done by Deepti Joshi and Anik Daigle.The co-authorsadvisedin the developmentof the methodologyof the work and analysisof the results.The data extractionand processing,evaluationof resultsand the preparationof the initialversionof the manuscriptwere done by Deepti Joshi, under the guidanceof all co-authors. 131 ABSTRACT -ï-his study attemptedto investigatetwo downscalingframeworksto downscaletemperatureand frcurto downscaleprecipitation. Inputto all frameworkswere climatevariables(NCEPreanalysis v'ariables)significantly(o<0.05)correlatedwith the predictands(temperatureand precipitation). l-he first framework was an implementationof Multiple Linear Regression (MLR) called ItutomatedStatisticalDownscaling(ASD)tool.ASD selectspredictorsusing backwardstepwise r,egression and subjectsthe selectedpredictorsto MLR. The second frameworkimplemented FlelevanceVector machine(RVM) which is a Sparse BayesianLearning(SBL) approach.The SiBLframeworkinvolvesselectingpredictorsusing canonicalcorrelationanalysisfollowedby theirinputintothe RVM algorithm.For precipitation downscaling, two additional frameworksthat combine genetic programming(as the predictorselectionmethod) with SBL and MLR were prresented. The resultsshowedthat SBL outperformedMLR in downscalingtemperature.For all stations,temperaturewas better downscaledthan precipitation.For precipitationdownscaling, $BLGP frameworkoutperformedall other frameworksin classificationas well as regression. I\4LRGP,on the other hand, did not bring about much improvementin the resultsand was in many casesoutperformedby MLR. Keywords: Downscaling,Sparse BayesianLearning,MultipleLinear Regression,Low flows, CanonicalCorrelation Analysis,GeneticProgramming. 1_33 INTRODUCTION Panel on climate change (IPCC, 2007d) The fourth assessmentreport of Intergovernmental statedthat continuedgreenhousegas emissionsat or above currentrates would induce many changesin the globalclimateduringthe 21stcentury.Thesechangesare likelyto be largerthan there is a need to improve those observedduringthe 20th century.Underthese circumstances, and our knowledgeof the globalclimatesystemand its possibleimpactson the meteorological consequently hydrological patterns and processes. Global Climate Models (GCMs) are mathematicaltools that simulatepresentclimateand generatefuture climatescenariosupto a resolutionof tens to hundredsof kilometerswith forcings includinggreenhousegases and aerosolemissions.However,due to their coarse sparse resolutionthey are not considereda reliable source of informationin impact studies that require informationat a fine scale to characterizespatial variations and establish parameterizations(Wilby et al., 2004). For example, in studying the hydrologicalimpacts of climate change, hydrologicalmodels are requiredto simulatesub-gridscale phenomenaand thereforeneed input data such as daily precipitationand temperatureat a similarscale.Hence,there is a need to convertGCM outputs into precipitation and temperaturetime seriesat a scaleat whichthe hydrologicalimpactis to be variablesare investigated.The methodsused to covert GCM outputsinto local meteorological 'downscaling'. referredto as downscalingand Downscalingtechniquesare broadlyclassifiedinto two categories-dynamical statisticaldownscaling(SD). Dynamicaldownscalingtechniquesinvolvethe use of Regional ClimateModels(RCMs)which use initialand time dependentlateralboundaryconditionsfrom GCMsto achievea higherspatialresolutionat the cost of limitedarea modeling.SD techniques derive relationshipsbetweenlarge scale variables(predictors),obtainedfrom reanalysisdata, and localscalesurfaceconditions(predictands). Climatevariablesthat are closelyrelatedto the predictandare selectedas predictors.Future projectionsfrom GCM or RCM are then used in these relationshipsto estimatethe changesin the responsevariable.SD methodsare fufther (Huth,2000; Jones et al., 1993),weather classifiedinto three types. Weatherclassification generator(Katz,1996;Wilks & Wilby, 1999)and regression(transferfunctions)models(Wilby et al., 20A2).Out of the three,regressionbasedmethodsare the most widelyused. The relative ease of applicationand use of observabletrans-scale relationshipsforms the strength of regressiondownscaling.The major weaknessof this approachis that it explainsonly a part of the climate variability.Apart from assuming the validity of model parametersunder future 134 c;limateconditions,these approachesare also sensitiveto the choiceof predictorvariablesand of the transferfunction.The most commonlyused SD methodsimplementlinearmethodssuch ersMultiplelinearregression(Hessamiet al., 2008, Wilby et al., 2002),canonicalcorrelation (Huth,2004)and artificialneuralnetworks(Hewitson& Crane,1996). ernalysis Dibike and Coulibaly(2006) comparedtwo downscalingmodels- a temporal neural network (TNN) model and a regression-based statisticalmodel, to predict daily precipitation, daily rninimumtemperatureand daily maximumtemperaturein northernQuebec,Canada.They frcundthat the TNN model was more efficientin downscalingboth daily precipitationand daily rnaximumand minimumtemperatures.In anotherstudy, Tripathiet al. (2006) proposeda s;upportvector machine(SVM) approachto obtain average monthly rainfallat meteorological (MSDs)forIndiaand concludedthat a SVM basedmodelwas a suitablestatistical sub-divisions methodfor precipitation. clownscaling Chen et al. (2008)comparedthree downscalingmodelsone based on a RelevanceVector Machine (RVM), a least square support vector machine (LSSVM)and a back propagationneural network(BPNN)to downscalerunoffand found RVM trcbe an effectiveway to assessclimatechangeimpacton hydrology. l-he selectionof suitablepredictorsis crucialin developinga statisticaldownscalingmodel.The nnostbasic requirementfor a predictoris that it is informative,i.e. it has a high predictivepower. Informativepredictorscan be identifiedby statisticalanalyses,typicallyby correlatingpossible prredictors with the predictands.A list of predictorsused for precipitation downscalingis given by Wilby and Wigley (2000),along with a comparisonof observedand simulatedpredictorsand a stationarityassessment. In another study, 29 individual atmospheric predictors of daily prrecipitation are examinedfor their downscalingskill in 15 locationsthat encompassdiverse geopotential olimateregimes(Cavazosand Hewitson,2005).Mid-tropospheric heightsand midtropospherichumiditywere found to be the two most relevantcontrolsof daily precipitation in all tlre locations and seasons analyzed. In a study implementinggenetic programming(GP) nnethod,Coulibaly(2004),presenteda methodto simulatelocal scale daily extreme(maximum arndminimum)temperaturesbased on large scale atmosphericvariables.GP outperformed ltilLRin downscalingdaily minimumtemperature,while the two modelswere almostequivalent in downscalingdaily maximumtemperature.Hashmiet al. (2011) presentedthe resultsof statisticaldownscalingof precipitationdata from the CluthaWatershedin New Zealandusing a nron-linear regressionmodeldevelopedusing Gene ExpressionProgramming(GEP,a variantof GP). The results showed that GEP-baseddownscalingmodels can offer very simple and erfficient solutionsin downscalingprecipitation. 1,35 The work presentedin this paper is motivatedby the desireto explorethe potentialof two and four downscalingframeworks for temperatureand daily precipitationseries, respectively. Temperatureis modeledas an unconditionalevent whereasprecipitationis modeledas a two occurrenceand precipitation amounts.The firstframework(F1)is step approach:precipitation an implementationof MLR, known as Automated StatisticalDownscalingtool (ASD). ASD appliesbackwardstepwiseregressionto draw a relationshipbetweenpredictorsand predictand. The second downscalingframework (F2) involves the combinationof canonicalcorrelation of probabilistic analysis and RelevanceVector Machine(RVM). RVM is an implementation Sparse Bayesian Learning (SBL) which uses distance based kernel functionsto define the transferfunction.Severalstudieshave implementedmachinelearningmethodsin precipitation and temperaturedownscaling studies(Ghoshet al., 2008;Chen et al., 2008;Chen et al2010; Najafi et al., 2011; Samui and Dixon, 2012; Joshi et al., 2013). MLR has also found several in downscaling applications studies(Aksornsingchai and Chutimet,2Q11;Burgoret al,2012 and Nieto & Wilby, 2005). In additionto the above mentionedframeworks,two more frameworks were tested for precipitationdownscaling.These consistedof replacingcanonicalcorrelation analysis and backwardstepwise regressionwith Genetic programmingGP as the predictor selectionmethod.Therefore,the remainingtwo frameworksinvolvecombiningGP (as predictor models).GP has been used in selectionmethod)with SBL and MLR (as statistical downscaling other downscalingstudies(Hashmi,2009; Hashmi,2011; Hassanzadehet al, 2013),but the combinationof GP with RVM is one novelaspectof this project. models(SBL and MLR) The paperis organizedas follows.Section3.3 describesthe statistical used for downscalingas well as a brief explanationof GP. Section3.4 describesthe study area followed by section 3.5 that describes the Methodology.Section 3.6 presents the results followedby discussion and conclusionin section3.7 and 3.8 respectively. L36 12 STATISTICAL MODELS l-his sectiondescribesthe methods/modelsused in the applieddownscalingframeworks.The first subsectiondescribesthe MLR as is followedby a brief descriptionof SBL. Finally,the third subsectiondescribesthe GP frameworkimplementedfor precipitation downscaling i1..1 Multiplelinearregression À/LRis a statisticmethodthat is usedto modellinearrelationshipbetweena dependentvariable (predictand)and one or more independentvariables(predictors). Therefore,the MLR modelcan be expressedas a linearfunction: Y t : f r a* h X t + . . ' + B , X , o* t i (3-1) f o r i = 1, 2 , .. . , N Where the e;'s are random noise assumedto be independent S{û, ç2}, Xt's are the predictors and 4 is the predictand.Wilby et al. (2002),developeda Windowsbased decisionsupporttool known as StatisticalDownscalingModel (SDSM) that facilitatesthe rapid developmentof multiple,low-cost,single-sitescenariosof daily surfaceweather variablesunder current and future regionalclimateforcing.Additionally,the softwareperformsancillarytasks of predictor variablepre-screening, model calibration,basic diagnostictesting,statisticalanalysesand graphingof climatedata. Inspiredby the SDSMapproach,Hessamiet al. (2008)developedthe automaticstatisticaldownscaling(ASD)tool. 2.1.1 Automated Statistical Downscaling Tool ASD is a regressionbased downscalingtool, capable of performingstatisticaldownscaling automaticallyfrom predictorselectionto model calibration,scenariogenerationand statistical analysisof scenarios.The automationis designedto replace SDSM's subjectivemethod of predictorselection,requiringsignificantinput on the part of the user, with a more objective approach.lt allowstwo methodsof predictorselection:backwardstepwiseselection and partial correlationcoefficients(Afifi & Clark, 1996). In additionto MLR, it also allows the use of the ridge regression(Hoerl & Kennard, 1970). Ridge regressionaccountsfor the collinearityof predictors,resultingin more stable least square estimatesof the regressioncoefficients.Full 137 technicaldetailsaboutASD, includingmodelvalidationand usage,are describedby Hessamiet al. (2008). 2.2 SparseBayesianLearning Severalstudieshave shown that accountingfor non-linearrelationbetweenthe predictorsand predictandcan improvethe goodnessof fit (Huth et al., 2008). For this reason,ArtificialNeural Network (ANN) based downscaling techniques have gained wide recognition (Crane & from givenpatterns Hewitson,1998,Wilbyet al., 1998).The abilityto generalizea relationship makesit possiblefor ANNs to solvelarge-scale complexproblemssuch as non-linearmodeling and classification(ASCE Task Committeeon ArtificialNeural Networksin Hydrology,2000b; Govindaraju& Rao 2000).While accuracyin predictionsis universallyvalued,a recentinterest in the notion of sparsitydivertedthe focus of the researchcommunityon learningalgorithms which use fewer parameters.One of the significantdevelopmentsin this directionis Support VectorMachines(SVM),a machinelearningalgorithm.SVM (Cortes& Vapnik,1995)has found wide applicationin the field of patternrecognitionand time seriesanalysis.However,despiteits success,SVM suffersfrom severaldrawbacks(Tipping,2OO1)which were overcomein Sparse BayesianLearning(SBL)algorithms. SBL (Faul& Tipping,2002)enablesexploitingprobabilistic Bayesianlearningframeworkto derive accuratepredictionmodels which utilize fewer basis functionsthan SVM for a comparableproblem. A detailed explanationof the mathematical formulationsbehindSBL regressionand classification algorithmsis providedin the appendix. of SBL, is For the currentwork, RelevanceVector Machine(RVM),which is an implementation used. RVM makes predictionsbased on functionsimplementedby SVM. SVM uses the function t : f {x,*) = I'.-I, u'.ffi-r,r;) + u'ç (3-2) where ffftr,x;] is a kernelfunction,effectivelydefiningone basis functionfor each examplein the trainingset. RVM is a Bayesiantreatmentof (3-2).The algorithmadoptsa fully probabilistic framework and introduces a prior over the model weights governed by a set of hyperparameters, one associatedwith each weight,whose most probablevaluesare iteratively estimatedfrom the data. Sparsityis achievedbecausein practicethe posteriordistributionsof many of the weightsare sharply(indeedinfinitely)peakedaroundzero. These trainingvectors, 'relevance' vectors'. The associatedwith the remaining non-zero weights are termed as mathematical formulations behindRVM can be foundin Tipping(2001). 138 2.3 Geneticprogrammingframeworkfor precipitationdownscaling GP is a biologicallyinspiredmachinelearningmethodthat allowscomputerprogramsto evolve in order to performa task. The objectiveof the evolutionaryprocessis to discoveran optimal equation(or model)for relatinga dependentvariable(or predictand) variables and independent (or predictors).However,as the search space of all possibleequationsis extremelylarge, particularlyin problems involving multivariatetime series, the heuristic search has to be 'grammar'(or restrictedto only those equationsthat followa specified set of rules used to build equations).Figure3.1, showsa tree represented by the equationf(x1,x2)= X1* (x2*10).In the tree,the innerconnectionpoints(or innernodes)are calledbinaryarityfunctions(e.9.,'+','1','*' in figure3.1)or non-terminals that requiretwo argumentsor sub-trees,whereasthe leaf nodes are calledterminals,which representexternalinputvariablesand constants. Equatianrepr*sentingthe trec:f{x,,xa}= xr+{x*"1t} F i g u r e3 . 1 Example of a function tree formed using grammar functions * and +. The equation representingthe tree is f(x1,x2)= xi+(x2*10). 139 Whateverthe type of grammarused, it is essentialto specifythe list of functionsand terminals that will be used to create the derivationtrees. A maximum depth of derivationtree (or maximumexpressiondepth) must also be set to halt the generationprocessand preventthe evolutionof too complex(or larger)models.A highermaximumexpressiondepth means more complexequationswill likelybe produced.Once the grammaris set, the next step is to generate the initialpopulation.In this case, the grow method(Koza,1999) is used to createthe initial populationof random individuals(or trees). In the grow method, a tree of arbitrarysize is generatedby selectingterminalsor primitivefunctionswith equal probability. The shapeof the optimaltree is found usingan evolutionaryprocessas follows: 1. Each individualof the initial generationis evaluatedand a score (or fitness) is determinedfor each populationmember. Here the score of each individualis based upon the optimizationmethod, the error function and the parsimony.The latter is a weightingaddedto an individualdependingon its tree-size.This term is used to guide the selectiontowards shorter equationsthat have the same predictionaccuracy as longer equations.For the current work on precipitation,the fitness function used for problemis classification - S*,".}t fifæess"go = #d"3"* ff*,r, {#n*, (3-3) Where ffn-u and ff*.*,. indicatesthe number of rightly classifieddry and wet days, respectively. The term {rÇ*r.-,T*r.}= penalisesthose combinationsfor which one of the Ndry,ffnd.ff**, is well determinedand the other poorly predicted.For the regression problem(precipitation amountdownscaling), the fitnessfunctionis givenby fif'reess"**='$zee&t*b,5{S- F}} (3-4) The where O and P indicateobservedand predictedprecipitation amounts,respectively. best scoringmembersare selectedas "parents"for "reproduction". 2. Once individuals have been selected as parents for reproduction,three genetic operators(crossover,mutation,and direct reproduction)may be appliedto generatea new population.Crossover(figure3.2) is the processof takingmore than one parentand producinga child solutionfrom them. Crossoverproducesa new population,but it does not introduceany new informationinto the population.Thus the populationcan become L40 more and more homogeneousleadingto a prematureconvergenceto a non-optimal solution.To guard againstsuch prematureconvergence,a mutationof feature is often introducedin the population.Mutation(figure3.3) altersone or more gene from its initial state. Varioustypes of computationalmutations(e.9., branch mutation,node-mutation, etc) may be used to introducenew informationintothe population.In directreproduction, the entireindividual is simplycopiedto the nextgeneration withoutmodification. 3. The processgoes back to scoringthe new populationmembers.The iterativeprocess stopswhen the specifiedmaximumnumberof generation(100)is reachedor the fitness functionreachesits thresholdvalue. For precipitationclassification, the thresholdvalue of the fitnessfunctionis 2 and for precipitation amount(regression), the same is 0. 1,41, PARENTS ,ç;r...q æ'æ** CHILDRËN &"- '?.. -Y*\' "'æ ,,*.. Ç** 3 **q i0 ù ôô Figure 3.2 Crossover operations for genetic programming. The bold selections on both parents are swapped to createthe offspring or children. ôRlGltrlÂLt$tlvl$UÂt t".- "1 q* ,,*... &&æ :æ*"-- æ tlrtUTÂTEg lilDruïtrUÂtS & ææ , e rri r--r' ææ i3r'..j F i g u r e3 . 3 Two different types of mutations. The top tree is the original individual. The bottom left tree illustratesa mutation of a single terminal (3) for another single terminal (a). lt also illustratesa mutation of a single function (-) for another single function (+). The tree on the extreme right illustratesa replacementof a subtree by another subtree. L43 A major advantageof this GP method as comparedto classic multipleregression,is that the specificmodel structureis not chosen in advance,but is rather part of the optimizationand search process. Another advantageof the GP approach over nonlinear methods such as artificial neural networks is that it provides explicit an model structure (i.e. mathematical equations)that can improveour knowledgeof the predictand- predictorrelationship. toolboxfor use For thiswork,the GP algorithmis appliedusingGPTIPS,a geneticprogramming with MATLAB. Information about the toolbox can be obtained from lt providesa number of convenientfunctionsfor https://sites.qooqle.com/site/GAtips4matlab/. exploringthe populationof evolved models, investigatingmodel behaviour,post-run model simplificationand export to different formats, e.g. graphics file, symbolic math object or standalonem-file.One of the main featuresof GPTIPS is that it can be configuredto evolve A multigeneindividual multigeneindividuals. consistsof one or more genes,each of whichis a "traditional" by individualsin order to improve GP tree. Genes are acquiredincrementally fitness.The overallmodel is a weightedlinear combinationof each gene. In GPTIPS,the the optimalweightsfor the genesare automatically obtained,usingMLR and SBL by regressing genes against the output data. The resultingpseudo-linearmodel can capture non-linear behaviour. 1.44 3 STUDYAREASAND DATA The two study areas are drainagebasinsof two rivers locatedin EasternCanada.The Moisie river is locatedon the Northshore of the St. Lawrenceriver,whereasthe Ouelleriver is located on the south shore of the St. Lawrence.The currentstudy focuseson these two riversas they sustainAtlanticSalmon(Salmo salar)populations. AtlanticSalmonhas been regardedas an endangeredspecies(Committeeon the Statusof EndangeredWildlifein Canada 2011). This has prompteda numberof studiesrelatedto possibleclimatechangeimpactson flow and water temperatureon these rivers(Jeonget a|.2012, Morin& Slivitzky1992),impactsthat could lead to importantsalmonhabitatloss. The locationsof dischargeand meteorological stationson each of these river basinsare shown in figure 3.4. Moisiehas one hydrometricstationand two meteorological stationslocatedwithin the limitsof its drainagebasin.Ouellehas one dischargeand one meteorological station,with the formerlyingwithinand the latterlyingoutsidethe limitsof its drainagebasin. The detailsof the meteorological stationsare given in table 3.1. The selectionof meteorological stationswas basedon data availability. The alphabetsmentionedin bracketsin the firstcolumnof table 3.1 denote the abbreviationused for the stationin subsequenttables and figures.The source of meteorologicaldata for each of the two study areas is the EnvironmentCanada database (http://www.climate.weathe roffice.qc.ca ). 145 La Focatierg ,- - i?D ' ',-ù -j' : ' . i : -'-,.-- ''-; j t ;;.' 1tt^,.l {r-\. a'j ' i é, d i, it: 'q4r-***Sept-IIes Figure 3.4 Study area map showing the drainage basins and the location of the meteorological and hydrological stations. Meteorologicalstations are denoted by squares whereas hydrological stations by circles. L46 T a b l e3 . 1 Details of the meteorologicalstations used in the current work. The alphabet mentioned in brackets in the first column denotes the abbreviation used for the station in subsequent tables and figures. Elevation Station Latitude Available years Longitude (m) Fermont(F) Sept-lles(S) 52"48'O000' N 50'13'000'N 67"05'0000"w 594.40 Oct 1980-Dec1996 66'16'000'w 54.90 Oct 1980-Dec1996 Oct 1969-Sept La Pocatiere(P) 47"21'21.000' N 70"01'55.000" W 31.00 19 9 1 Figure 3.5 shows precipitationand temperature(daily average) normals at the selected meteorological stations.The stationnormalswere calculatedfor a 30 year period(1971-2000). Spatial differencesin temperatureare evident between stations correspondingto the North shore and south shore locations. The maximum daily average temperatureis observedat stationLa Pocatiere(18.0"Cin July) on the South shore,followedby Sept-lles(15.5"Cin July) on the Northshore.The minimumdailyaveragetemperature is exhibitedby Fermont(-23.0"Cin January)on the Northshoreand La Pocatiere(-10.3"C).In addition,potentialevaporation(plots not shown) shows an increasefrom north to south (Burn et al., 2008). Highest annual precipitation is observedat Sept-lles(1156mm)and lowestat Fermont(806.5mm). L47 g û '5 {E E g &! F Ér & g) l* ,-- :Fenrrc*t*SrgiçaW J LaPocadere Figure 3.5 Precipitationand temperaturenormals of the meteorologicalstations described in table 3.1. Normalswere calculatedfor 30 years (1971-2000). L48 4 METHODOLOGY 4.1 StatisticalDownscalingFramework The present work compares linear and non-lineardownscalingframeworks to downscale predictands(mean temperatureand precipitation)at the selected meteorologicalstations. Twenty NCEP re-analysisvariableslisted in table 3.2 were consideredas predictors.These variablesincludeRelativeHumidity(RH),SpecificHumidity(SH),Zonal(U), Meridonal(V) and Vertical(ut)componentsof wind and geopotentialheightat differentpressurelevels(1000,850 and 500 hPa) and Sea Level Pressure(SLP). Reanalysisdata from the NationalCenter for Environmental Prediction(NCEP, Kalnayet al., 1996)were used as large-scaleatmospheric predictorsto calibratethe models and validatethe approaches.These datasetsare typically 'observed' viewedas large-scaledata on a regulargrid with a spatialresolutionof approximately 2.5" X 2.5" (250 km X 250 km). Each NCEP variablewas interpolated at each of the three meteorologicalstations locations using bilinear interpolation.For a given station, the interpolateddata are the weightedaverageof the data of the four nearestpointslocatedon the NCEP grid. To evaluate the predictionperformanceof the consideredframeworks, split samplingwas used.The datasetwas dividedintotwo subsets.For combination 1 (C1),the first sample was used to calibrate the model and the second was used for validation. For combination2 (C2), the calibrationand validationsets were reversed.The data divisioninto calibrationand validationsets and the lengthsof the correspondingtime series are shown in table3.3. L49 List of predictors selected for the downscaling of precipitation and temperature at the selected meteorologicalstations. Table 3.2 Number Predictor Name at 2m Airtemperature heightat 1000hPa Geopotential heightat 850hPa Geopotential heightat 500 hPa Geopotential Verticalcomponentof wind at 1000hPa Verticalcomponentof wind at 850hPa Verticalcomponentof wind at 500hPa Relativehumidityat 1000hPa Relativehumidityat 850 hPa 10 Relativehumidityat 500hPa 11 Specifichumidityat 1000hPa 12 Specifichumidityat 850hPa 13 Specifichumidityat 500hPa 14 Sea levelpressure 15 U componentof wind at 1000hPa 16 U componentof wind at 850 hPa 17 U componentof windat 500 hPa 18 V componentof wind at 1000hPa 19 V componentof wind at 850 hPa 20 V componentof wind at 500 hPa 150 Combinations of calibration and validation sets used in downscaling precipitation and temperaturedownscaling.Data sizes in years are indicatedin brackets. Table 3.3 Gombinations Moisie Ouelle O c t 1 9 8 0 - S e p1 9 9 0( 1 0 ) O c t 1 9 6 9 - A u g1 9 8 1 ( - 1 2 ) Oct 1990-Dec1996(6) 9) O c t 1 9 8 2 - S e p 1 9 9( 1 Oct 1990-Dec1996(6) Oct1982-Sep1991(9) C1 C2 Oct 1980-Sep1990(10) O c t 1 9 6 9 - A u g1 9 8 1 ( - 1 2 ) For each meteorological station,correlationcoefficientswere computedbetweenthe predictand (local temperature or precipitations)and predictors (large-scalevariables).The variables showingsignificantcorrelation(o<0.05)were selectedfor further processing.In an attemptto select parsimoniousmodels, for each station, models formed using top five significantly correlatedvariables(M5) were comparedto the one using all significantlycorrelatedvariables (M_all).The comparisonwas done using RRMSE, RMABE, R2 and the Akaike lnformation criteris(AlC,Akaike,1974)criterionwhichis givenby: ÂlC : 2k - ?tn {L} (3-5) where k is the numberof parametersin the statisticalmodel, and L is the maximizedvalue of the likelihoodfunctionfor the estimatedmodel.lf the M5 modelperformedpoorly,in comparison to M_all,then the numberof inputvariableswas graduallyincreaseduntilwe obtaineda model that performedbetter or equivalentlyto the M_all model. The selectedpredictorswere further processedusing backwardstepwiseselectionin the MLR frameworkand canonicalcorrelation analysisin the SBL framework.Backwardstepwiseregressionbeginswith an examinationof the combinedeffectof all of the independent variableson the dependentvariable.One by one, independentvariables(usuallystartingwith the weakest predictor)are removed,and a new analysisis performed.The resultsprovidecoefficientsfor each independentvariable,signifying the degree to which each one, when combinedwith the others, contributesto predictingthe 151 dependentvariable.CCA (Brethertonet al. 1992)constructsvariates(linearcombinationsof the predictors)that share maximum correlationwith linear combinationsof predictands,while ensuringorthogonalitybetweenthe newly createdvariates.Canonicalvariablesor scoreswere then used as inputto RVM. RVM calibrationinvolvesonly one parameter,which is the width o of the kernelfunctionused. For the currentwork,the Gaussiankernelfunctionwas used: --t \ / r{t},}ir=erP(- ,:f-Xii!:. _= J (3-6) Width values rangingfrom 0.1 to 4 were used (Ghosh & Majumdar,2008). For both GP frameworks,all significantlycorrelatedNCEP variableswere input into the GP algorithm.The of NCEP variablesformedusing algorithmthen formedgenes,each of which is a combination 'f '*'). For the currentwork, a maximum of four genes the specifiedgrammar functions('*', Table3.4 (Searsonet al., 2010)was selectedto form the inputto the SBL and MLR algorithms. summarizessome of the initialsystemparametersused in this study.The valuesof the system parameters(e.9.,the mutationand crossoverrate,the populationsize) are problemdependent, duringthe modelcalibrationstage. and were selectedby trial-and-error 1.52 Table 3.4 Some of the initial system parameters(GPTIPS)used for the GP algorithm. Description Value Size of the population 100 Numberof generations to run for (including generationzero) 20 0 (precipitation amount) Termination thresholdvalue 2 (precipitation classification) Probabilityof GP tree crossover. 0.85 Probabilityof GP tree mutation. 0.1 Probabilityof GP tree directcopy. 0.05 Maximumnumberof genesper individual. Precipitation downscalingis performedin two steps:precipitation occurrence(classification) and amount (regression).Precipitationoccurrenceinvolvesclassifyingthe days as dry and wet wheredry days are assignedprecipitation amountequalto 0. Regressionis then used to predict precipitationamounts for wet days only. Unlike precipitation,temperatureis modeled as an unconditional event. The algorithm describing the statistical downscaling frameworks experimentedfor precipitation and temperatureis shown in figure3.6. 1_53 predietnrx F{fEP reenalysis '*s*'r/mg f'rc*ipîtatfu;nrft:w r Temperoluredownscaling Signi{ieantly e*nelatedprcdi*terx {îæs.s$i*ati*n {, L Frccipitation oceurrenee FreeiBitati*n amsuntst Signi{îcantly {*ne{ê?*d kedietorE eonesp**ding tû wet dalç Figure 3.6 Statisticaldownscalingframework for precipitationand temperature. 1.54 4.2 ModelAccuracyMeasures The accuracy measures used to evaluate the temperature and precipitation amount downscalingperformanceof the consideredframeworksare the Relativeroot mean square error (RRMSE),the relativemean absolutebias (RMABE)and the coefficientof determination (R'). .c.-p.'l .ç,\ 'tl ,!!=l!Yi Â.RrlfSE: ff "i (3-7) rnngË I'lrl*i-Pil RTuTABE Æ::( (3-8) 're€gt6 z{"tot-o}{p:4 -a j (3-e) where N is the total number of pointS,û; and 4 indicatethe ithobservedvalue and predicted value, respectively.O and P denote observedand predictedmeans, respectively,and 'range' denotesæa:d*hs*ved) - min {observedl. Precipitationclassificationresultswere evaluatedin the form of percentageof rightlyclassified total, dry and wet days. The occurrenceof wet or dry days is assumed to be a stochastic process,representedby a first-orderMarkovchain (Nickset al., 1990).To generatewet and dry days, the probabilitiesp{i*,lrç}and p{*çld} are used. p{wlw} is defined as the probabilityof having a wet day preceededby a wet day (wet-wet)= N(wlw)/N(w)and p{wld} is defined as the probabilityof having a wet day preceededby a dry day (dry-wet)= .,l*(u.ld}l*V{w}where, tr{w iw*: numberof wet days precededby a wet day, ;T{r"*,ieÈ}: numberof wet days precededby a dry day and tr{r*'}: total numberof wet days. The complementarydry-dry(kidld}} and wet- dry (fu{dll+,}} probabilities are computedas: p{e la} -- 1 - r{w,ld} and p{als* - 1 - p{wlr**. 155 5 RESULTS This sectionstatesthe resultof temperatureand precipitationdownscaling.Split samplingwas usedto validatethe modelsand the modelresultingin the best RRMSE,RMABEand R2values for validationset is consideredas the best model with a minimumchance of overfitting.The selectedNCEP reanalysisvariableswere first checkedfor their correlationswith precipitation and temperature.Fromthe perspectiveof parsimony,it was observedthat the M5 model lead to lower AIC valuesand comparablevaluesof the performanceindices,for both temperatureand precipitation,for all stations,except Sept-lles.For this station,the M5 model for precipitation performed poorly in comparisonto M_all. Therefore,the numbers of input variableswere to M_all was gradually increased from five until a model performingcomparably/superior correlatedvariables(M10)was foundto perform obtained.The modelusingtop 10 significantly comparablyto M_all and also resultedin lower AIC value than the latter.Therefore,for Septlles, precipitationdownscalingwas performedusing top 10 significantlycorrelatedvariablesas input. 5.1 Temperaturedownscalingresults The predictorsselectedby for temperatureand precipitationdownscalingare shown in table 3.5. Figures 3.7 and 3.8 show temperaturedownscalingresults for both calibrationand validationcombinations.lt is evidentfrom both figures that SBL performsbetter than MLR in As an example,the RRMSE,RMABE and R2 validationvaluesfor downscalingtemperature. Sept-llesgivenby SBL for C1 are 0.075,0.055and 0.91and by MLR are 0.086,0.066and 0.90, respectively.For C2, the same givenby SBL are 0.06,0.052and 0.90 and by MLR are 0.078, 0.062 and 0.89, respectively.lt can be seen that for all stationsthe percentageof total number of samplepointsused for makingpredictionis less than equalto 5%. The highestnumberof samplepointsare used for La Pocatierefor C2 (5%) and lowestfor Fermontfor both C1 and C2 (1%) 156 Table 3.5 Predictors selected for temperature and precipitation downscaling for set 1 and set 2. The numbers refer to the corresponding predictors mentioned in table 3.2. Alphabets refer to the stations mentionedin table 3.1. Stations/Variables Temperature Fermont(F) 1 1, 4 , 1 2 , 1 , 1 3 Sept-lles(S) 1 1 , 4 , 1 2,,113 La Pocatiere(P) 11,4,12,1,3 1.57 Precipitation 13,7,6,5,19 15,19,7,13,6 Cê'ibrâefi Val:idatts* s1 Itl$ mS âbs* o t * â ' , ,; , *: tûs t: * i-l F- S p-FS Statt*n$ Figure 3.7 MLR lî:,::s*t Sbla{x SBL (RVM)and MLR (ASD)temperaturedownscaling results for Cl. White bars representMLR whereas gray bars representSBL results. Çafikatiær ^u .*I t.x &J & {t3 Validation ff*.æ: & g, ft' *' *,1. Ès'î : n { '. u.uD --- 7{,.-, p Figure 3.8 SBL (RVM)and MLR (ASD)temperaturedownscaling results for C2. White bars representMLR whereas gray bars represent SBL results. 158 5.2 PrecipitationResults This subsectionis subdividedinto four parts.The first two parts describesthe comparisonof classificationresults given by SBL, MLR, SBLGP and MLRGP frameworksin terms of the selectedperformanceindices(RRMSE,RMABE and R2)and transitionprobabilites(described in the previoussection).The third and fourth subsectionscomparethe regressionresultsgiven by these methods for the entire dataset and two seasons: Winter (December-March)and Summer(July-October). 5.2.1 Classification Results The resultsof precipitationclassificationare shown in figures 3.9 and 3.10. The percentageof relevantvectorsused for predictionby SBL and SBLGPalgorithmslie in the range 1-5o/o for all stations.All methodsgive better classificationfor dry days, in comparisonto wet days. The correctlyidentifieddry days lie in the range 80-90% whereasthe correctlyidentifiedwet days are in the range 45-75%.For wet day classification,SBLGP outperformsall methods,in all cases.For dry day classification, in the case of stationsLa Pocatiereand Fermont,MLRGPand MLR outperformSBLGP. For example, for La Pocatiere,the percentageof corresponding correctlyidentifieddry days in the validationset of combinationC1 are 87, 84 and 86% for MLR, SBLGP and MLRGP, respectively.MLR is seen to outperformMLRGP in some cases. For example,for the validationset corresponding to C1 for stationFermont,the percentageof rightly classifieddry days given by MLR and MLRGP are 87o/oand 85%, respectively. Anotherexample is of stationSept-llesfor which MLR and MLRGPgive 70 and 68% of rightlyclassifiedwet days for the validationset of C2. ln some cases,MLR and MLRGPperformcomparablyin identifying wet and dry days. Station Sept-lles for the validationsets of C1 and C2 exemplifiesthis observation,where the percentageof appropriatelyclassifieddry days given by MLR and MLRGP are 87o/ofor C1 and g0% for C2. Comparisonof SBL and MLR shows that both methodsgive equivalentperformancein classifyingwet and dry days. For C1, for all stations, wet days are better classifiedby SBL and dry days by MLR. For C2, both methods give comparableresultsfor dry days. For wet days correspondingto C2, SBL performsbetterthan MLR for Fermontand La Pocatiere.Equivalentresultsare observedfor Sept-lles. Of all stations,the highestnumber of rightlyclassifieddays is obtainedfor Sept-llesfor both combinations.For this station,the percentageof rightlyclassifiedtotal (both wet and dry) days givenfor the validationset of C1 by SBL, MLR, SBLGPand MLRGPare 80, 80, 82 and 80o/o 159 respectively. The lowestnumberof correctlyidentifieddays is seen for Fermont.For this station, the percentageof rightlyclassifiedtotal days given for the validationset of C1 by SBL, MLR, S B L G Pa n d M L R G Pa r e7 1 , 7 1 , 7 3 a n d7 1 % r e s p e c t i v e l y . -9rt*9Ps- â'ury 1w''-- Validatisl .îry#-',&":&l ElllËl FËâ"^ -E Ë.'c 13 g* . / â*:. ê U} =V ËËS* +Ul)* $*t I flno È'sg-Ëulvct EËE sÛt û '&:"':&J ll ,,'a r*r I*r IËr FSP **u ffi*tr** I** s Stâ*r*c Statisns Figure 3.9 : :s8L Comparisonof classificationresults given by SBL, MLR, SBLGP and MLRGPfor combination C1. White bars representSBL, tight gray bars representMLR, dark gray bars representSBLGP and black bars show MLRGPresults. â= -*(D ra L{âft' i*ij grE *'ç u* 6€ Ë" 'Êqu b f t uÈ -oE â\ àng -3ç € * ClË 0{Eg so- ir Stati*r?s Figure 3.10 Comparison of classificationresults given by SBL, MLR, SBLGP and MLRGPfor combination C2. White bars represent SBL, light gray bars represent MLR, dark gray bars represent SBLGP and black bars show MLRGPresults. L60 5.2.1.', Comparisonoftransition probabilites In anothercomparisonof the classificationabilitiesof the methods,wet and dry day transition probabilities given by SBL, MLR, SBLGP and MLRGPfor C1 are comparedto the observed values (table 3.6table 3.7). These probabilitesare calculatedusing the entire dataset (calibrationand validation sets correspondingto C1, combined). lt is seen that for both combinations,dry day transitionprobabilities(wet-dryand dry-dry)are overestimatedand wet day transitionprobabilities(dry-wetand wet-wet)are underestimated by both methods.Among all the methods,SBLGPgave bettervaluesof the transitionprobabilitiesfor both combinations exceptfor Fermont.For this station,SBLGPand MLRGPgive equal valuesof p{r.r,lw)(0.a3) and p{dlcr'l(O.SZ). MLR and MLRGP perform comparablyin all cases. SBL is observed to outperformMLR in all cases.The absolutedifferencesbetweenobservedand estimatedvalues of p{u'ld} and p{*ld} valuesgivenfor La Pocatiereby SBL are 0.02 and 0.05 and by MLR are 0.02and 0.07,respectively. Table 3.6 Comparison of wet day transition probabilities obtained for Cl . 'Obs'refers to observed values and 'Stn' indicatesthe stations. The alphabetsdenoting the station names are shown i n t a b l e3 . 1 . ptwlwS Stn. Obs. SBL MLR p{dlw} SBLGP MLRGP Obs. SBL MLR SBLGP MLRGP 0.52 0 .4 0 0.40 0 .4 3 0.43 0.48 0.60 0.60 0.57 0.57 S 0.46 0 .4 0 0 .3 9 0.44 0.40 0.54 0.60 0.61 0.56 0.60 P 0.43 0 .3 9 0 .3 5 0.41 0.35 0.57 0.61 0.65 0.59 0.65 L6L Table 3.7 Comparison of dry day transition probabilities obtained for Cl.'Obs'refers to observed values and 'Stn' indicates the stations. The alphabets denoting the station names are shown i n t a b l e3 . 1 ptdld) p{wld) Stn Obs. SBL MLR SBLGP MLRGP ObS. SBL MLR SBLGP MLRGP 0.30 0.21 0.21 Q.22 0.21 0.70 0.79 0.79 0.78 0.79 0.31 0.28 0 .2 6 0 .2 9 0.27 0.69 0.72 0.74 0.71 0.7 3 0 . 2 9 0 .2 7 0 .2 2 0 .2 8 0.22 0.71 0.73 0.78 0.75 0.78 5.2.2 Precipitation amount downscaling results The regressionresults are shown in figures 3.11 and 3.12. ln comparisonto the other consideredmethods,SBLGP gives better values of RRMSE, RMABE and R2 for all stations exceptfor Fermont.For this station,SBLGPand SBL performequivalentlyfor the validationsets of both combinations, C1 and C2. The RRMSE,RMABEand R2 validationvaluesfor C1 given b y S B L G Pa r e 0 . 0 7 , 0 . 0 3 a n d 0 . 2 0 a n d t h e s a m e g i v e n b y S B L a r e 0 . 0 7 , 0 . 0 3 5a n d 0 . 1 6 , respectively.The respectivevalues given for C2 by SBL are 0.08, 0.038 and 0.38 and by S B L G Pa r e 0 . 0 8 2 ,0 . 0 3 7a n d 0 . 3 3 . As observed for classification,in some cases, MLR performs comparablyor outperforms MLRGP.For example,for Sept-lles,MLR outperformsMLRGPfor the validationset of C1 and the latter outperformsthe former for C2. For Fermont,both methodsperformequivalentlyfor bothvalidationsets of C1 and C2. For this stationand C1, the RRMSE,RMABEand R2values givenby MLR are 0.07,0.036and 0.16 and for MLRGPare 0.071,0.034and 0.15,respectively. For C2, the RRMSE,RMABE and R2 valuesgiven by MLR are 0.08, 0.04 and 0.16 and by MLRGPare 0.08,0.04and 0.11,respectively. 1,62 Comparisonof SBL and MLR shows that both methods performedequally in terms of the chosen performanceindices.For La Pocatiere,the RRMSE,RMABE and R2 validationvalues givenby SBL are 0.058,0.030and 0.20.The same indicesfor MLR are 0.057,0.028and 0.20, respectively.Like classification, for regressiontoo SBLGPutilizedfewer samplepointsthan SBL for prediction.The percentageof relevantvectorsused by SBLGP and SBL for regressionis in the range 1-6% and 1-5o/o,respectively,which is an indicationof a relativelyparsimonious model. L63 a.a ', : ,*' n 11Â. &.û5 a,: n s fl.&4 û.fl4:--- 8.*2 ry}1 û.r2:: ffiNrun ffismcn n'.-.:.. U' 1: 1 famcr û.5: .: nEl It: r -'*Ë b $kiiçns Figure3.11 , *4 $ta|}**s Regression results given by SBL, MLR, SBLGP and MLRGP for combination C1. White bars representSBL, light gray bars representMLR, dark gray bars representSBLGP and black bars show MLRGPresults. 0 1-----' Vaîidation ûû5 _&|, ? *rr@J 05 ê Sbtisns Figure 3.12 ^- F $-8. r ffiwrn ffismer frxrxon fl -ef -É StatjCIns Regression results given by SBL, MLR, SBLGP and MLRGP for combination C2. White bars representSBL, light gray bars representMLR, dark gray bars representSBLGP and black bars show MLRGPresults. 5.2.2.1 Seasonalresults Furtheranalysisof precipitationamount downscalingwas done by comparingthe methodsfor two seasons: Winter (December-March) and Summer (July-October). Figure 3.13 shows RRMSE,RMABEand R2validationresultsgiven by SBL, MLR, SBLGPand MLRGPfor winter and summer seasonsfor C1. lt is seen that SBLGP performsbetterthan the other considered methodsfor all stations.The RRMSE,RMABEand R2valuesfor wintergivenby this methodfor F e r m o n ta r e0 . 1 4 , 0 . 0 8a n d 0 . 1 7a n d f o r s u m m e ra r e0 . 1 2 , 0 . 0 6a n d 0 . 1 5 ,r e s p e c t i v e lM y .L R G P is outperformedby MLR for all stationfor both seasons.The RRMSE, RMABE and R2 values givenfor Sept-llesby MLRGPare 0.08,0.04 and 0.26 and by MLR are0.074,0.032and 0.41, respectively.Between SBL and MLR, both methodsgive comparablevalues of performance indicesfor all stations.The RRMSE,RMABE and R2 values given for Fermontby SBL are 0 . 1 4 3 , 0 . 0 8 1a n d 0 . 1 6 7 ,r e s p e c t i v e l T y .h e s a m e g i v e nf o r M L R a r e 0 . 1 4 4 , 0 . 0 8 3a n d 0 . 1 6 9 , respectively. For winters,best resultsare given by Sept-llesfor all methods.The correspondingRRMSE, RMABEand R2 valuesgivenfor SBLGPfor Sept-llesare 0.070,0.028and 0.40, respectively. For summer, the best results are obtained for La Pocatiereby all methods. The RRMSE, RMABEand R2valuesgivenSBLGPare 0.062, 0.027and 0.18,respectively. Wnter û"? t.? w*rrr,,&:,,'w', ' 8.1 ...-. fl 0"1 *.7..--------- & æ {9nr Et*' {, *,5 Fé E :7âwJ zeJ *.e5:t:;X= xr , ,r:,*J ssl *}ar-a .,,,..:,,.,.&: -* -Ët- Ër $P Statians ? Figure 3.13 $umæ*r RRMSE,RMABEand R2results of winter and summer seasons obtainedfor C1. White bars and gray bars representSBL and MLR results. 165 6 DISCUSSION Basedon the resultsshown in the previoussection,it can be said that SBL outperformedMLR in downscalingtemperature.Temperaturewas well downscaledby both methodsand resulted in correlationvalues greaterthan 0.90, for all stations.Accordingto the R2 values obtainedfor correlationlies between0.30-0.77,which SBL, MLR, SBLGPand MLRGP,the corresponding for daily climatictime series is satisfactory,in particularconsideringthe stochasticcharacterof daily precipitation(Hessamiet al., 2008). The relativelylow explainedvariancesgiven for precipitationby all methods underline the difficultyto downscale the precipitationregime comparedto the temperature. For precipitation,SBLGP outperformedall the other methods in classificationresults.For all methods,dry days were better classifiedthan wet days. The introductionof GP as predictor selectionmethoddid not improvethe percentageof rightlyidentifieddry days. In some cases, both GP frameworks(SBLGPand MLRGP). For all stations,the SBL and MLR outperformed percentageof rightlyclassifiedwet days did show markedimprovementsfor SBLGP. However, MLRGP was surpassed by MLR, in some cases. For example, the percentagesof rightly classifiedwet days correspondingto La Pocatieregiven by MLRGPand MLR, for the validation set of C2 were 50 and 53%, respectively. In comparisonto other methods,SBLGP gave better regressionresultsfor all stations.This observationcould be attributedto the improvedclassificationresults (particularlywet days) MLR given by SBLGPfor all stations.Like classification, in some cases MLRGPoutperformed in regressionresultsfor amounts.This observationmay be the resultof reductionin the number of correctlyidentifiedwet days while dry days remainedmore or less at the same level. An example of this is the validationresult obtainedfor La Pocatierefor C1. The corresponding R R M S E ,R M A B Ea n d R 2 v a l u e sg i v e n b y M L R G Pw e r e 0 . 0 6 3 , 0 . 0 3 8a n d 0 . 1 3 a n d b y M L R were 0.057,0.028and 0.20,respectively. Both SBL frameworks(SBLGPand MLRGP)used fewer numbersof parametersthan the MLR frameworks.The former also involvedgreatercomputationtime and memory,in comparisonto the latter.These two factors can be accountedfor by implementingthe algorithmusing lower level languagessuch as C and C++ and using largermemorycomputers.MLR, on the other hand used the entiresamplespace for makingpredictionand also involvedlessercomputation time. 165 An importantfactor found to influencethe results of GP is the fitness function used for optimization.For this study, differentoptimizationfunctionssuch as root mean square error (RMSE),coefficientof determination(R2)and mean absolutebias (MAB),were tried and they were found to give differentresults.Accordingto a studydone by Willmottand Matsuura(2005), MAB was reportedto be a bettermeasureof averageerror,in comparisonto RMSE.RMSE was regardedinappropriatebecauseit is a functionof 3 characteristics of a set of errors,ratherthan of one (the average error). RMSE varies with the variabilitywithin the distributionof error magnitudesand with the square root of the numberof errors1n1t2), as well as with the averageerror magnitude(MAE). R2 values may also be high even if the model systematicallyover-or underpredicts all the time.Therefore,MAB was ultimatelyselectedas the optimizationfunction. Similarly, different results were observed for precipitationclassificationwhen a different optimizationfunction was used, such as ff*,". * .if".r".where ffau;,"" and if*,*r. are percentageof rightly classifieddry and wet days, respectively.lt was observed that for this optimization function, models resultingin higher values of fd*r". and lower values of if**, were getting selectedif their correspondingsum is higherthan the modelwith comparablevaluesof the two. For example,a model with ffo.r".=9O%âîd.if*.*r=10% will get selectedover a model with ldd*, : 5t% and Nu*r.=4Oo/o. Therefore,a penaltyfunction(Sorr".- S**r)'was added to sum, ff*"**É Fd*.""Keepingaside the extent of convergencecriteria,the resultsof GP may rely on the predictorsselectedas parentsto form the initialpopulation,as they governthe natureof the next generationdeterminedusingselection,crossoverand mutationprocesses. 1,67 7 CONCLUSION The present work compares two frameworks to downscale mean temperature and four frameworksto downscaleprecipitationat three meteorologicalstations.The first framework involves backwardstepwise regressionwhereas the second is a non-linearSBL framework which includes input preparationusing canonical correlationanalysis. For precipitation downscaling,two more frameworksinvolvingthe applicationof genetic algorithmas predictor selectionmethodfor both SBL and MLR algorithmswere applied. The resultsindicatedthat SBL performedbetterthan MLR in downscalingtemperature.For all stations,temperaturewas better downscaledthan precipitation.For precipitationdownscaling, SBLGP frameworkgave betterclassificationand regressionresults,in comparisonto the other as consideredmethods.In some cases, MLR was seen to outperformMLRGPfor classification well as regression.Dry days were betterclassifiedthan wet days. BetweenSBL and MLR, the latter could be regardedas a better approachfor precipitationdownscaling.This is because MLR is characterisedby a simple,computationallyinexpensivealgorithmand also performed equallywellas SBL. Both SBL frameworks (SBL and SBLGP) supported sparsity by using fewer parameters. However, both methods also required greater computationtime and memory. Applying the algorithm using lower level computer languages may prove helpful in accountingfor the computationalrequirementsof the algorithm.The applicationof SBL with other predictor selectionmethods (fuzzy logic, classificationand regressiontrees) can be regarded as an extensionof this work. 168 CHAPITRE4 COMPARISON OF DIRECTSTATISTICAL AND INDIRECT STATISTICAL.DETERMINISTIC FRAMEWORKS IN DOWNSCALING RIVERLOW.FLOW INDICES DeeptiJoshil,AndreSt-Hilairel, Taha Ouardat'2, Anik Daiglel'3, NathalieThiemongea t I N R S - E T E ,U n i v e r s i t y o f Q u e b e c , 4 9 0 d e l a C o u r o n n e ,Q u e b e c G 1 K 9 A 9 , C a n a d a ([email protected], [email protected], [email protected]) 2 Masdarlnstitute,Professor Head - Water Environmental Engineering,PO Box 54224, Abu , , Dhabi,UnitedArab Emirates([email protected], [email protected] ) 'Cégep Garneau,1600boulevardde I'Entente, Québec,G1S 4S3, Canada. a Ingénieure en hydrologie-Équipement, UnitéConceptiondes aménagements de production Hydrauliqueset géotechniq [email protected]) ues (Thiemonge. Corresponding author: DeeptiJoshi Articlesoumisà Hvdroloqical SciencesJournalle 17 juillet2013 The contentof this articleis the resultof the work done by the first authorunderthe supervision of the co-authors.The implementationof the idea behind the work and evaluationof results were done by DeeptiJoshi in collaboration with ProfessorSt-Hilaire,ProfessorOuardaand Anik Daigle. The calibrationof the consideredhydrologicalmodel (SSARR) was done by Deepti Joshi with the help of the optimisationalgorithmprepared by Anik Daigle and Nathalie Thiemonge.The presentationof resultsin the form of a manuscriptwas done by DeeptiJoshi and reviewedby the co-authors. 169 ABSTRACT This work exploresthe abilityof two methodologiesin downscalinghydrologicalindices(Hls) characterising the low flow regimeof three salmon riversin EasternCanada:Moisie,Romaine and Ouelle.The selectedindicesdescribefour aspectsof the low flow regimeof these rivers: amplitude,frequency,variabilityand timing. The first methodology(direct downscaling) ascertainsa directlink betweenlarge scale atmosphericvariables(the predictors)and low flow precipitation indices(the predictands). The second(indirectdownscaling) involvesdownscaling and air temperature(local climate variables)that are introducedinto a hydrologicalmodel to simulateflows. Syntheticflow time series are subsequentlyused to calculatethe low flow indices.The statisticalmodels used for downscalinglow flow Hls and local climatevariables are: SparseBayesianLearningand MultipleLinear Regression.The resultsshowedthat direct downscalingusing Sparse BayesianLearningsurpassedthe other approacheswith respectto goodnessof fit and generalization ability. Keywords: Statisticaldownscaling,RelevanceVector Machine, Multiple Linear Regression, CanonicalCorrelationAnalysis,Low flows,Hydrologicalmodeling 171 1 INTRODUCTION Water-relateddisasters,i.e.floodsand droughts,have been more devastatingoverallthan other natural hazards (earthquakes,volcanoes,etc.) as far as deaths, suffering,and economical damages are concerned. Many climate change scenarios predict that the frequency of occurrenceand amplitudeof climaticand hydrologicextremesare likelyto be affectedwithinthe next 100 years. These extremes are importantfor decision making in water resources.In particular,informationon low flows is relevantfor several purposessuch as industrialneeds, flows. agriculturaldemands,water pollutioncontrolrequirementsand environmental In the literature,a numberof hydrologicalindices(Hls) describingdifferentaspectsof a riverlow flow regimehave been proposed.Indiceshave been developedand tested in particularregions in terms of biologicallyrelevantflow variables,to describethe overall variabilityin regional sensitiveto variousforms of human hydrologicregimesand to quantifylow flow characteristics perturbations(Olden and Poff, 2003). Despitethe significantamount of specialistknowledge that has accumulatedin the field of low flow hydrology,specificunderstandingof processes associatedwith low flows in diverseclimatic,topographicaland geologicalconditionsis rather limited,due to scarceexperimental low flow studies.Accordingto Smakhtin(2001),considering the growingattentionto climatevariability,the specificissue of low flow change under altering climaticconditionsrequiresadditionalresearch. A crucial step in the developmentof tools for climate change impact assessmentwas the developmentof global atmosphericgeneralcirculationmodels (GCMs),which simulatethe presentclimateand generatescenariosof futureclimatechange.GCMs exhibitsignificant skill at hemisphericand continentalspatial scales and incorporatea large proportion of the complexityof the global system but are inherentlyunable to representlocal sub-grid scale features(Wigleyet al., 1990)such as topography, cloudcoverand landuse. The focusof most of the climate change impact studies is primarilyon societalresponsesto local and regional consequences of large-scale changes.As a consequence embeddingschemeslinkingGCMsto meteorological and hydrologicmodelsresolvedat finer scaleswere proposedand implemented. The use of deterministichydrologicmodels for assessingthe impacts of climate change on modelsare meant to hydrological regimeshas severaladvantages(Xu, 1999).Deterministic conceptuallyrepresent the physical processes underpinningthe hydrologicalbudget for a conditions drainagebasin or sub-basin.Many modelstestedfor differentclimatic/physiographic 172 are readilyavailable.Additionally, modelswith outputsfrom largethe couplingof hydrological scale GCMs can be well suitedto take advantageof continuingimprovementsin the resolution of climate models. Although the coupling of GCMs with hydrologicalmodels facilitatesthe understandingof the effects of large scale changes on regional hydrologicvariability,this frameworkis constrainedby gaps between the GCMs resolutionand the need to describe potentialhydrologicalchangesat a relativelyfine scale.Accordingto Xu (1999),these gaps are characterizedby spatial and temporal scale mismatches,vertical level mismatchesand the mismatches between accuracy of GCM outputs and the hydrologicalimportance of the variables. To narrow these gaps, the climate researchcommunityput a considerableeffort towardsthe development of 'downscaling techniques'. Two fundamental approaches exist for the downscalingof GCM outputs (Wilby et al., 2004): dynamicaland statistical(also known as empirical)approaches. Dynamicalapproachesinvolverunningregionalclimatemodels(RCMs) with GCM outputsas boundaryconditionsto simulateprocessesat a finer scale. However, RCMs are computationally expensive,and their applicationis sometimestemporallyand spatiallylimited.StatisticalDownscaling(SD) approachesderive mathematicalrelationships between broad scale variables (predictors),obtained from reanalysisdata, and fine scale surfaceconditions(predictands). With the adventof SD techniques, the initialstepsof providing hydrologicalinformationfor impact studiesof climatechange on hydrologywere then typically viewedas a two step approach (referredto as'indirectdownscaling'(lD) (1) GCM henceforth): outputs(predictors)are used to generatelocal dowscaledclimateconditions(predictand)such as temperatureor precipitationand, (2) the downscaledvariables are introduced into a hydrologicmodelto get futureprojectionsof possiblehydrologicalchanges. This two step downscalingframework is usually constrainedin space by the domain of calibrationof the hydrologicalmodel.Additionallythe data requirementfor adjustingthe model parametersmay be large,particularlyfor conceptualand fully distributedhydrologicalmodel,for exampleSWAT (Eckhardtet al.,2005).Simplemodelshavea smallerrangeof applications and can give adequate results at greatly reduced costs while the models characterizedby complexityin terms of structureand data requirementsprovide adequate resultsfor a wide range of applications.In an attemptto circumventthese shortcomings, few studies(Canonand Whitfield,2002;Ghoshand Majumdar,2008; Tisseuilet al., 2010)triedto establisha directlink betweenstreamflowsand GCM outputs.Such a direct link (referredto as direct downscaling (DD) henceforth)has been criticisedprimarilydue to lack of considerationof water storesand \73 transferswithinthe soils and groundwaterof a catchment(Xu, 1999).However,seekingsuch a direct associationbetween river flows and GCM outputs may be relevant to facilitatethe generalisationand extrapolationof predictandsimulationsover large scales (Tisseuilet al., 2010). In this study, DD and lD strategieslinkinglow flow Hls to large scale atmosphericvariables were exploredfor three salmonriversin the provinceof Quebec,Canada.The statisticalmodels for theirdownscaling experimented abilitieswere SparseBayesianLearning(SBL)and Multiple Linear Regression(MLR). On the basis of literaturereview,it was found that the former finds scarce applicationsin downscalingstudies,particularlyin North America,while the latter has beenfrequentlyapplied(Nietoand Wilby,2005;Gachonand Dibike,2007;Dibikeet al., 2008). Also,to our knowledgeno downscaling study has been conductedfor low flow Hls. This study willthus addressthe followingquestions: 1. Which of the two statisticalmodels(SBL and MLR) performsbest in downscalinglow flow Hls from NCEPreanalysis variables? atmospheric 2 . Does the inclusionof a hydrologicalmodel (lD framework)improvethe downscaling performance,or could the characteristicsof low flow Hls be well reproduced by variables(DD framework)? establishing a directlinkto NCEPreanalysis atmospheric 3 . ls the considereddownscalingframeworkrelevantwith respectto future climatechange impact studies?As an example,future projectionsof low flow indicesare shown using threeemissionscenarios(A1B,A2 and 81) of GCM (ECHAMS)and one scenario(A2)of CanadianRegionalClimateModel(CRCM;DrivingGCM:CGCM3). L74 2 STATISTICAL DOWNSCALING FRAMEWORK The statisticaldownscalingframework(figure4.1) used in this work is built on a comparative approach that has three aspects. Two statisticalmodels were applied to two downscaling methodologiesto quantifythe relationshipbetweenNCEP atmosphericvariablesand low flow Hls for three rivers:Moisie,Romaineand Ouelle.As mentionedin the introduction, the two downscalingmethodologies were a DirectDownscaling(DD) a IndirectDownscaling (lD) DD methodology directlylinks NCEP atmosphericvariableswith the low flow Hls. lD is a two step approach where the NCEP atmosphericvariables are first linked with local climate variables (such as precipitationand air temperature)and thereafter,the downscaledlocal climatevariablesare introducedinto a hydrologicalmodelto simulateflows from which low flow Hls are calculated.The statisticalmodelsselectedto establishthese linkswere . RelevanceVector Machine(RVM),that enforcesSBL algorithm(describedin the following section),and . The AutomatedStatisticalDownscaling(ASD; Hessamiet al., 2008) tool that implements MLR In the lD methodology,the hydrologicalmodelchosenfor simulatingflows from the downscaled local climate variables was the StreamflowSynthesis and Reservoir Regulation(SSARR) model. Detailsof RVM, ASD and SSARR are given in the followingsubsections.Inputsto both the methodologies were preparedin the followingmanner: 1. Correlationswere calculated between monthly, seasonal and yearly values of NCEP reanalysisvariablesand predictands.The predictandsfor DD were low flow Hls. For lD, the predictandswere inputsto the hydrologicalmodel, SSARR, i.e. mean air temperatureand precipitation. 2. the significantlycorrelatedseries (o<0.05) were then subjectedto canonicalcorrelation analysis(CCA) and the canonicalvariablescoreswere introducedinto the RVM algorithm.CCA (Busuoicet al., 2007) looksfor a linearcombinationof predictorsthat are optimallycorrelated with the predictand. L75 3. For ASD, the significantlycorrelatedvariables underwentbackwardstepwise regression. Backward stepwise regression(McCuen, 2003) starts with all the terms in the model and significant. removesthe leastsignificantterms untilall the remainingterms are statistically Combiningthe two statisticaldownscalingmodels (RVM and ASD) and two downscaling (DD and lD) gavethe followingapproaches: methodologies models 1. DD usingstatistical . R V M( D D 1 ) . ASD (DD2) lD involvinghydrologicalmodel,SSARR,with the followinginputs: 2. . (lD1)and RVM downscaled valuesof precipitation and temperature . ASD downscaledvaluesof precipitation and temperature(lD2) and temperatureinto SSARRto simulateflows 3. Introducingobservedvaluesof precipitation and hencelow flow indices.This approacheliminatesthe biasespresentin the reanalysis data and is referredto as'PartialValidationApproach'(PVA). Projectionsof low flow Hls were produced to illustratean applicationof the downscaling frameworkfor future climate change impact studies. These projectionsare based on three scenarios,A1B (high emission),A2 (medium-highemission)and B1 (low emission),(IPCC report, EmissionScenarios,2007) from GCM, ECHAMS(Roeckneret al., 2003) and one scenarioA2 from CRCM (Jiao and Caya,2006).ECHAMSis currentlythe most recentversion of ECHAM, a global climate model developedby the Max Planck Institutefor Meteorology. CRCM is a regionalclimatemodel developedin collaborationbetweenCanadianRegional Climate Modeling and Diagnosticsnetwork,the ESCER centre of universityof Quebec at Montreal and the Ouranos Consortiumon regional climatologyand adaptationto climate change.The CRCM modelused here is drivenby GCM,CGCM3followinggreenhousegas and accordingto scenarioA2. aerosolconcentration Two time periods:2021-2050(20s) and 2051-2080(50s) were investigatedfor relativechange (RC) in medianand variabilityof the low flow Hls with respectto the baselineperiod(19612010). RC was calculatedas the differencebetweenfuture projectedand observed (19612010)flow condition,dividedby the observedcondition. L76 The futureprojectionsof low flow Hls were made in the followingmanner: 1. Daily outputsof the selectedatmosphericvariableswere extractedfor scenariosA1B, A2 and B1 for ECHAM5and scenarioA2 for CRCM. 2. These predictorswere bilinearlyinterpolated(Lo et al, 2008; Tisseuilet al2Q10)to obtain ECHAMSand CRCM outputsat the selecteddischarge/meteorological stationsand yearly, monthlyand seasonalseriesof the resultinginterpolated variableswere calculated. 3. The yearly/monthly/seasonal series of NCEP reanalysisvariables,exhibitingsignificant correlationwith the low flow Hls, were selected and the correspondingsubsets from ECHAMSand CRCM outputs (obtainedin step 2) were selectedas predictorsfor future projections. 4. These predictorswere used as inputs in the statisticalmodels (developedusing NCEP reanalysisvariables).Canonicalvariateswere used for RVM and predictorsselectedby stepwiseregressionwere used for ASD to generatescenariosof low flow indicesfor future time periods(20sand 50s). 5. The criteriaof comparisonbetweenthe projectionsare relativechange (RC) in the median and variabilityof the indices in the future time periods: 2Q21-2050(20s) and 20512081(50s)with respectto the baselineperiod(1961-2010).RC is calculatedas: RC: futune prejected value-baseline baseline period L77 value period value (4-1) Âppxrcke î*$iræte Appraûe Dirccte ( {Ar} SignificantlycarrelatedeIinratevariabtex CCA / / \ \ Stcp* ise prr-tlictor CT'A o-ltclion SclectedPredictors MSÂË,&tMr'{iP MSAB Wq;iiîï Prr:r:ipitatioTl ::û{,air tr:rnp*rarure I âgtprvw:fu d* wîid*ti*n fxêr{i€N* {,{rtp} I jnrceifiæaiærr : aûd &rr : t*lv fîr:w inelicsx Ëvalu:*ti*a*f p*rfbnn*ner:i*dieeç{RRâdSË,R:dÂ&E***f R;} Figure4.1 StatisticalDownscalingFramework. 2.1 Statisticalmodels The two statistical models used to downscale low flow Hls in the DD framework and meteorologicalvariables (precipitationand temperature)in the lD framework are Sparse BayesianLearning(SBL; Tipping,2001) and MultipleLinear Regression(MLR; Gachonand Dibike,2007). MLR is a statisticalmethodthat is used to model linear relationshipbetweena dependentvariable(predictand)and one or more independentvariables(predictors).lt is a least squarebased methodthat assumesthat the relationshipbetweenthe predictorsand predictand is linear. SBL is a Bayesian framework for obtaining sparse solutions to regressionand classificationtasks using models linear in the parameters. A key facet of SBL is the incorporationof parameterizedprior on the weightsthat encouragessparsityin representation. The majorityof parametersare automaticallyset to zero during the learningprocess,giving a 178 procedurethat is extremelyeffectiveat discerningthose basisfunctionswhich are 'relevant'for makinggood predictions (Tipping,2001). 2.1.1 Relevance vector machine (RVM) RVM (Tipping, 2OO1) uses probabilistic Bayesian learning to capture the underlying relationshipsbetween predictorsand predictands.lt is a Bayesiantreatmentof the function usedin SVM (Cortesand Vapnik,1995): f :,f{x;N,.}: f,!rw,f{{r,r;j + *'ç (4-2) where K{r,x;} is a kernelfunction,effectivelydefiningone basis functionfor each examplein the training set. Mathematicalformulationsbehind the algorithm and its applicationin downscalingstudiescan be found in Joshi et al. (2013).The currentwork uses a Gaussian kernelfunction: lrtr,riJ=8x?f- .", J (4-3) 2.1.2 Automated statistical downscaling tool ASD is capableof performingstatisticaldownscalingautomatically,from predictorselectionto model calibration,scenariogenerationand statisticalanalysisof scenarios.Two methods of predictorselection:backwardstepwiseregressionand partialcorrelationare incorporatedfor predictorselection.The currentwork uses backwardstepwiseregressionfor predictorselection. Detailsabout the mathematical formulationsbehindthe ASD algorithmand its applicationin precipitation and temperaturedownscalingcan be found in Hessamiet al. (2008). 2.2 The hydrologicalmodel:SSARR SSARR(Kite,1978;Cundyand Brooks,1981)is a lumpedconceptualhydrological modelwhich comprisesof a generalizedwatershedmodel and a streamflowand reservoirregulationmodel. The current version of SSARR uses two types of watershed models: Integrated-Snowband model and DepletionCurve model. The Integratedsnowbandmodel (figure 4.2) divides the basin into a numberof bands or zones of equal elevation.Each band is then treatedas a separate watershed with its own characteristics.Simulation of snowpack conditions and L79 for each band.The depletioncurve moistureinputfor routingis independently accomplished model simulatesthe catchmentas an entityand depletesthe snow coveredarea as a function of seasonal accumulatedrunoff. This work uses the integratedsnowbandmodel which has represented in figure4.2 (SSARRusermanual,1991). beendiagrammatically BAND5 {-} | | BAND.I æ i = é {ooo É H Fr E z, O I\IELTINT lAIION 7 tsi H r JUuu H Ei R*4INFR-EEru tEl J H rr tsd 2û00 Frl -10 60 PERCENT ÛFARIÀ Figure 4.2 Snow -Elevation band exampleof rain, snow and melt (SSARRmanual, 1991). The River System and Reservoir Regulation Model routes streamflowfrom upstream to downstreamthroughchanneland lake storageand reservoirsunderfree flow or controlled-flow modes of operation.Flows may be routed as a functionof multivariaterelationshipsinvolving backwatereffects from tides or reservoiroperations.Diversionand overbank flows can be The compute-period may be as shortas 0.1 houror as longas 24 hours. simulated. 180 2.2.'l SSARR calibration SSARR calibrationwas done using an optimisationsubroutinebased on an algorithmthat makes an iterativesearchof the parameterspace based on performancemeasuresand depth function(Bardossyand Singh,2008). For the quantificationof the performanceof hydrological models,most of the performancecriteriaconcentrateson how well the simulatedhydrographs, flood peaks and flow volumes match with correspondingobserved values (Green and Stephenson,1986). These criteria provide scarce informationabout the quality of low flow simulationsdue to their bias towardshigh flows. For the currentwork, the followingevaluation performancecriteriaswere used to assessSSARRresults (4-41 )' (4-5) - 1,w#sÀi,4s}f r r -t"elpjlt .{tog.o;.r Ea.iloc ioi' -log''60''r tOGfi'lSH-1-# (4-6) (4-7) where n denotesthe numberof days in the time series,and S; and P; denote observedand simulated daily values, respectively.A and F denote observed and simulated means, respectively.These performancecriteriaswere quantifiedfor the entireyear and separatelyfor two seasons(December-March and July-October). R2 and NASH are the most commonly used performancecriterias(Legates and McCabe, 1999). The major drawback of using R2, if it is consideredalone, is that it only quantifies dispersion.Therefore,a model which systematicallyover- or under predictscan still result in good valuesof R2.With the NASH coefficient,the squaringof the differencebetweenobserved and predictedvalues leads to an overestimation of model performanceduring peak flows and an underestimationduring low flow conditions.Niether performancecriteria are sufficiently sensitiveto systematicmodel over- or under prediction,particularlyduring low flow periods.To reduce the problem of squared differencesand the resultingsensitivityto extreme values, LOGNASH is calculatedwith logarithmicvalues of O and P. The logarithmictransformation 181 flattensthe peaks of the hydrograph.As a result,the influenceof low flows is increasedin comparisonto flood peaks, thereby increasingthe sensitivityof the index to model over- or under predictionof low flows. Anotherway of increasingthe influenceof absolutedifferences betweenobservedand predictedvaluesduring low flow periodsand reducingthe same during high peaks, is to quantifythem as relativedeviations(MODNASH).As a result,it can be expectedthat the relativedeviationsare more sensitiveto systematicover- or under prediction, particularly duringlow flowconditions. r82 3 STUDYAREA ïhe considereddownscalingmethodologieswere experimentedfor three rivers locatedin the provinceof Quebec,in EasternCanada.Moisieand Romaineriversare locatedon the North shore whereas Ouelle is locatedon the south shore of the St. LawrenceRiver. These rivers were chosen as they sustain Atlantic Salmon (Salmo salar) populations,which has been regarded as an endangeredspecies (Committeeon the Status of EndangeredWildlife in Canada; COSEWIC, 2011) and is known to be adversely affected by extreme low flows (Armstrong et al., 1998). Dailystreamflow,precipitation and air temperaturedata for stationsrepresentingthe three rivers were obtained from EnvironmentCanada database (http://www.climate.weatheroffice.qc.ca). Locationsof the dischargeand meteorological stationson each of these river basinsare shown in figure 4.3 which has been reproducedfrom Joshi et al (2013) (Chapter1). There is one hydrometricstationand two meteorological stationscorrespondingto Romaineand Moisieand one dischargeand one meteorological stationfor Ouelle.Detailsof the meteorological stations and hydrologicalstationsare shown in table 4.1 and table 4.2, respectively. Flow duration curves for the three rivers for summer and winter flows are shown in figure 4.4. Moisie and Romaineclearlyhave more severewinter flows. For Moisie,the Q95 (flowsexceeded95% of days)valuesfor summer(July-October) and winter(December-March)flows are 222.5m3/sand 60.3 m3/s,respectivelyand for Romainethe same are 140 and 42.9 m3/s,respectively.Ouelle has more severe summerflows, however,the differencebetweensummer and winterflows is not as pronouncedas for Romaineand Moisie.The Q95 valuescorresponding to Ouellefor summerand winterare 0.65and 0.86 mt/s,respectively. 183 l f-.q tt., Eon Æ-Iac { .-- -- r--I \ {al I \:_ \! t,, '. I ,t -rv*. j(ornaule -:r ! . :' lr t: \ IUoisie ,, I f ./ ii !,, La For*rfièr'e "1 I I ,[ il I--\ ,' :.- '{ 'l a"l Sept-Îles Har.r'e-Saint-Pierre Figure 4.3 The study area map showing the locations of dischargeand meteorologicalstations on each river. The squares and circles denote meteorologicaland discharge stations, respectively. 184 t '"-- û4e ûûJ >g #L r : è g) ;o {DA:l3S*&&n?; '* ""'-----" '€o--cçu3 €Ê0s çËtÈ { g*.t : 6 ll) -Ô{1, , 8';- ' 1û', I*? 1S3 **elr*rg*4æ3rx! E .ql 9g {LUJÛ, 1û , 1û- *uelle{û&:?$5Krn?i :d 1&* *iseharg*{r*3su} 1:- "***.Sclmrïar *Wittfêr >rr xa) x$ YX û-ttl nq. ', {1'. . 1û' Flgure 4.4 Table4.1 Station 11 ni*e*argqnru3* Flow duration curves for Romaine,Moisie and Ouelle for summer (dashed line) and winter flows (smooth line). The drainage areas (DA) are indicated in the figure. Data are plotted on semi-logarithmicaxis. Descriptionof meteorologicalstations used in the current work. River Latitude Moisie N 52'48'00.000" Fermont Longitude Elevation 67"05'00.000' Oct1980-Dec 594.40 W Sept-lles Moisie Available years 1996 66' 16' 00.000" 5 0 '1 3 '0 0 .000" 54.90 N W Oct 1980-Dec 1996 Jan 1964-Dec Lac Eon Romaine 51"52'02.000'N 6 3 ' 1 7 ' 0 1 . 0 0 0 ' 588.90 W HavreSt- Jan 1964-Dec Romaine 50"16'55.000"N Pierre 63"36' 41.000"37.80 W 70"01'55.000" La Ouelle Pocatiere 1976 1976 Oct 1969-Sept 31.00 4 7 " 2 1 ' , 2 1 . 0 0N0 ' W 185 19 9 1 Table 4.2 Descriptionof hydrometricstations (reproducedfrom Joshi et al., 2013). Longitude Catchment Area(Km2) Years Years Excluded Romaine 50"18'28"N 6 3 '3 7 '2 1" W 13000 19612010 2007 Moisie 5 0 ' 2 1 ' 1N" 6 6 " 1 1 ' 2 5W " 19000 19662010 2007 1967,1999,2000, Ouelle 47"22',52"N 69'57'29"W 795 19612010 1967,1981,1982,1996 Station Latitude 1_86 4 SELECTION OF LOWFLOWINDICES Six low flow indicescharacterizingdifferentaspectsof the low flow regime of the three rivers were considered.These indiceswere selectedbased on the study presentedin Daigle et al. (2011) which dealt with the characterization of low flow regimesof rivers in EasternCanada using data from 175 discharge stations. Tl indices considered relevant from low flow perspectivewere identifiedand categorizedinto five groups describingdifferentaspectsof the low flow regime-magnitude, frequency, duration,variability and timing(Richteret al., 1996).The numberof indiceswas reducedfrom 71 to eight highlyinformativeand low-correlatedHls using PrincipalComponentAnalysis(PCA). Followingthis work, low redundantHls coveringfour aspectsof low flow regimeof a river,were selected.These four aspectsare magnitude,variability,timingand duration.To accountfor the impacts of temporal dependenceon the validity of statisticalestimates,indices exhibiting autocorrelation were avoided.The selectedindiceswere (Table4.3): Minimumsof March flow valuesfor each year (AMP1),ratioof the lowestannualmonthlydischargeto the mean annual discharge(AMP2),averageJuliandate of the sevenannualone day minimumdischarges(T), standarddeviationof the Julian date of the seven 1-day minimumdischarges(V), 90-day minimumdividedby the medianof the entirerecord(D1) and 90-dayminimumcalculatedfor July-October,dividedby the medianof the entirerecord(D2). 1,87 Selectedhydrologicalindices definitionwith index code (reproducedfrom Joshi et al., 2 0 13 ) . Table 4.3 Index Description Timing AMPl Minimumsof all March flow values for each year (Ls-1km-2) Yearly AMP2 Ratioof the lowestannualmonthlydischarge to the meanannualdischarge(unitless) Yearly T AverageJulian date of the seven annual 1day minimumdischarges(Juliandate) Yearly V Standarddeviationof the Julian date of the seven1-dayminimumdischarges(days) Yearly D1 90-dayminimumdividedby the medianof the entirerecord(unitless) Yearly D2 90-day minimumcalculatedfor July-October, divided by the median of the entire record (unitless) 188 Seasonal 5 PREDICTOR SELECTION Statisticaldownscalingmodelsare based on the fundamentalassumptions(Von Storch et al., predictorsand local-scale 2000):(1)The empiricalrelationship developedbetweenglobal-scale predictandsshould be stableunder future climateconditions,(2) the predictorvariablesshould be adequatelyproducedby GCM/RCM,and (3) the selectedpredictorsshouldfully incorporate the futureclimatechangesignal.In particular connection to point3, Huthet al (2004),foundthat for temperature downscaling it is necessary to include among predictors the variables describingradiation-induced changesand not only circulationinduceschanges.In connection, the use of sea level pressureor 1000 hpa heights predictorsas the only predictorslead to unrealisticallylow temperaturechange estimates.Some other studies that have investigated appropriatepredictormethodsin downscaling studiesincludeBenestad(2001),Hessamiet al. (2008),Dibikeet al. (2008)and Jeonget al.(2012). For the currentwork, reanalysisdata from the NationalCenter for EnvironmentalPrediction (NCEP; Kalnayet al., 1996) were used as large-scaleatmosphericpredictorsto calibratethe models and validate the approaches.These datasets are 'observed'large-scaledata on a regulargrid with a spatial resolutionof approximately2.5" X 2.5" (250 km X 250 km). Each NCEP variablewas interpolatedto each dischargeand meteorological stationlocationsfor DD and lD, respectively,using bilinearinterpolation. For a given station,the interpolateddata were calculatedby taking a weightedaverageof the data from the four nearestpoints locatedon a regulargrid. The full list of predictorsis shown in table 4.4. These variablesincludeRelative Humidity(RH), SpecificHumidity(SH), Zonal(U), Meridonal(V) and Vertical(ur)componentsof wind and geopotentialheightat differentpressurelevels(1000,850 and 500 hPa) and Sea Level Pressure(SLP).The variableHeatingDegreeDays (HDD) was also includedfor the DD. HDD indicatesexceedenceof the daily mean above a certain temperaturethreshold(base temperature). In the currentwork,a basetemperature equalto 1oCwas considered. 1_89 NGEPpredictors used in the downscalingframework (reproducedfrom Joshi et al.,2013). Table 4.4 Number PredictorNames Meantemperatureat2m Meansea levelpressure Specifichumidityat 1000hPa Specifichumidityat 850 hPa Specifichumidityat 500 hPa Relativehumidityat 1000hPa Relativehumidityat 850 hPa Relativehumidityat 500 hPa Zonalwind componentat 1000hPa 10 Zonalwind componentat 850 hPa 11 Zonalwind componentat 500 hPa 12 M e r i d o n a l w i ncdo m p o n e nat t 1 0 0 0h P a 13 Meridonalwind componentat 850 hPa 14 Meridonalwind componentat 500 hPa 15 Verticalwindcomponentat 1000hPa 16 Verticalwind componentat 850 hPa 17 Verticalwind componentat 500 hPa 18 heightat 1000hPa Geopotential 19 Geopotentialheightat 850 hPa 20 Geopotentialheightat 500 hPa 21 HeatingDegreeDays 6 MODELVALIDATION AND PERFORMANCE (Stone,1974)providesa simpleand effectivemethodfor both modelselection Cross-validation and performance evaluationand is widelyemployedby the downscaling community.Underk fold cross-validationthe data are randomly partitioned to form k disjoint subsets of approximatelyequal size. Of the k subsets,one is retainedas the validationdata for testingthe model,and the remainingk - 1 subsetsare used as trainingdata.A specialcase of k fold cross validationis splitsampling(le2) in whichthe datasetis dividedintotwo subsets,one for training and the other for testing.The most extremeform of cross-validation is known as leave-one-out (LOCV). LOCV consistsof omittingone case at a time and buildingthe cross-validation statisticalmodel on the remainingdataset,then estimatingthe omittedcase with the model.All N availablecases are omittedand estimatedin turn and the model performanceis computed from the N estimationerrors. The low flow Hls selectedfor this work are yearlyand/or seasonal.Therefore,in DD, the total numberof samplesavailablefor calibratingRVM and ASD is equal to the total numberof years of data, and the method was validatedthrough LOCV. In lD methodology,daily values of precipitationand temperaturewere downscaledand furtherintroducedinto SSARR to simulate daily flows and thereafterlow flow indiceswere calculated.Therefore,the datasetwas divided into two subsets,that were alternativelyused as calibrationand validationsets in a split-sample cross-validation The ability of the DD and lD methodologiesto downscalethe selected low flow Hls was quantifiedusingthe followingperformanceindices:RelativeRoot Mean SquareError(RRMSE), RelativeMeanAbsoluteBias Error(RMABE)andCoefficient of Determination: ] tsi=:' . , ' û , - Pr^ , , ! oi RÆMSE = Y& .{ -e iua-fli[ oli RMIBE - "=1- f and Rr_-LlL.to-o:,tp-P; @l 1_91 (4-8) (4-e) \ (4-10) 7 RESULTS 7.1 lntercomparison of DD approaches(DD1and DD2) Comparisonof the downscalingefficienciesof DD1 and DD2 are presentedin detail in Joshi et al. (2013).The resultsindicatedthat DD1 performedbetterthan DD2 in terms of performance indices(RRMSE,RMABE and R2).The former resultedin lesservariabilityof the performance ability.DD1 also indicesbetweencalibrationand validationsets, implyingbettergeneralisation supported sparsity by using fewer numbers of parameters to make predictions. Both methodologieswere unable to capture the variabilitypresent in index V for all rivers. An intercomparison of the riversshowedthat the values of RRMSE and RMABE obtainedfor the indicesfrom Ouellewere higherthanthosefrom Romaineand Moisie. 7.2 Downscalingof precipitation and temperature Comparisonof RVM and ASD for downscalingprecipitationand mean temperatureindicated that both the methodsperformedcomparablyin downscalingprecipitationRVM outperformed ASD in downscalingtemperature.Greater skill was shown in downscalingtemperatureover precipitation.For temperature,both methodsgave R2 values greaterthan 0.90 for all stations. Both methodswere unable to capture the variabilityexisting in precipitationand yielded R2 values within the range 0.30-0.70.RVM provedto be a rathersparse model, by basing its predictionson 1-5o/oand 1-7% of the total number of sample points for the precipitationand temperature models, respectively.With respect to the simplicity and the lower memory requirements,ASD algorithmwas regardedas more suitablefor downscalingprecipitationand mean air temperature. 7.3 SSARRcalibration The calibrationof hydrologicalmodel is an importantcomponentof the lD framework.For the current work, the ability of SSARR to simulateflows was tested using split sampling.The of calibrationand validationyears (combinationl(C1)and combination2 (C2)) combinations used in split samplingare indicatedin table 4.5. Table 4.6 shows SSARR simulationresults (tableshown only for C1) for the three rivers.The yearlyvaluesof performanceindicesindicate L92 that SSARR performswell for Moisieand Romaine,as comparedto, Ouelle.The corresponding NASH, MODNASH,LOGNASHand R2for Ouelleare 0.66, 0.41, 0.68 and 0.64, respectively. The same for Moisieare 0.71, 0.87, 0.76 and 0.84 and for Romaineare 0.76, 0.89,0.79 and 076, respectively. Accordingto MODNASHwinterflows are bettersimulatedthan summerflows for all rivers.The MODNASHvalues(for C1)for Romaine,Moisieand Ouellefor summerare 0.40,0.16and 0.20and for winterare 0.73,0.73and 0.24,respectively. Table 4.5 Calibration and validation sets used in the analysis. Data sizes in years are indicated in brackets. Sets Type Moisie Romaine Ouelle J a n 1 9 6 4 - D e c 1 9 6 9 Oct 1980-Sep1990 ,. uailorailon (5) (10) Combination 1 (c1) Validation Jan 1970-Dec 1e76(7) O c t ' 1 9 9 0 - D e1c9 9 6 (6) Oct1982-Sep1991 Calibration Jan1970-Dec 1976 (7) Oct 1990-Dec1996 (6) Oct1982-Sep1991 Validation Jan1964-Dec 1969 (5) Oct 1980-Sep1990 (10) Oct 1969-Aug1981 (-12) Combination 2 (c2) Table 4.6 Oct 1969-Aug1981 (-12) (e) (e) SSARR simulation results for C1 for the entire year (YEARLY),summer (SMR) and winter (WNTR). The performance indices were calculated for calibration and validation periods combined. Romaine Moisie Ouelle Yearly SMR WNTR Yearly SMR WNTR Yearly SMR WNTR NASH 0.71 0 .2 7 0.37 0.76 0.49 0.36 0.66 0.50 0.44 MODNASH 0.87 0.16 0 .73 0.89 0.40 0.73 0.41 0.20 0.24 R2 0.76 0.51 0.61 0.79 0.53 0.65 0.68 0.53 0.48 LOGNASH 0.84 0 .3 4 0 .38 0.76 0.40 0.31 0.64 0.51 0.24 193 7.4 Intercomparison of lD approaches(lD1and lD2) For Moisie,both approachesperformcomparablyfor all cases.For index D2 from Romaine,lD1 outperformslD2 for C1 and the lattersurpassesthe former for C2. For AMP2, lD2 performswell of lD2 whereas For D1, C1 showsslightlysuperiorperformance over lD1 for bothcombinations. C2 shows comparableresultsby both the approaches.For the remainingindicesboth methods yieldedsimilarvalues of RRMSE and RMABE. Pronounceddifferencesare observedbetween the performance of lD1 and lD2 for indexV from Ouellefor C1. For AMP2, lD2 surpasseslD1 in termsof RRMSE for both combinations. In all othercases,lD1 and lD2 performcomparably, and RMABE. 7.5 Gomparisonof DD and lD approaches is shownin figures4.5-4.10.For all The comparisonof DD and lD downscaling methodologies riversDD1 outperforms all lD approachesin termsof RRMSE,RMABEand R2.For Moisie,in termsof RRMSEand RMABE,lD1 and lD2 performnoticeablybetterthan DD2 for indexV, for both combinations.The correspondingR2 resultsindicatecomparableperformance,particularly in the case of combination C2. In the case of Ouelle,for all indicesexceptAMP2, RRMSEand RMABEvalues indicatethat both lD approachesperformbetterthan DD2. On the other hand, for Romaine,DD2 alwaysperformsbetterthan both lD approachesfor all cases. 194 j w E û.S K, târJ ::*w, ii*el -: lxxn d., i <û ffi TtD1 :*---t : _ i sa? æ : E i I -: :îZ;KX .-'*.â*&: U- ::7:WZ .-.*et ..:..x p\{A wrûx m It: 1 |r-**"liL JI ""',,,ï:t" ? s"s' tt. p&'|p? :::-.J ûâ I LawFfswHls Figure 4.5 Comparisonof downscaling results for Moisie for Cl.The downscaling approachesare: Direct downscaling using RVM (DDl) and ASO (DO2),indirect downscaling involving hydrological model SSARR with observed (PVA) and downscaled values of precipitation and temperature using RVM (lD1)and ASD (lD2),as input. frnr âJ"' 1*ps : fl! ",&*u ffirn'r <n5 E-t 0 -' .:l '--.1 Qwe tj,"-.* T LsvrFlm'rHÊs Figure 4.6 nt t"t E t2 Comparison of downscaling results for Moisie tor C2. The downscaling approaches are: Direct downscaling using RVM (DDl) and ASD (DD2), indirect downscaling involving hydrological model SSARR with observed (PVA) and downscaled values of precipitationand temperatureusing RVM (lD1)and ASD (lD2),as input. 195 HJ tâ z1 tr -Èr -:- LJ -l fnnt lU 4 5 g ft, .E: : 'ir *.sl - ,*Kil r: ,-:*l .'...'-: L; *.,u & * lq+.SPt Apdlp? Figure 4.7 PVA ffitot I ffiroe ri, -,4 U ltrda:Xf -r i:&X lt-'a -a: : rnnl -- J:,ll:*JL= * TV Ls'vFhwHls i/:i*_ aat::aa, D1 w : sI Comparison of downscaling results for Romaine for C1. The downscaling approaches are: Direct downscaling using RVM (DD1) and ASD (DD2), indirect downscaling involving hydrological model SSARR with observed (PVA) and downscaled values of precipitationand temperatureusing RVM (lD1)and ASD (lD2),as input. ft.:r$i $*s; * ;' -*',.#*te -=/,':Wl -n loor ',,1nuz 0,, [.it3 a 8. <ôÂ, è, n a -;::î72&â - -r,=Kil- t&W, #Kl ..J. --:------' t :-__ A- o.s at *tiu',|, ,7::*2 AfuTF2 I *, g1 r i 77â*u ffirnr f ruz .-:' :-,ËI o2 Low FLow Hls Figure 4.8 Comparison of downscaling results for Romaine lor C2. The downscaling approaches are: Direct downscaling using RVM (DDl) and ASD (DD2), indirect downscaling involving hydrological model SSARR with observed (PVA) and downscaled values of precipitation and temperatureusing RVM (lDl) and ASD (lD2),as input. L96 p lsi û gl ', - -:-æil -=s::** -,-.;:::*- *.'t^- :'*&J *=*** l',u.*- a lnmt xti'.. -::: ',i I --J--L--J::I':I;_,rne I " Figure 4.9 AÀ'tP' A'dP' nr*r,**[ t' D? Comparisonof downscaling results for Ouellefor C1. The downscaling approachesare: Direct downscaling using RVM (DDl) and ASD (DD2), indirect downscaling involving hydrological | I I iii' ,,,.--:t"'"ii5'i*1"ÆBî""i'""jl Ë : Ë^ - :€-..*:b.rr r Ël -sr -âr -- rr - ::Er . ll =Êr .r- loor I ;rr *;; I .,1l--r r:ÇI---ÇE--,t'| .:, ..::.".,:"",.,,3:::: " 797 j.rc2::"..-",::nsappr.achesare:Drec, I 7.6 Comparisonof PVAand downscalingapproaches(DDand lD) 7.6.1 PVA and DD approaches DD1 clearlyoutperformsPVA in all cases with markeddifferencesobservedfor the variability index from Romainefor C2. For Romaine,DD2 outperformsPVA for all cases. ln the case of indicesV, AMPl and D1 from Moisie,PVA outperformsDD2 in terms of RRMSEand RMABE whereas the latter surpassesthe former in terms of R2. For Ouelle, in terms of RRMSE and RMABE, PVA surpassesDD2 for all cases correspondingto C2 whereasfor both amplitude indicesfrom C1, DD2 outperformsPVA. 7.6.2 PVA and lD approaches For Ouelle,markeddifferencesare observedin the case of indexV, where PVA surpasseslD1 and lD2 in terms of RRMSE and RMABE for both combinations.For D1 and T, the three approaches are seen to be comparable.R2 values correspondingto T indicate that lD1 surpassedlD2 in C1 and the latterexceededthe formerin C2. For Moisie,in termsof RRMSE and all indices and RMABE,PVA performscomparableto lD1 and lD2 for both combinations with the exceptionof index D2 for C2 where it noticeablysurpassesthe lD approachesand is slightlybetterthan the latterin C1. For Romaine,PVA performsvery poorlyin the case of V for Also, in the case of AMP2, D1 and C1 whereasfor C2, the three approachesare comparable. D2, PVA performsbetterthan lD1 and lD2 for both combinations.Equivalentperformancesof the three approachesare observedfor T and A1 for both combinationsin terms of RRMSEand RMABE. 7.7 Futureprojectionsof low flow Hls Box plots showingthe comparisonof GCM outputsof low flow indicesfor historicalperiodand futuretime periodshave been shown in figures4.11-4.14,only for Ouelleand Moisie.Only futureprojectionsobtainedfrom DD1 are shown,as DD1 was found to be the best downscaling method. 198 7.7.1 Amplitude Indices (AMP1 and AMP2) For index AMPI from Romaine,with referenceto the baselineperiod,not much differenceis observedin the medianvaluesof the future projections.In comparisonto Romaineand Ouelle, the RC in medianis more pronouncedfor Moisie.The highestRC in the medianis given by scenarioA1B from ECHAMSin 20s (14o/odecrease)for Moisie,by scenarioA2 from CRCM in 50s (2% decrease)for Romaine and by scenario 81 from ECHAM5 for Ouelle in 50s (5% decrease).For all rivers,scenarioA2 from ECHAMSand for Ouelle,scenarioA2 from CRCM, projecta decreasingtrend in the lQR. For Baseflowlndex (AMP2)from Romaine,scenarioAI B from ECHAM5projectsa decreasing trend in the medianvalues.On the other hand,for Moisie,scenariosA1B and B1 from ECHAMS projectan increasing trendin the medianvalues.For Ouelle,an increasing trend in the median values is seen for scenarioA2 from ECHAMS.For the lQR, decreasingtrend (49% in 20s and 77o/oin 50s) is observedfor Ouellefor scenarioA2 from CRCM. 7.7.2 Timing and Variability Indices (T and V) For Moisie,all scenariosprojectdecreasein the medianand variabilityfor indexT, for all future time periods.In particular, decreasingtrend in the IQR is observedfor scenariosA1B and B1 from ECHAMS.For Ouelle, decreasingtrend in the same is shown by scenarioA1B for ECHAMS.As in the case of indexT, for indexV from Moisie,all scenariosprojecta decreasein the medianvaluesfor all futuretime periods.For Ouelle,scenariosA1B from ECHAMSand A2 from CRCM project an increasingtrend in the median values. For the lQR, scenario81 for Romaineand A1B fromOuelleprojecta decreasing trend. 7.7.3 DurationIndices(Dl and D2) For indexD1,from Moisieand Ouelle,all scenariosfrom ECHAMSprojectan increasing trendin the median values from 20s to 50s. The differencebetweenthe median values for both time periodsis more pronouncedfor Ouelle.For the IQR for Romaine,only scenarioA2 projectsan increasingtrend from 27% in 20s to 64% in 50s. For the IQR from Moisie,scenariosAI B and 81 from ECHAMSproject a decreasingtrend, whereas for Ouelle, all consideredscenarios projectan increasingtrend from 20s to 50s. For index D2, scenarioA2 from CRCM, projectsa decreasingtrend in the IQR for both Moisieand Romainewhereasfor Ouelle,scenariosA1B and B1 projectdecreasingand increasingtrend,respectively, in the lQR. 199 Copie originale de mauvaise qualité 4 IL 3? 02, ^ $ o.rs Ë z= 3 2 <5 or lr 0.05 g 2501 : 601 o zool * I ,rsol l 6 !- 5 0roo{ j . .0' :i, ;fr40r ô -20 l : :A2 6 ooi e(D L *o =E r s ' ôË oqi = - 0: 2 . _ a. = - 0.5, t_: A22As Ae50s BL TimePerioddScenarioe Time PenodsrScenarios CRCM (RCM) proJections for Ouelle for scenario A2. BL refers to baseline period (1961-2010). The naming convention is scenario name followed by 20s (2021-20501or 50s (2051-2080). Af.20s and A250s refer to A2 scenario corresponding to 2021-2050 and 2051-2080 respectively. Figure 4.11 = - - 'a4 i q$:fil ô. 3t* * zæi: o 200. - -"--""--- U' >i! 'E133i E50 r: ? oool' 5 o 1 50. ; .i --..-.,-::--- 6 H o.er en at 252. 15' f, 0.5' nt 0) H'E OË 0.a Jt.2 BL A1æûrAlB5&Aæ 425& Br& 8150ô i t' at' .l - '-.--, ï .- BL AlB2ûsAtgS& Az?{b A?s0s 812È Bis{h TrnePeriddScenarios TimePenodsrSæærios Figure4.12 100: ECHAMS (GCM) projections for Ouelle given by scenarios A1B, A2 and 81. BL refers to basefine period (1961-2010).The naming convention is scenario name followed by 20s (20212050) or 50s (2051-2080).AiB20s and A1B50s referto AlB scenario corresponding to 20212050 and 2051-2080respectively. 200 Copie originale de mauvaise qualité -5 -*- 150i-- *0 . @S'o.zs; Ê-i < g roo; :--l zÊ 0.2! < 5-- so 1 0.15- agi >à 6 g4 2.h 'l o, or-9 | o Ëo.a 3oo .-:al: /q220s 4250s ïme Period$Scenados 8L --,-.-:-,. --=' A250s A220s TimePerioddscenarios CRCM (RCM) projections for Moisie for scenario A2. BL refers to baseline period (1961-2010). The naming convention is scenario name followed by 20s (2021-20501or 50s (2051-2080). 4220s and A250s refer to A2 scenario corresponding to 2021-2050 and 2051-2080 respectively. Figure 4.13 ^ 1soi L'or Ë âozs EoE 100 E5 ozi æi 0.15 1? 10 Ë rao- . oc 1 Z 0 F 'EZ -9I = 3 100 E0-. o.3r--'!d, _l I l 0 fl E o.sr s= - f 0.8, 0.1i Bt AlBAkAlE50s ApzcisPAa&sSràe, Bisos Time Perio@Scenarioe Figure 4.14 ;l 't, i l- :O - 1 5 t ,l 2 9o.es: oË o,r' l 4220s A26OsBl2t}s ts16{,8 BL A1BAbA1BS{h Tlrne PeriodsJSænarios ECHAMS (GCM) projections for Moisie given by scenarios A1B, AA and 81. BL refers to baseline period (1961-2010).The naming convention is scenario name followed by 20s (20212050) or 50s (2051-2080).AiB20s and A1B50s refer to AlB scenario corespondlng to 20212050 and 2051-2080respectively. 201 I DISCUSSION 8.1 Comparisonbetweenstatisticalmodels(SBLand MLR) As mentionedbefore,the implementations of SBL and MLR used in the currentwork are RVM and the ASD tool. Results of DD indicatesthat RVM outperformsASD in all respects. lts generalisation abilityand sparsitysupportingnatureadds value to the algorithm.For the lD approach,these two algorithmswere used to downscale daily precipitationand mean air temperature.With respect to these meteorologicalvariables,ASD was regardedsuperiorto RVM due to its simplicity,lessercomputationdemandsand comparableresultsobtainedfor the two in terms of performanceindices.Possibilitiesof improvementsin the results encompass with other predictorselectionmethodssuch as geneticalgorithms(Coulibaly, experimenting expensive 2Q04),classification and regressiontrees (Tisseuilet al., 2010).The computationally natureof the RVM algorithmcan be dealtwith by using low level languages(e.9. ç, ç++) to programthe algorithmand largememorymachines. 8.2 Comparisonbetweenthe two downscalingstrategies This study comparesa directstatisticaldownscalingapproachfrom GCM/RCMto low flow Hls, hydrological model whichis less commonlyappliedthan the approachinvolvingan intermediate betweenGCM/RCMand low flow Hls. Althoughthe former is a singlestep approachit does not accountfor the physicalfactors(such as land use and soil cover)other than climatefactorsthat influencethe variabilityin these indices.Thesefactorsare taken care of by a hydrologicalmodel to varying extents (dependingon the nature of selected hydrologicalmodel: lumped, semidistributed,and distributed).A hydrologicalmodel integratesthese physicalfactorsthat interact evaporationetc.). with climateand influencethe movementof water (e.9.infiltration, The comparisonof resultsof DD and lD methodologiespresentedin the previoussectionand shown in figures 4.5-4.10clearly indicatesthat of all the approaches,DD1 (DD using RVM) performed better than the rest. Although the exclusion of hydrologicalmodel in the DD methodologyis advantageousin many respects,it does not hold true for the MLR approach, DD2. Simulatedvaluesof indexV and D1 for Moisieserveas an exampleto that. For indexV from Ouelle, lD1 and outperformsDD2 in both sets. This observationwas attributedto the predictionof some negativevaluesof the indexby the latter(Joshiet al., 2013). The most severelow flows generallyoccur in summerfor OuelleRiver,while they occur mostly in the winterfor Moisieand Romaine.Highersummertemperatures in the Ouelleleadingto high evapotranspiration, which may be combinedwith less sustainedsummer groundwaterinflux, than in the Moisieand Romaine,are potentialcausesof this seasonaldifference.Modelingof low flows using deterministichydrologicalmodels is greatlydeterminedby the extentto which low flow processessuch as evapotranspiration, freeze-up,drawdownof storagein lakes,stream channelsand wetlandsare incorporated(Davisonand Kamp, 2008).These processesoperate over a wide range of spatial and temporal scales. Therefore,representingthe associated processeswith constant(e.9. melt rate during a rain period)or monthlyvarying (e.9. rainfall intensityversus percenteffectivenessevapotranspiration index (PETI),monthlyPETI, monthly percent effective melt rate) values may limit the ability of SSARR to represent low flow governingprocesses.Beyondthe representation of physicalprocesses,properinitialisation and accuracy of meteorologicalinputs govern hydrologicalmodeling results. This challenge is inherentin all modelingexperimentsand must receivespecialattentionin low flow studies.As mentionedin the previoussection,both RVM and ASD failedto capturethe variabilitypresentin precipitation.Additionally,the results of optimisationsubroutinerely on the initial setting of parameters,the number of iterationsmade within the parameterspace and the performance measures(NASH, LOGNASH,R2 and MODNASH)used to optimizethe results.The errors arisingfrom downscalinglocalclimatevariablesare gettingpropagatedin the SSARRsimulated flowsand hencein low flow Hls. RVM and ASD use NCEP reanalysispredictorsinterpolatedat selectedmeteorological stations as predictorsto downscale precipitationand temperaturefor the lD methodology.These downscaledand observedvaluesof precipitation and temperatureare furtherinput into SSARR to simulateflows.SSARRis a lumpedmodelwhich uses spatiallyaveragedvaluesof measured precipitationand mean air temperatureas a representation of the meteorological conditionsof the entire watershed. lt may happen that the average of the downscaled meteorological variablesbetter representsthe true average,when comparedwith an average obtainedfrom sparse(maximumof two stations)observedvaluesover the watershed.As an exampleto that is indexAMP2 from Moisiewhere both lD approachesoutperformPVA for both combinations. In many cases, differentresults were obtained about the performancesof two approaches basedon RRMSE,RMABEand R2values.In such cases,eventhoughthe simulatedpointsare under predictedor over predictedbut are close to the 1:1 line, R2 can give misleadingresults. The variabilityindex V from Ouelle serves as an example to that. lt was observedthat DD 203 resultsin highervaluesof RRMSE and RMABE (tt in both the cases)but gives reasonable valuesof R2(0.77). 8.3 Futureprojectionsgivenby GCMand RCM Ouelle exhibitshighestdaily flow variabilityand more severe low flows in summerwhereas Moisieand Romaineboth exhibitseverelow flows in wintersand similarlow flow characteristics (figure4.4). Therefore,the future projectionsof the indicescorrespondingto Ouelleand Moisie only are shown.The resultsindicatethat DD1 outperformedthe other methodsin downscaling low flow indices.Therefore,the ability of downscalingframeworkfor future climate change usingthe DD1 approach. impactstudieshas beenillustrated No increasingor decreasingtrends have been observedfor any indexfrom all rivers.However, changesin the variabilityand medianvaluesof the indicesfor futuretime periodsrelativeto the baseline periods have been observed. For example,AMP2 projectedby CRCM for Ouelle (figure4.11) showsa considerable from 20s to 50s and the numberof decreasein the variability to 50s has increased. outlierscorresponding Althoughthese projectionsmay be informative,definitiveconclusionsabout the future natureof the consideredlow flow indices cannot be drawn as only one GCM and RCM have been compared. 204 9 CONCLUSION To the knowledgeof the authors,this work is the first of its kind to compare two statistical downscalingapproachesin projectingthe variabilityof low flow Hls using GCM/RCMoutputs. The superiorityof RVM as a downscalingmodelwas clearlyestablishedin downscalinglow flow indicesbut the model performedcomparablyto ASD in capturingthe uncertaintiespresentin precipitation.Both modelsperformedwell in downscalingtemperature.Of all the methods,DD involvingRVM (DD1)clearlyexceededthe other approaches.lt not only performedwell in terms of goodnessof fit but also displayedsuperiorgeneralizationability.The choice of statistical model used is a governingfactorin the DD approach.The variabilityindexV from Moisieserves as an exampleto that where both lD approachesoutperformedDD2 for both combinations. The lD resultsindicatedthat this methodologywas governedby selectedstatisticaldownscaling modelsand the hydrological model used to simulateflows. Simplehydrologicalmodelslack proper representationof related physicalprocessesand complex models are demandingin terms of data input.Also,the downscalingof meteorological variablesis a crucialsourceof error particularlywith referenceto downscalingprecipitation as both statisticalmodelswere unableto capture its variability.Since the simulationperformanceof a hydrologicalmodel is greatly determinedby its input,downscalingerrorsget combinedwith hydrologicalmodelingerrorsand affectthe simulatedflowsand thereforelow flow Hls. 205 BIBLIOGRAPHIE Adamowski K. & Bocci C (2001) Geostatisticalregional trend detection in river flow data. HydrologicalProcesses15: 3331-3341. Afifi AA & Clark V (1996) Computer-aided Multivariate Analysis,third ed.Chapman& Hall, London. Akaike H (1974) A new look at the statisticalmodel identification, IEEE Transactionson AutomaticControl.19 (6): 7 16-T 23, doi:10.1109/TAC.1974.1100705. Aksornsingchai P & ChutimetS (2011) Statisticaldownscalingfor rainfalland temperature predictionin Thailand.Proceedingsfor the International MultiConference of Engineersand (IMECS),Vol l, March16-18th,HongKong. ComputerScientists AmusjaM, Gutnichenko VG & ShelutkoVA (1988a).On the estimationof meanannualvalue of minimum winter flow of ungaugedrivers.Trudy GGI (Trans. State Hydrol. Inst., Leningrad,USSR)335,43-53. AmusjaM, RatnerNS & SokolovBL (1991) Minimumriver flow: state of art and prospectsfor research.Trudy GGI (Trans.State Hydrol.Inst.LeningradUSSR)p 3-28 AndersonMG & Burt TP (1980) Interpretation of recessionflow. Journalof Hydrologya6(-2): 89-101. ArihoodLD & GlatfelterDR (1991)Methodfor estimatingloMlow characteristics of ungauged streamsin Indiana.USGSWaterSuppl.Pap.No. 2372,22 p. ArmstrongJD, BraithwaiteVA and Fox M (1998)The Responseof Wild AtlanticSalmonParr to Acute Reductionsin Water Flow.Journalof AnimalEcology67(2):292-297 Arnell NW (1989) Changingfrequencyof extremehydrologicalevents in northernand western Europe.In FRIENDSin Hydrology. The lnternationalAssociation of Hydrological Sciences (IAHS).p 237-249. Arnell NW (1992) Factorscontrollingthe effectsof climatechange on river flow regimesin a humidtemperateenvironment.Journalof Hydrology132(-a):321-342. ArthingtonAH, King JM, O'KeeffeJH, Bunn SE, Day JA, PuseyBJ, BluhdornBR, TharmeR (1992) Development of an holistic Approach for assessing environmental flow requirementsof riverineecosystems.In: PigramJJ & HooperBP (Eds.)Water Allocation for the Environment.The Centre for Policy Research Universityof New England, Armindale.p 69-76. Arthington,AH, Bunn, SE, Poff, NL, Naiman RJ (2006) The challenge of providing environmentalflow rules to sustan river ecosystems.EcologicalApplications16, 13111318. ASCE Task Committee(2000b)Artificialneuralnetworksin hydrologyl: Hydrologicapplications, Journal of HydrologicEngineering,Yol. 5, no.2, pp.124-137. 207 in the characteristics BachnerS, KapalaA & SimmerC (2008)Evaluationof dailyprecipitation CLM and their sensitivity to parameterizations.Meteorol. Z. 17@): 407-419, Doi:10.112710941 12948/2008/0300. in climatechangefrom Bae DH, Jung lW & LettenmaierDP (2011) Hydrologicuncertainties IPCCAR4 GCM simulations of the ChungjuBasin,Korea,J. of Hydrol.,401:90-105. BastolaS, MurphyC & SweeneyJ (2011) The role of hydrologicalmodellinguncertaintiesin climatechange impact assessmentsof lrish river catchments,Adv. Water Res. 34: 562576. BardossyA, Bogardi| & Matyasovszky| (2005) Fuzzy rule-baseddownscalingof precipitation. Theoreticaland Applied Climatology 82(1-2): 119-129. Bardossy A, Stehl'rk J & Caspary HJ (2002) Automated objective classificationof daily circulationpatternsfor precipitationand temperaturedownscalingbased on optimized fuzzy rules.C/imateResearch23(1):11-22. Bardossy A & Singh SK (2008) Robustestimationof hydrologicalmodel parameters.Hydrol EarThSysf Sci 12. 1273-1283. Bellone E, Hughes JP & Guttorp P (2000) A hidden Markov model for downscalingsynoptic atmosphericpatternsto precipitation amounts.ClimateResearch15: 1-12. Benestad RE (2001) The cause of warming over Nonruayin the ECHAM4/OPYC3GHG integration.lnt. J. Climatol.21:371-387. of Britishrivers.Journal Beran MA & GustardA (1977)A study into the low-flowcharacteristics -2):1 -1 of Hydrology.35(1 47 57. Berger, JO (1985). StatisticalDecisionTheory and BayesianAnalysis (Second edition). Springer-Verlag: New York. 386. Bonsal B & Shabbar A (2008) lmpacts of large-scalecirculationvariability.Canadian Water ResourcesJournal. 33(2):37-154. of Methodsfor Finding BrethertonCS, Catherine,S and WallaceJM (1992)An Intercomparison CoupledPatternsin ClimateData.Journalof Climafe5, 541-560. extremes-an BurgerG, MurdockTQ, WernerAT, SobieSR, CannonAJ (2012)Downscaling intercomparisonof multiplestatisticalmethods for present climate. Journal of Climate. 25(12).4366-4388. doi:10. 1175 ljcli-d-11-00408.1 Burn DH. and Elnur MAH (2002) Detectionof hydrologictrends and variability.Journal of Hydrology 225, 1OT-122. Burn DH (2008) Climaticinfluenceson streamflowtiming in the headwatersof the Mackenzie River Basin. Journal of Hydrology352(1-2):225-238. Burn DH, ButtleJM, CaissieD, MacCullochG, Spence C and Stahl K (2008)The Processes, Patternsand lmpacts of Low Flows Across Canada. Canadian Water ResourcesJournal 33(2),107-124. 208 Burnash RJC, Ferral RL & McGuire RA (1973) A generalized streamflow simulation sysfem conceptual modeling for digital computer. U.S. Department of Commerce, National WeatherServiceand Stateof CaliforniaDepartmentof Water ResourcesSacramentoCA. Busuioc A, Von Storch H & and Schnur R (1999) Verificationof GCM generated regional precipitation and of statistical downscaling estimates.J. Clim.12 (1):258-272. BusuoicA, TomozeiuR and CacciamaniC (2007) Statisticaldownscalingmodel based on canonical correlationanalysis for winter extreme precipitationevents in the EmilaRomagnaregion,lnt. J. Climatol.,doi: 10.10021joc.1547. Cannon AJ and Whitfield PH (2002) Downscalingrecent streamflowconditions in British Columbia,Canada using ensembleneural network models. Journal of Hydrology,259: 13 6 - 15 1 . CavazosT & HewitsonBC (2005)Performanceof NCEP variablesin statisticaldownscalingof daily precipitation. ClimateResearch,28: 95-107. CharlesSP, BatesBC, WhettonPH & HughesJP (1999)Validationof downscaling modelsfor changedclimateconditions:Case studyof southwesternAustralia.Clim Res, 12(1):1-14 Chen CT & Knutson T (2008) On the verificationand comparison of extreme rainfall indices from climatemodels.J. Climate21(7):1605-1 621. Chen H, XiongW & Guo J (2008)Application VectorMachineto downscaleGCMs of Relevance to runoff in hydrology.Fifth InternationalConferenceon Fuzzy Systemsand Knowledge Discovery. Chen ST, Yu PS & Tang YH (2010)Statisticaldownscalingof daily precipitationusing support vector machines and multivariate analysis. Journal of Hydrology 385(14):13-22. doi:10.10 16/j.jhydrol.201 0.Q1.021. Chen J, BrissetteFP and LeconteR (2011a)Uncertaintyof downscalingmethodin quantifying the impactof climatechangeon hydrology.Journalof Hydrology401: 190-202. Christensen JH & Christensen OB (2007)A summaryof the PRUDENCEmodelprojections of changesin Europeanclimateby the end of this century. Clim Change81 (1): 7-30. ClausenB and Biggs B (1997) Relationships betweenbenthicbiota and hydrological indices New Zealandstreams.FreshwaterBiology38.327-342. ConwayD, WilbyRL & JonesPD (1996)Precipitation and air flow indicesover the Britishlsles. ClimateResearch7(2): 169-183. Cortes C & Vapnik V (1995) Supportvectornetworks.MachineLearning20. 273-297. Comitésur la situationdes espècesen périlau Canada(COSEPAC)(2011)COSEPACstatus reporton Atlanticsalmon Salmo salar (anadromousform) in Canada Ottawa:Committee on the Statusof Endangered Wildlifein Canada. Coulibaly P (2004) Downscalingdaily extreme temperatureswith genetic programming, GeophysicalResearchLetters31, L16203,doi: 10.102912004GL020075. 209 using CoulibalyP, BoubeeB &Anctil F (2001)lmproving extremehydrologiceventsforecasting a new criterion for artificial neural networks selection. Hydrological processes 15 : 15 3 3 : 15 3 6 . Coulibaly P & Dibike YB (2004) Downscaling of Global Climate Model Outputs for Flood Frequency Analysisin the Saguenay River Sysfem. Project report to the Science SubComponentof ClimateChangeActionFundEnvironment Canada. changesfor the susquehanna Crane RG & HewitsonBC (1998) DoubledCO2 precipitation Journalof basin:down-scalingfrom the GENESISgeneralcirculationmodel. International 1 0 1 0 0 2 / ( 5 l C l ) 1 0 9 7 0 0 8 8 ( 1 9 9 8 0 1 ) 1 8 : 1 < 6 5 : :ADClimatologylS(1):65-76.Doi: JOC222>30CO:2-9. CristianiniN & Shawe-TaylorJ (2000) An Introductionto SupportVector Machinesand other LearningMethods.CambridgeUniversity Press,Cambridge. Kernel-based river Cundy TW & Brooks KN (1981) Calibrating and verfiyingthe SSARR model-Missouri watershedsstudy. WaterResourcesBulletin17(5):775-782. Daigle A, St-HilaireA, Beveridge D, Cassie D and Benyahya L. (2011) Multivariate analysis of the low flow regimes in eastern Canadian rivers. HydrologicalSciences Journal56(1):51-67. A briefReview Canadian DavisonB & KampGVD (2008) Low flowsin Deterministic Modelling: WaterResourcesJournal33(2):181-194. DibikieYB & CoulibalyP (2006)Temporalneuralnetworksfor downscalingclimatevariability and extremes.NeuralNetworks19(2):135-144. analysisof DibikeYB, GachonP, St-Hilaire A, OuardaTBMJ & NguyenVTV (2008)Uncertainty statisticallydownscaled temperature and precipitationregimes in northern Canada. Theoreticaland Applied climatology91(1-4): 147-170. DoblerC, HagemannS, Wilby RL & StotterJ (2012)Quantifyingdifferentsourcesof uncertainty in hydrologicalprojectionsat the catchmentscale.Hydrol.Eafth Sysf.Sci 9'.8173-8211. DrogueG, PfisterL, LeviandierT, ldrissiAE, lffly JF, Matgen P, HumbertJ & HoffmannL (2004)Simulatingthe spatio-temporal variabilityof streamflowresponseto climatechange scenariosin a mesoscalebasin. Journal of Hydrology293,255-269. EckhardtK, FohrerN & Frede HG (2005)Automaticmodel calibration.HydrologicalProcesses 1 9 ( 3 )6 : 51-658. EheartJW & Tornil DW (1999)Low-flowfrequencyexacerbationby irrigationwithdrawalsin the agriculturalmidwestunder various climaticscenarios.Water Resour Res 35 (7): 22372246. Ehsanzadeh,E & Adamowski K (2007) Detection of trends in low flows across Canada. Cana dian Water ResourcesJo urnal 32 (4), 251-264. Evans J & Schreider S (2002) Hydrologicimpacts of climate change on inflows to Perth Australia.Clim Change55(3):361-393. 21.O Extence CA, Balbi DM. and Chadd RP (1999) River flow indexingusing British benthic macroinvertebrates: a frameworkfor setting hydroecologicalobjectives.RegulatedRivers: Researchand Management15: 543-574. Faul AC. & Tipping ME (2002) Analysis of sparse Bayesian learning,Advances in Neural lnformationProcessingSysfems 14: 383-389. Flato GM, Boer GJ, Lee WG, McFarlaneNA., RamsdenD, ReaderMC & WeaverAJ (2000) The CanadianCentrefor ClimateModellingand AnalysisGlobalCoupledModeland lts Climate.ClimateDynamics 16. 451-467. Fowler HJ, BlenkinsopS & TebaldiC (2OO7a)Linkingclimatechange modellingto impact studies: recent advances in downscalingtechniquesfor hydrologicalmodelling.lnt. J. Climatol.27(12): 1547- 1578. Fowler HJ, Ekstrom M, Kilsby CG & Jones PD (2005a) New estimatesof future changes in extremerainfallacrossthe UK using regionalclimatemodel integrations1 Assessmentof controlclimate.Journalof Hydrology300(1-4):212 - 233. Fowler HJ & Kilsby CG (2007) Using regionalclimate model data to simulatehistoricaland futureriverflows in northwestEngland.ClimaticChange80 (3 - 4): 337 - 367. FowlerHJ, KilsbyCG & O'ConnellPE (2000)A stochasticrainfallmodelfor the assessmentof regionalwater resourcesystemsunder changedclimaticconditions.Hydrologyand Earth SysfemSciences Q): 263-281. Doi: 105194/hess-4-263-2000. FowlerHJ, KilsbyCG, O'ConnellPE & BurtonA (2005b)A weathertypeconditionedmulti-site stochasticrainfallmodel for generationof scenariosof climaticvariabilityand change. Journal of Hydrology308(1-4): 50-66. Fowler HJ, Kilsby CG and StunellJ (2007) Modellingthe impactsof projectedfuture climate changeon water resourcesin north-westEngland.Hydrol.Earth Sysf. Sc. 11(3):11151126. Frei C, ChistensenJH, DéquéM, Jacob D, Jones RG & VidalePL (2003)Dailyprecipitation statisticsin regionalclimate models: Evaluationand intercomparison for the European Alps.J GeophysRes 108 (D3):4124.Doi:101029120Q2JD002287. FREND:Flow Regimesfrom Experimental And NetworkData (1989)l: Hydrological Studies;ll: HydrologicalDataWallingfordUK. FrenetteM, CaronM, JulienP & Gibson,RJ (1984)Interaction entrele debitet les populations se tacons (Salmonsalar)de la riviereMatamec,Quebec.Canadian.Journalof Fisheries and AquaticSciences41: 954-963. FrenchMN, KrajewskiWF & CuykendallRR (1992)Rainfallforecasting in spaceand time using a neuralnetwork.J. of Hydrol.137(1-4).1-31. GachonP & DibikeYB (2007)Temperature changesignalsin northernCanada:convergence of statisticaldownscalingresults using two driving GCMs. lnt. J. Climatol. 27(12).16231641. 21.1. Gachon P, St-HilaireA, OuardaT, NguyenVTV, Lin C, MiltonJ, ChaumontD, GoldsteinJ, HessamiM, NguyenT D, SelvaF, NadeauM, Roy P, ParishkuraD, MajorN, ChouxM & Bourque A (2005) A First Evaluationof the Strength and Weaknesses of Statistical DownscalingMethodsfor SimulatingExtremesOver VariousRegionsof EasternCanada Sub-component ClimateChange Action Fund (CCAF):EnvironmentCanada Montreal Quebec209 pp. Gachon,P & DibikeYB (2007)Temperature changesignalsin northernCanada:convergence of statisticaldownscalingresultsusingtwo ddvingGCMs. lnt. J. Climatol.,27,1623-1641, doi: 10.1002ljoc1582. dilemma. E & DoursatR (1992)Neuralnetworksand the Biasfuariance GemanS, Bienenstock Neural Computation4:1-58. ISBN:92-9169GIEC (2000)Specialreporton emissionscenarios.Summaryfor policymakers. 11 3 - 5 . GIEC (2007) Summaryfor PolicymakersClimate Change 2007: The PhysicalScience Basis Contribution of Working Group I to the Fourth Assessment Report of the Intergovernmental Panel on ClimateChange S SolomonD Qin M ManningZ Chen M PressCambridge,p MarquisKB AverytM Tignorand HL MillerEds CambridgeUniversity 1-18. GIEC (2OO7a)Contributionof Working Group I to the Fourth Assessment Report of the IntergovernmentalPanel on Climate Change (2007a). Cambridge University Press CambridgeUnitedKingdomand New York,NY, USA. workinggroupll contribution GIEC (2007b)Climatechange.lmpacts adaptation and vulnerability to the IntergovernmentalPanel on Climate Change. Fourth Assessment Report Intergovernmental Panelon ClimateChange,Geneva,Switzerland. to streamflowusing GhoshS & MajumdarP (2008)Statistical downscaling of GCM simulations RelevanceVector Machine.Advancesin WaterResources31(1):132-146. Giorgi F & Mearns LO (1991) Approachesto the simulationof regionalclimatechange:A review.Rev Geophys29(2\191-21 6. Glecik PH (1986) Methodsof evaluatingthe regionalhydrologicimpactsof global climate changes. Journalof Hydrology88(1-2):97-1 16. GoodessCM & PalutikofJ (1998) Developmentof daily rainfallscenariosfor southeastSpain using a circulation-typeapproach to downscaling.lnternationalJournal of Climatology 18 ( 10 ) : 10 5 1- 1 0 8 3 . Gosling SN, Taylor RG, Arnell NW & Todd MC (2011) A comparativeanalysisof projected hydrologicalmodels. impactsof climatechangeon riverrunoffglobaland catchment-scale Hydrol.Earth Sysf.Sci 15:279-294.Doi: 10.5194/hess-15-279-2Q11. GovindarajuRS & Rao AR (2000) Artificialneural networks in hydrology.Kluwer Academic PublishersDordrecht,329 pp. 2L2 Graham LP, AndreassonJ & Carlsson B (2007b) Assessing climate change impacts on hydrologyfrom an ensemble of regionalclimate models model scales and linking methods:a case studyon the Lule Riverbasin.ClimaticChange81(Suppl1):293-307. GrahamLP, HagemannS, Jaun S & BenistonM (2007a)On interpreting hydrological change from regionalclimatemodels.ClimaticChange81(Suppl1):97-122 Green IRA & StephensonD (1986)Criteriafor comparisonof singleevent models.Hydrological SciencesJournal31(3),395-411 GrotchSL & MacCrackenMC (1991)The use of generalcirculationmodelsto predictregional climaticchange.Journalof Climate4(3): 286 - 303. GustardA, BullockA & DixonJM (1992)Low flow estimationin the UnitedKingdomInstituteof HydrologyReportNo 108,p 88. HangemannS, MachenhauerB, Jones R, ChristensenOB, Déqué M, Jacob D & Vidale PL (2004) Evaluationof water and energy budgetsin regionalclimatemodels appliedover Europe.Clim.Dyn.23(5):547-567. HashmiMZ, ShamseldinAY & MelvilleBW (2009)Statisticaldownscalingof precipitation: stateof{he-art and applicationof bayesianmulti-modelapproachfor uncertaintyassessment. Hydrol.Earth Sysf. Sci., 6: 6535-6579. Hashmi MZ, ShamseldinAY & MelvilleBW (2011) Statisticaldownscalingof watershed precipitationusing Gene ExpressionProgramming(GEP). EnvironmentalModelling& Software26(12). 1539-1646. HassanzadehE, Nazemi A & ElshorbagyA (2013). Quantile-BasedDownscalingof Precipitationusing Genetic Programming:Applicationto IDF Curves in the City of Saskatoon. J. Hydrol.Eng.,10.1061/(ASCE)HE.1943-5584.0000854. Hayhoe HN (2000) lmprovementsof stochasticweather data generatorsfor diverseclimates Climate Research1aQ). 7 5-87 . HaykinS (2003)NeuralNetworks:A ComprehensiveFoundationFourthIndianReprintPearson Education:Singapore Hertig E & JacobeitJ (2008)Assessmentsof Mediterraneanprecipitationchangesfor the 21st century using statisticaldownscalingtechniques, lnt. J. Clim. 28. 1025-1045. Doi: 10.100211oc.1597 Hessami M, St-HilaireA, Gachon P & Ouarda TBMJ (2008) Automated regression-based statisticaldownscalingtool. EnvironmentalModelling& Software23(6):813-834 HewitsonBC & Crane RG (1994) Neural nets: applicationsin geography.Dordrecht:Kluwer Academic,Vol 29,p 196,ISBN978-94-011-1122-5. HewitsonBC & Crane RG (1996)Climatedownscaling: techniquesand application.Climate Research7(1):85-95.Doi: 103354/cr007085. 21.3 Hewitt CD & Griggs DJ (2004) Ensembles-basedpredictionsof climate changes and their impacts. Eos TransAG U 85(52):566-566.Doi:10 1029 12004EO520005. HinchliffeMP, WillisMJ, HidenH, Tham MT, MckayB & BartonGW (1996)Modellingchemical process systems using a multi-gene genetic programming algorithm. In Genetic Programming:Proceedingsof the firstAnnualconference.The MIT press,USA. problems. Hoerl AE & Kennard RW (1970) Ridge regression:applicationto nonorthogonal Technometrics12 (1): 69-82. Hsieh W (2009) Machine learningmethods in environmentalsciences:Neural networksand kernels.CambridgeUniversityPress. Hsu K, Gao X, SorooshainS & Gupta HV (1997) Precipitation estimationfrom remotelysensed informationusingartificialneuralnetworks.J. Appl. Meteorology36(9):1176-1190. Hughes JMR (1989) A hydrologicalregionalization of streams in Victoria,Australia,with implicationfor stream ecology.AustralianJournalof Marine and Freshwater Research40, 303-326. Appl. Huth, R (2000)A circulationclassification schemeapplicablein GCM studies.Theoretical. Climatology,6T:1-18. Huth R (2004) Sensitivityof local daily temperaturechange estimatesto the selection of downscalingmodelsand predichors. Journalof ClimateChange17(3):640-652. does it bringan Huth,R., KliegrovaS, Metelka,L. (2008)Non-linearity in statistical downscaling: improvementfor daily temperaturein Europe.lnternationalJournalof Climatology28 (4), 465477. Jasper K, CalancaP, GyalistrasD & FuhrerJ (2004) Differentialimpactsof climatechangeon the hydrologyof two alpinerivers.Clim. Res. 26(2):113-125. Jeong, Dl, Daigle A & St-HilaireA (2012) Developmentof a StochasticWater Temperature Model and Projectionof Future Water Temperatureand Extreme Events in the Ouelle riverbasinin Québec,Canada. RiverResearchand ApplicationsDOI: 10.1Q021rra.2574. Jiao Y & Caya D (2006)An investigationof the summerprecipitation simulatedby the Canadian RegionalClimateModel.Mon. Wea. Rev.134(3):919-932. Jones PD, Hulme M & Briffa KR (1993) A comparisonof Lamb circulationtypes with an objectiveclassificationscheme. lnternationalJournal of Climatology13(6).655-663. WeatherGenerator JonesPD & SalmonM (1995)Development of a Stochastic and Integration into a Crop GrowthModelfor EuropeanAgricultureMARS Project.FinalReportto Institute of RemoteSensingApplications,AgriculturalInformationSystems(ISPRA),UK; Contract No 5631-93-12ED ISP GB Joshi D, St-HilaireA, DaigleA and OuardaTBMJ (2013) Databasedcomparisonof Sparse BayesianLearningand MultipleLinear Regressionfor statisticaldownscalingof low flow indices,Journalof HydrologyDOI:10.1016/j.bbr.2O1 1.03.031. KalnayE, KanamitsuM, KistlerR, CollinsW, DeavenD & GandinL (1996)The NCEP/NCAR 4O-yearreanalysisproject.Bull.Am. Meteorolog.Soc. 77(3):437-471. 274 Karl TR, Wang WC, SchlesingerME, Knight RW & PortmanD (1990)A methodof relating general circulationmodel simulatedclimate to observed local climate Part l: Seasonal statistics.J Clim.3(10):1053-1079. KarunanithiN, Grenney WJ, Whitley D & Bovee K (1994) Neural networks for river flow prediction.J. Comp.in Civ. Engg.8(2) .201-220. Katz RW (1996) Use of conditionalstochasticmodels to generateclimate change scenarios. Climatic Change 32. 237-255. K i m J W , C h a n g J T , B a k e r N L , W i l k s D S & G a t e s W L ( 1 9 8 4 ) T h e s t a t i s t i c aplr o b l e m o f climateinversion:Determination of the relationshipbetweenlocaland large-scaleclimate. Monthly WeatherReview 112: 2069-2077. Kite GW (1978)Developmentof a hydrologicmodelfor a CanadianWatershed.Can J Civ Eng 5:126-134. Kite GW (1993)Applicationof a land class hydrologicalmodel to climaticchange. Wat Resour Res. 29(7):2377-2384. Koza JR, Bennett HB, Andre D & Keane MA (1999) Genetic Programminglll: Darwinian Inventionand ProblemSolving.MorganKaufmannPublishers. KrauseP, BoyleDP & Base E (2005)Comparisonof differentefficiencycriteriafor hydrological modelassessment.Advancesin Geosciences5: 89-97.Doi: 10.5194/adgeo-5-89-2005. KrishnamurtiTN & Kumar V (2012) lmprovedSeasonalPrecipitationForecastsfor the Asian MonsoonUsing 16 Atmosphere-OceanCoupledModels.Part ll: Anomaly.J. Climate25: 65-88. LandmanWA, Mason SJ, Tyson PD & TennantWJ (2001) Statisticaldownscalingof GCM - 236 simulations to streamflow. J. of Hydrol.252(1):221 Legates DR & McCabe Jr. GB (1999) Evaluatingthe use of "goodness-of-fit" measures in hydrologicand hydroclimatic modelvalidation,WaterResour.Res.,35 (1).233-241 Leith RMM & Whitfield PH (1998) Evidenceof climate change effects on the hydrologyof streamsin south-central BC. CanadianWaterResour.J.23(3):219-230. LettenmaierDP & Gan TY (1990)Hydrologicsensitivities of the Sacramento-San JoaquinRiver Basinto globalwarming. WaterResour.Res 26(1):69-86. Leung LR, Qian Y & Bian X (2003a) Hydroclimateof the western United States based on observations and regionalclimatesimulationof 1981-2000Part l: seasonalstatistics.J Climate 16(2): 1912-1928. LeungLR, Qian Y, BianX, WashingtonWM, Han J & RoadsJO (2004)Mid-century ensemble regionalclimatechangescenariosfor the Western UnitedStates.ClimaticChange 62(13 ) :7 5 - 1 1 3 . Liu RY, PareliusJM & SinghK (1999)Multivariate analysisby data depth:Descriptive statistics graphicsand inference(withdiscussionand a rejoinderby Liu and Singh).Ann Stat27(3). 783-858. 2L5 LoaicigaHA, Valdes JB, Vogel R, GarveyJ & SchwarzH (1996) Global warmingand the hydrologic cycle. J. Hydrol. 174 (1-2):83-127. Loukas A, VasiliadesL & DaleziosNR (2002) PotentialClimate Change lmpacts on Flood ProducingMechanismsin Southern British Columbia,Canada Using the CGCMAI SimulationResults.Journalof Hydrology259:, 163-188. networks.In E. Dormany,J.L. van MackayDJC (1994)Bayesianmethodsfor backpropagation Hemmenand K. Schulten,editors,Modelof NeuralNetworkslll, chapter6, pages 211254.Springer, 1994. Maier HR & Dandy GC (2000) Neural networksfor the predictionand forecastingof water resources variables: a review of modelling issues and applications.Environmental Modellingand Software15 (1): 101-124. MajercakovaO, FendekovaM & LeskovaD (1997)The variabilityof hydrologicalseriesdue to extreme climate conditionsand the possiblechange of the hydrologicalcharacteristics with respectto potentialclimatechange.FRIEND'97- RegionalHydrology:conceptsand models for sustainableWater Resource Management.The InternationalAssociationof HydrologicalSciences(IAHS),PublicationNo 246, p 59-66. of low flows of Slovak MajercakovaO, LeskovaD & Sedik P (1995) Selectedcharacteristics rivers.J Hydrol.Hydromech.43(4-5) 331-353. Manuelde I'utilisateur de Streamflowsynthesisand reservoirregulationmodel(SSARR)(1991) US Army Corpsof Engineers.NorthPacificDivision. Markus M, Salas JD & Shin H-K (1995) Predictingstreamflowsbased on neural networks. Proceeding of 1" Int Confon WaterResour.Engg.,San AntonioTexas,August14-18. MaurerEP, HidalgoHG, Das T, DettingerMD & CayanDR (2010)The utilityof dailylarge-scale climate data in the assessmentof climate change impacts on daily streamflowin California.Hydrologyand Earth Sys/em Sciences1a(6): 1125-1138doi:105194/hess-141125-2010. McCuenR H (2003)ModelingHydrologicChange,CRC press, p 261-263. McCullochWS & PittsW (1943)A logiccalculusof the ideas immanentin nervousactivity.Bull. of Math Biophys.5(a):115-133. effectsof MimikouM, Kouvopoulos Y, CavadiasG & VayianosN (1991)Regionalhydrological climatechange.J. Hydrol.123(1-2):119-146. Monk WA, Wood PJ, Hannah DM, Wilson DA, ExtenceCA & Chadd RP (2006) Flow Variabilityand Macroinvertebrate CommunityResponseWithin RiverineSystems. River Researchand Applications22(5):595-615. Monk WA, Wood PJ, Hannah DM & Wilson DA (2007) Selectionof river flow indicesfor the assessmentof hydroecological change.River Researchand Applications23(1):113-122. Moore D (1993)Applicationof a conceptualstreamflowmodel in a glacierizeddrainagebasin. J. of Hydrol.150:151-168. 21.6 Morin, G. and Slivitzky M (1992) lmpacts de changements climatiques sur le régime hydrologique: le cas de la riviereMoisie.Rev. Scr.Eau.5:179-195. MortschL, Henry Hengeveld,Murray L, Wenger L , LofgrenB, Quinn F & SlivitzkyM (2000) Climate Change lmpacts on the Hydrologyof the Great Lakes-St Lawrence System. Canadian Water Resources Journal 25.2 153-179 DOI: 1042961cwrj2502153. Mùller-WohlfeilD-1,Burger G & Lahmer W (2000) Responseof a river catchmentto climatic changein northernGermany.ClimaticChange4(1): 61-89. MurphyJ (1999)An evaluationof statisticaland dynamicaltechniquesfor downscalinglocal climate.J. of Clim. 12(8):2256-2284. Najafi,M., MoradkhaniH & Wherry S (2011).StatisticalDownscalingof Precipitation Using Machine Learningwith Optimal PredictorSelection.Journal of HydrologicEngineering 16:650-664. Nash L & GleickP (1991).Sensitivity of streamflowin the Coloradobasinto climaticchanges. Journal of Hydrology 125,119-146. Navone HD & Ceccatto HA (1994). PredictingIndian monsoon rainfall:a neural network approach.ClimateDyn. 10, 305-312. NeocleousC & Schizas C (2002) Artificialneural network learning:A comparativereview. Methodsand Applicationsof Arlificiallntelligence2308, p 300-313. Ng HYF & MarsalekJ (1992)Sensitivity of streamflowsimulationto changesin climaticinputs Nordic Hydrol 8(a): 257-27 2. Nieto JD & Wilby RB (2005)A comparisonof statisticaldownscalingand climatechangefactor methods: impacts on low flows in the river Thames United Kingdom. Climate Change 69(2-3):2a5-268 Olden JD & Poff NL (2003)Redundancyand the choiceof hydrologicindicesfor characterizing streamflowregimes.River Researchand Applications19(2):101-121 Ouarda TBMJ, ChristianC & St-HilaireA (2008) Statisticalmodels and the estimationof low flows. CanadianWater ResourcesJournal.33(2): 195-206. PhillipslD, McGregorGR, Wilson CJ, Bower D & HannahDM (2003) Regionalclimateand atmosphericcirculationcontrolson the dischargeof two British rivers. Theoreticaland AppliedClimatology76 (3):141-164. Poff NL & Allan JD (1995) Functionalorganizationof stream fish assemblagesin relationto hydrologicalvariability.Ecology76, 606-627. Poff NL, Allan JD, Bain MB, Karr JR, PrestegaardPL, RichterBD, SparksRE & StrombergJC (1997) The natural flow regime: a paradigm for river conservationand restoration. BioScience47(11). 7 69-784 Poff NL & Ward JV(1989). lmplicationsof streamflowvariabilityand predictabilityfor lotic communitystructure:a regional analysis of streamflowpatterns. CanadianJournal of Fisheries and AquaticSclences46, 1805-1818. 217 Poff NL(1996). A hydrogeographyof unregulatedstreams in the United States and an examinationof scale-dependence in some hydrologicaldescriptors.FreshwaterBiology 3 6 ,7 1 - 9 1 of hydrological PoulinA, BrissetteF, LeconteR, ArsenaultR & Malo JS (2011) Uncertainity modellingin climatechangeimpactstudiesin a Canadian,snow dominatedriver basin. J.of Hydrol.409: 626-636. PrudhommeC, ReynardN & Crooks S (2002) Downscalingof global climatemodelsfor flood frequencyanalysis:Where are we now? Hydrol.Process.16(6):1137-1150. and the ecologyof PuckridgeJT, SheldonF, WalkerKF.& Boulton AJ (1998).Flow variability large rivers.Marine and Freshwater Research49:55-72. Pyrce R (2004). HydrologicalLow Flow Indices and their Uses, WSC Report No. 04-2004, August 2004. Qian B, HayhoeH & GamedaS (2005)Evaluationof the stochasticweathergeneratorsLARSWG and AAFC-WGfor climatechangeimpactstudies.Clim.Res.29(1):3-21. Quintana-SeguiP, Ribes A, Martin E, Habets F and Boe J (2010) Comparisonof three downscalingmethodsin simulatingthe impact of climatechange on the hydrologyof Mediterranean basins. J. Hydrol.383:1 1 1-124. RacskoP, SzeidlL & SemenovM (1991)A serialapproachto localstochasticweathermodels. EcologicalModelling 57(1-2).2741 . RichardsonCW (1981) Stochasticsimulationof daily precipitationtemperatureand solar radiation.Wat ResourRes 17 (1):182-190. 17i001p00182. Doi: 10.10294/VR0 RichterBD, Baumgartner JV, PowellJ & Braun DP (1996)A methodfor assessinghydrologic alterationwithin ecosystems.ConservationBiology10(a):1163-1174. Doi: 1010461j15231739199610041 163x. RichterBD, BaumgartnerJV, WigingtonR & Braun DP (1997)How much water does a river need? FreshwaterBiology37(1):231-249.Doi: 1010461i1365-2427199700153x. RichterBD, Baumgartner JV, Braun DP & PowellJ (1998)A spatialassessmentof hydrologic alterationwithina rivernetwork.RegulatedRivers14,329-340. RiggsHC, CaffeyJE, OrsbornJF, SchaakeJC, Singh KP, & Wallace,JR (TaskCommitteeof Low-FlowEvaluation,Methods,and Needsof the Committeeon Surface-WaterHydrology of the HydraulicsDivision)(1980) Characteristics of low flows. Journalof the Hydraulics Division,Proceedings of the AmericanSocietyof CivilEngineers106,717-731. Roeckner EA, Rhodin A, Tompkins E, Manzini G, Bâuml l, KirchnerL, BonaventuraL, U& KornbluehM, EschM, GiorgettaR, BrokopfS, HagemannU, SchleseU, Schulzweida (2003) general Part l: Model TompkinsA The atmospheric circulationmodel ECHAMS description.Max PlanckInstitutefor MeteorologyRep.,p 349 127. Rogers JD & Armbruster JT (1990) Low flows and hydrologic droughts. Surface Water Hydrology:GeologicalSocietyof Americathe Geologyof America,Boulder,CO, p 12113 0 . 218 Roosmalen VL, Sonnerborg TO, Jensen KH & Christensen JH (2011) Comparison of hydrologicalsimulations of climate change using perturbationof observationsand distributed-based scaling.VadoseZone J. 10(1):136-150. RousseeuwPJ & StruyfA (1998)Computinglocationdepth and regressiondepth in higher dimensions.Sfafisficsand Computing8:193-203. RousseeuwPJ & HubertM (1999)Regression depth. J. Am. Sfaf.Assoc.94(446):389-433. Roy L, Leconte R, BrissetteFP and Marche C (2001). The lmpact of Climate Change on SeasonalFloodsof a SouthernQuebecRiver Basin.Hydrological Processes15, 31673179. SakovichVM (1990)The representation of minimumrunoffseriesin Kareliaand North-Western region.Trans.Hydrolmeteorol. Center,USSR308,p 129-136. SalatheEP (2003)Comparisonof variousprecipitation downscalingmethodsfor the simulation of streamflowin a rainshadowriverbasin.lntl J. of Clim.23(8):887 - 901. Sastry PS (2003) An introduction to support vector machines ln: Misra JC (Ed) Computing and lnformationSciences;RecentTrends.NarosaPublishingHouse,New Delhi,India. SchmidliJC, FreiC & VidalePL (2006)Downscaling from GCM precipitation: A benchmarkfor dynamicaland statisticaldownscalingmethods./nf. J. Climatol.26(5)679-689. SchulzeRE (1997) lmpactsof global climatechange in a hydrologically vulnerableregion: challengesto SouthAfricanhydrologists. Progressin PhysicalGeography21(1):113-136. SearsonDP, Leahy DE & Willis MJ (2010)GPTIPS:An Open sourceGeneticProgramming Toolbox For Multigene Symbolic Regression. Proceedings of the International MultiConference (IMECS)(HongKong 17-19March of Engineersand ComputerScientists 2010). SemenovMA, BrooksRJ, BarrowEM & RichardsonCW (1998)Comparisonof the WGEN and LARS-WGstochasticweathergeneratorsfor diverseclimates.Clim. Res. 10(2).95-107. ShabbarA & KharinV (2007)An assessmentof cross-validation for estimatingskill of empirical seasonal forecasts using a global coupled model simulation.CLIVAR Exchanges 12()10-12. SimonovicSP & Li LH (2003)Methodologyfor assessmentof climatechangeimpactson largescaleflood protectionsystem.WaterResourPlannManager129(5),361-372. Smakhtin VY & Watkins DA (1997) Low-flow estimation in South Africa Water Research CommissionReportNo 494/1/97,Pretoria,SouthAfrica. SmakhtinVU, Sami K, Hughs DA (1998) Evaluatingthe performanceof a deterministic daily rainfall-runoff modelin a low flow context.HydrologicalProcesses12:797-811. SmakhtinVU (2001)Low Flow Hydrology-Areview.J. Hydrol.2a0(3-Q1a7-136. Smola AJ, ScholkopfB & Muller KR (1998) The connectionbetweenregularizationoperators and supportvectorkernels.Neural Networks11(4):637-649. 219 Sparks RE (1992) Risks of altering the hydrologicregime of large rivers. In Predicting Ecosystem Risk. Vol XX. Advances in Modern EnvironmentalToxicology,Cairns J, Nierderlehner BR, Orvos DR (eds). PrincetonScientificPublishingCo.: Princeton,New Jersey;119-152. JA & CoutantCC (1996) StanfordJA, Ward JV, LissWJ, FrissellCA, WilliamsRN, Lichatowich protocol Rlvers: Research and general Regulated rivers. A for restorationof regulated Management12(1):39141 3. StefanovaL & KrishnamurtiTN (2002) lnterpretationof SeasonalClimateForecastUsing Brier and the AMIP-I Dataset.J. Skill Score, The FloridaState UniversitySuperensemble, 0.1175l1520Doi:http://dx.doi.orq/1 Climate, 15: 537-544. 15<0537:IOSCFU>2.0.C02. 0442(2002)0 . Journalof choiceand the assessmentof statisticalpredictions Stone M (1974)Cross-validatory the Royal Sfafisfica/Society36(2):111-133. Stoll S, FranssenHJ, Butts M et KinzelbachW (2011)Analysisof the impactof climatechange on groundwaterrelated hydrologicalfluxes: a multi-modelapproach includingdifferent -2011. downscalingmethods. Hydrol.Earth Sysf.Sci. 15, p 21-38.Doi:10.5194/hess-15-21 SuykensJ (2001)Nonlinearmodelingand supportvectormachines.In Proceedingof the 18th BudapestHungary1, p TechnologyConference, IEEE.Instrumentation and Measurement 287-294. flow assessment:emergingtrends in TharmeRE (2003) A globalprespectiveon environmental the developmentand applicationof environmentalflow methodologiesfor rivers. River Researchand Applications19 397-441. ThiémongeN & Daigle A (2012) Automationof SSARR calibrationprocess.CWRA-CGU Banff,Canada,June 5-8 2012. Conference, Tipping ME (2001) Sparse Bayesianlearningand the relevancevector machine.Journal of MachineLearning Research,1: 211-244. T i s s e u iC l , V r a c M , L e k S a n d W a d e A J ( 2 0 1 0 ) S t a t i s t i c adlo w n s c a l i n g or fi v e r f l o w sJ. o u r n aol f Hydrology 385, 279-291. techniques of differentdownscaling TeutschbeinC, WetterhallF & SeibertJ (2011)Evaluation for hydrologicalclimate-changeimpactstudiesat the catchmentscale. Clim. Dynam,37'. 2087-2105. Tohma S & lgata S (1994)Rainfallestimationfrom GMS imagerydata using neuralnetwork. Hydraulicengineeringsoftware Volume 1, W.R. Blain and K.L. Katsifarakiseds., U.K,pp 123-130. MechanicsPublications, Southampton, Computanional for climatechange of precipitation TripathiS, SrinivasW & NanjundiahRS (2006)Downscaling scenarios:a supportvectormachineapproach.Journalof Hydrology,330(4):621-640.Doi: 10 10 16/jjhydrol200604030. Turner J, ConnolleyWM, Lachlan-CopeTA & MarshallGJ (2006) The performanceof the Hadley centre climate model (HadCM3) in high latitudes. lnternationalJournal of climatology,26, 91-112. 220 User ManualSSARR (1991)ModelStreamflowSynthesisand ReservoirRegulationUS Army Corpsof EngineersNorthpacificDivision. VapnikVN (1995)The Natureof Statistical LearningTheorySpringer:NewYork. VapnikVN (1998)Statistical LearningTheoryWiley:New York. Vogel RM & FennesseyNM (1994)Flow durationcurvesl: A new interpretation and confidence intervals.J. Water Resour.Plan Manag. 120 (4): a85-504. Von SH (1999)On the use of "inflation"in statisticaldownscaling.J Clim.12 (12):3505-3506. Von SH (1999)On the Use of "lnflation"in StatisticalDownscaling.J. Clim. 12(12):3505-3506. Doi: htto:il dx.doi.orq| 10 .1175| 1 52Q-0442( 9991012<3505 :OTUA | >2 .0.CO2. Von SH, LangenbergH & Feser F (2000) A spectral nudging techniquefor dynamical downscalingpurposes. Mon WeatherRev. 128(10):3664-3673. Walker KF & Thoms MC (1993) EnvironmentalEffectsof Flow Regulationon the Lower River MurrayAustralia.Regul RiversRes Manag8 (112):103-119. Wang B, Kang lS & Lee JY (2004) Ensemblesimulationsof Asian-Australian monsoon variability by 11 AGCMS. J Clim.17(a):803-818. Watts M, Goodess CM & Jones PD (2004) The CRU Daily Weather Generator BETWIXT TechnicalBriefingNote 1, Version2, February2004. WestmacottJR & Burn DH (1997) Climatechange effectson the hydrologicregimewithinthe Churchill-Nelson RiverBasin.J of Hydrol.202(1).263-279. WhitfieldPH ReynoldsCJ & CannonAJ (2002) ModellingStreamflowsin Presentand Future Climates:Examplesfrom GeorgiaBasinBritishColumbiaCanadian.WaterRes. J. 27@): 427-456. WigleyTWL, Jones PD, BriffaKR & SmithG (1990)Obtainingsub-gridscale information from generalcirculation coarseresolution modeloutput.J. Geophys.Res.95 (D2):1943-1953. Doi: 101177| O3Og 13339702100403. Wilby RL, DawsonCW, BarrowEM (2002)SDSM - a decisionsupporttool for the assessment of regionalclimatechangeimpacts. Environmental Modellingand Software17: 145-157. Wilby RL, Charles SP, Zorita E, Timbal B, Whetton P, Mearns LO (2004) Guidelinesfor use of climatescenariosdevelopedfrom statisticaldownscalingmethods availablefrom the DDC of IPCCTGCIA 27 pp Availablefrom: IPCC-DDC:<http://wwwipcc-dataorg/>. Wilby RL & Wigley TML (1997) Downscalinggeneralcirculationmodel output:a reviewof methodsand limitations.Progressrn PhysicalGeography21(4):530-5a8. Wilby RL & Wigley TML (2000) Precipitationpredictorsfor downscaling:observedand general circulationmodelrelationships. lnternationalJournalof Climatology20(6):641-661. Wilby RL (1998)Statistical downscalingof daily precipitation using daily airflowand seasonal teleconnection indices. ClimRes. 10(3):163-178. 221. Wilby RL CharlesSP ZoritaE TimbalB WhettonP & MearnsLO (2004)Guidelinesfor use of climate scenarios developed from statistical downscaling methods. http://mlw.ipccdata.org/guidelines/dgm_no2_v1 . _09_2004.pdf Wilby RL, DawsonCW & BarrowEM (2002)SDSM- a decisionsupporttool for the assessment Modellingand Software17(2):145-157. of regionalclimatechangeimpacts.Environmental Wilby RL, Hay LE & LeaveslyGH (1999)A comparisonof downscaledand raw GCM output: implicationsfor climatechangescenariosin the San Juan River Basin,Colorado.Journal of Hydrology 225, 87 -91. Wilby RL, Wigley TML, Conway D, Jones PD, HewitsonBC, Main J & Wilks DS (1998) Statisticaldownscalingof general circulationmodel output: a comparisonof methods. WaterResourcesResearch34(11):2995-3008. Wilks, DS & Wilby RL (1999) The weather generationgame: a review of stochasticweather models. Progressin PhysicalGeography23 329-357. Wood AW, LeungAL, SridharV & LettenmaierDP (2004) Hydrologiclmplicationsof Dynamical and StatisticalApproachesto DownscalingClimate Model Outputs. Clim. Change 62(13):189-216. Models:A Reviewof ExistingGapsand Recent Xu CY (1999) ClimateChangeand Hydrologic ResearchDevelopments.WaterResourcesManagemenf13 369-382. Xu CY & HalldinS (1997)The effectof climatechangeon river flow and snow cover in the NOPEX area simulatedby a simple water balance model. Nordic Hydrol. 28(4-5):273282. Xu CY & Singh V P (1998) A review on monthly water balance models for water resources investigations. WaterResour.Manage.12(1):31-50. Xu CY (1999)ClimateChangeand HydrologicModels:A Reviewof ExistingGaps and Recent ResearchDevelopments.Water Resour.Manage.13(5):369-382. Yevstigneev VM (1990) Rechnoj stok and gidrologicheskieraschety (River runoff and hydrologicalcalculations). MoscowUniversity,Moscow,304 p. Yue S & Pilon P (2003) Interactionbetweendeterministictrend and autoregressiveprocess. WaterResour.Res.39(4)pp. TNN 1-1,CitelD1077.Doi: 10102912001WR001210. Zeng Z, HsiehWW, ShabbarA & BurrowsWR (2011)Seasonalpredictionof winterextreme precipitationover Canada by support vector regression.Hydrologyand Earth system s c i e n c e s1 5 ( 1 ) :6 5 - 7 4 . Zhang M, Fulcher J & Scofield RA (1997) Rainfallestimationusing artificialneural network -115. group.Neurocomputing16(2):97 Zhang,X, HarveyKD, Hogg WD &YuzukTR (2001)Trendsin CanadianStreamflow.Water Resources Research37(4), 987-998. Zhu M, Fujita M & HashimotoN (1994) Applicationof neural networksto runoff prediction. Sfochasficand statisticalmethod in hydrologyand environmentalengineering10(3): 205216. 222 ZoritaE & von StorchH (1999)The analogmethod- a simplestatisticaldownscalingtechnique: comparisonwith more complicatedmethods.J Clim. 12(8):2474-2489. Zuo Y & SerflingR (2000)Generalnotionsof statisticaldepth function.Ann. Stat.28 (2): 461482. 223