Nouvelles méthodes pour l`estimation de quantiles dans des
Transcription
Nouvelles méthodes pour l`estimation de quantiles dans des
Un poste post-doctoral en Mathématiques Appliquées est ouvert au Laboratoire de Probabilités et Modèles Aléatoires (LPMA-Paris 7) sur la thématique : Nouvelles méthodes pour l’estimation de quantiles dans des codes numériques Ce financement est fourni par l’Agence National pour la Recherche pour deux ans, dans le cadre du projet OPUS (Open-source Platform for Uncertainty treatments in Simulation) à partir de septembre 2009 (date flexible). Sujet. La simulation numérique est de plus en plus utilisée pour l’étude de phénomènes physiques et de systèmes complexes, tant dans le cadre académique qu’industriel. Il existe aujourd’hui des codes de simulation performants donnant des résultats précis. Cependant, ces codes prennent en entrée des jeux de données telles que des paramètres physiques, des conditions aux limites, des forçages extérieurs, etc, qui peuvent être peu ou mal connus, soit du fait de lacunes de connaissance (par exemple dans le cas de constantes physiques) soit du fait d’une variabilité inhérente (par exemple dans le cas de pièces issues de procédés industriels). Ces paramètres sont alors modélisés comme des variables ou des processus aléatoires, et le but général des méthodes de propagation d’incertitudes est de prédire la distribution statistique des variables de sortie en fonction de la distribution statistique des variables d’entrée. Des méthodes de propagation d’incertitudes existent déjà, qui ont surtout pour but d’obtenir des estimations des premiers moments des variables de sortie (moyenne, variance). Or, dans certains problèmes (problèmes de sûreté notamment), on cherche à étudier un événement plus ou moins rare. Le calcul des premiers moments ne permet pas en général d’avoir accès à la queue de distribution des variables de sortie, les méthodes de fiabilité de type FORM-SORM ne sont pas toujours adaptées et la qualité de leur estimation n’est pas quantifiable, et des simulations de type Monte Carlo standards présentent des coûts de calculs prohibitifs pour arriver à réaliser un événement rare. Le but du stage post doctoral est de proposer des méthodes qui donnent des informations sur les quantiles des sorties des codes, quantiles qui peuvent être proches ou extrêmes. Le sujet est donc ouvert en ce qui concerne le type de méthodes qu’on peut proposer. Tout est permis, du moment qu’on respecte les points importants suivants : - L’estimation de quantiles pour les sorties de gros codes numériques se 1 rencontre surtout dans des problèmes de sûreté. Un point important de la réponse recherchée est alors le niveau de confiance associé à l’estimation. - On envisage des situations où la dimension des variables d’entrée est grande. On envisage en particulier de considérer des systèmes physiques excités par des processus aléatoires évoluant en temps. - On souhaite enfin étendre la notion de quantile au cas multidimensionnel. Il est possible de proposer une définition qui étend de manière naturelle la notion de quantile usuelle définie à l’aide de la fonction de répartition, qui donne un sens probabiliste cohérent aux composantes d’un tel quantile, et qui prolonge la notion d’intervalle de confiance par celle de région de confiance. Axes possibles de recherche. Même si tout est ouvert, on dispose de pistes intéressantes dans plusieurs directions. En fonction du profil du candidat on pourra adapter ces directions. 1) Utilisation d’un modèle réduit : Les problèmes de propagation d’incertitudes se posent souvent pour des codes numériques complexes (tels que des codes éléments finis) et très coûteux en temps de calcul. Cependant, on a parfois accès à un modèle réduit, qui peut être un code numérique simplifié ou une surface de réponse mise au point lors d’une étude précédente. En général, l’utilisation directe d’un tel modèle réduit peut conduire à des erreurs lourdes et ne permet pas de donner des intervalles de confiance. En particulier, si on a déterminé la surface de réponse dans la zone centrale de l’espace des paramètres d’entrée, alors cette surface est sans doute bonne pour estimer les tendances centrales du modèle (i.e. les premiers moments), mais cette même surface peut être très mauvaise pour estimer un quantile, qui dépend essentiellement d’une zone de faible probabilité de l’espace des paramètres d’entrée, sur laquelle la surface de réponse est très mal calibrée. Dans cette optique, la question de l’utilisation efficace du modèle réduit est un axe de recherche très intéressant. On peut envisager des solutions adaptées à ce problème : mise au point d’un plan d’expériences calibré avec le modèle réduit, méthode d’échantillonnage préférentiel calibrée avec le modèle réduit, utilisation de la sortie du modèle réduit comme variable de contrôle ou pour la mise au point d’une méthode de stratification contrôlée. 2) Mise au point du modèle réduit : Un autre axe de recherche consiste à mettre au point un modèle réduit dédié à l’estimation de quantiles. Les méthodes d’apprentissage séquentiel à base de processus gaussiens (type krigeage) sont une piste intéressante, qu’il faudrait regarder dans le cas de la recherche de quantiles plus ou moins extrêmes. On peut aussi envisager, dans certains cas, des méthodes de décomposition spectrale perme2 ttant de représenter la réponse du modèle complet sur une base adaptée (de polynômes de chaos par exemple). Dans ce cas, le problème se réduit à identifier les coefficients du développement, tout en gardant en tête que l’objectif est de se concentrer sur l’estimation de quantiles. 3) Echantillonnage préférentiel : Comme mentionné précédemment, on peut se servir d’un modèle réduit plus ou moins grossier pour chercher à mettre au point la distribution d’importance utilisée pour l’échantillonnage préférentiel. On peut se servir d’un procédure FORM-SORM pour développer une méthode d’échantillonnnage préférentiel autour des points de conception (il faut alors penser à des tests permettant de garantir la qualité de l’estimation). On peut enfin imaginer d’appliquer une méthode d’échantillonnage préférentiel guidée par des principes de grandes déviations. A ce sujet, la situation reste encore assez confuse dans la littérature, avec des résultats positifs et négatifs. Salaire mensuel : 2550 euros brut (1800 euros net). Lieu : Laboratoire de Probabilités et Modèles Aléatoires, Université Paris 7, 175 rue du Chevaleret, 75013 Paris. Contact : Josselin Garnier Tél : 01 44 27 86 93 - Email : [email protected] Web : http://www.proba.jussieu.fr/˜garnier 3