Nouvelles méthodes pour l`estimation de quantiles dans des

Transcription

Nouvelles méthodes pour l`estimation de quantiles dans des
Un poste post-doctoral en Mathématiques Appliquées est ouvert au
Laboratoire de Probabilités et Modèles Aléatoires (LPMA-Paris 7) sur la
thématique :
Nouvelles méthodes pour l’estimation de quantiles
dans des codes numériques
Ce financement est fourni par l’Agence National pour la Recherche pour
deux ans, dans le cadre du projet OPUS (Open-source Platform for Uncertainty treatments in Simulation) à partir de septembre 2009 (date flexible).
Sujet. La simulation numérique est de plus en plus utilisée pour l’étude
de phénomènes physiques et de systèmes complexes, tant dans le cadre
académique qu’industriel. Il existe aujourd’hui des codes de simulation performants donnant des résultats précis. Cependant, ces codes prennent en
entrée des jeux de données telles que des paramètres physiques, des conditions aux limites, des forçages extérieurs, etc, qui peuvent être peu ou mal
connus, soit du fait de lacunes de connaissance (par exemple dans le cas
de constantes physiques) soit du fait d’une variabilité inhérente (par exemple dans le cas de pièces issues de procédés industriels). Ces paramètres
sont alors modélisés comme des variables ou des processus aléatoires, et
le but général des méthodes de propagation d’incertitudes est de prédire
la distribution statistique des variables de sortie en fonction de la distribution statistique des variables d’entrée. Des méthodes de propagation
d’incertitudes existent déjà, qui ont surtout pour but d’obtenir des estimations des premiers moments des variables de sortie (moyenne, variance).
Or, dans certains problèmes (problèmes de sûreté notamment), on cherche
à étudier un événement plus ou moins rare. Le calcul des premiers moments
ne permet pas en général d’avoir accès à la queue de distribution des variables de sortie, les méthodes de fiabilité de type FORM-SORM ne sont pas
toujours adaptées et la qualité de leur estimation n’est pas quantifiable, et
des simulations de type Monte Carlo standards présentent des coûts de calculs prohibitifs pour arriver à réaliser un événement rare. Le but du stage
post doctoral est de proposer des méthodes qui donnent des informations
sur les quantiles des sorties des codes, quantiles qui peuvent être proches ou
extrêmes.
Le sujet est donc ouvert en ce qui concerne le type de méthodes qu’on
peut proposer. Tout est permis, du moment qu’on respecte les points importants suivants :
- L’estimation de quantiles pour les sorties de gros codes numériques se
1
rencontre surtout dans des problèmes de sûreté. Un point important de la
réponse recherchée est alors le niveau de confiance associé à l’estimation.
- On envisage des situations où la dimension des variables d’entrée est
grande. On envisage en particulier de considérer des systèmes physiques
excités par des processus aléatoires évoluant en temps.
- On souhaite enfin étendre la notion de quantile au cas multidimensionnel.
Il est possible de proposer une définition qui étend de manière naturelle la
notion de quantile usuelle définie à l’aide de la fonction de répartition, qui
donne un sens probabiliste cohérent aux composantes d’un tel quantile, et
qui prolonge la notion d’intervalle de confiance par celle de région de confiance.
Axes possibles de recherche. Même si tout est ouvert, on dispose
de pistes intéressantes dans plusieurs directions. En fonction du profil du
candidat on pourra adapter ces directions.
1) Utilisation d’un modèle réduit : Les problèmes de propagation d’incertitudes se posent souvent pour des codes numériques complexes (tels que
des codes éléments finis) et très coûteux en temps de calcul. Cependant,
on a parfois accès à un modèle réduit, qui peut être un code numérique
simplifié ou une surface de réponse mise au point lors d’une étude précédente.
En général, l’utilisation directe d’un tel modèle réduit peut conduire à des
erreurs lourdes et ne permet pas de donner des intervalles de confiance. En
particulier, si on a déterminé la surface de réponse dans la zone centrale de
l’espace des paramètres d’entrée, alors cette surface est sans doute bonne
pour estimer les tendances centrales du modèle (i.e. les premiers moments),
mais cette même surface peut être très mauvaise pour estimer un quantile,
qui dépend essentiellement d’une zone de faible probabilité de l’espace des
paramètres d’entrée, sur laquelle la surface de réponse est très mal calibrée.
Dans cette optique, la question de l’utilisation efficace du modèle réduit
est un axe de recherche très intéressant. On peut envisager des solutions
adaptées à ce problème : mise au point d’un plan d’expériences calibré
avec le modèle réduit, méthode d’échantillonnage préférentiel calibrée avec
le modèle réduit, utilisation de la sortie du modèle réduit comme variable de
contrôle ou pour la mise au point d’une méthode de stratification contrôlée.
2) Mise au point du modèle réduit : Un autre axe de recherche consiste à mettre au point un modèle réduit dédié à l’estimation de quantiles.
Les méthodes d’apprentissage séquentiel à base de processus gaussiens (type
krigeage) sont une piste intéressante, qu’il faudrait regarder dans le cas de
la recherche de quantiles plus ou moins extrêmes. On peut aussi envisager, dans certains cas, des méthodes de décomposition spectrale perme2
ttant de représenter la réponse du modèle complet sur une base adaptée
(de polynômes de chaos par exemple). Dans ce cas, le problème se réduit
à identifier les coefficients du développement, tout en gardant en tête que
l’objectif est de se concentrer sur l’estimation de quantiles.
3) Echantillonnage préférentiel : Comme mentionné précédemment, on
peut se servir d’un modèle réduit plus ou moins grossier pour chercher à
mettre au point la distribution d’importance utilisée pour l’échantillonnage
préférentiel. On peut se servir d’un procédure FORM-SORM pour développer
une méthode d’échantillonnnage préférentiel autour des points de conception (il faut alors penser à des tests permettant de garantir la qualité de
l’estimation). On peut enfin imaginer d’appliquer une méthode d’échantillonnage préférentiel guidée par des principes de grandes déviations. A ce sujet,
la situation reste encore assez confuse dans la littérature, avec des résultats
positifs et négatifs.
Salaire mensuel : 2550 euros brut (1800 euros net).
Lieu : Laboratoire de Probabilités et Modèles Aléatoires, Université Paris 7,
175 rue du Chevaleret, 75013 Paris.
Contact : Josselin Garnier
Tél : 01 44 27 86 93 - Email : [email protected]
Web : http://www.proba.jussieu.fr/˜garnier
3