théorie des probabilités - GdR MASCOT-NUM
Transcription
théorie des probabilités - GdR MASCOT-NUM
Intérêt des théories de l'incertain pour représenter et propager la connaissance imprécise en évaluation des risques Jean Baccou , Eric Chojnacki, Sébastien Destercke Plan 1) Pourquoi modéliser l’incertitude? 2) Aperçu des théories de l’incertain 3) Exemples d’application : radioprotection et sûreté nucléaire 4) Méthode RaFu et logiciel SUNSET 5) Activités R&D 2 / 30 1) Pourquoi modéliser l’incertitude : Motivations Raisons économiques : Utilisation de modèles et de données réalistes permet de réduire des marges prises à cause d’hypothèses pénalisantes Raisons de sûreté : En France, l’article 4 de la loi sur la prévention des risques technologiques du 30 juillet 2003 « Le demandeur d’une installation nouvelle ou de la modification d’une installation existante doit fournir une étude de dangers … Cette étude donne lieu à une analyse de risque qui prend en compte la probabilité d’occurrence, suivant une méthodologie qu’elle explicite. Elle définit et justifie les mesures propres à réduire la probabilité et les effets de ces accidents.». Outil de communication : Permet de rendre visible l’état des connaissances et donc d’expliquer les règles de sûreté prises. 3 / 30 1) Pourquoi modéliser l’incertitude : Exemples Paramètres et variables d’entrée Modèle Coefficient de transfert de chaleur gaz-paroi,…. Code de thermohydraulique, incendie Quantité de lait produit par une vache, …. Modèle de transfert d’un polluant dans l’environnement Date d’incorporation d’une substance radioactive, … Modèle de contamination radioactive des travailleurs 4 / 30 Sortie ou variable d’intérêt Pic de température de gaine, température dans le local,… Concentration d’un polluant,… Dose, risque 2) Aperçu des théories de l’incertain Objectif modéliser de l’information incertaine 2 types d’incertitude = Variabilité + Imprécision Variabilité naturelle d’un phénomène (e.g. temps de défaillance d’un composant, concentration d’un polluant) : incertitude aléatoire Imprécision due au manque de données ou de connaissances (e.g. constante d’un modèle, date d’un évènement passé) : incertitude épistémique 5 / 30 2) Aperçu des théories de l’incertain o 2.1) Théorie des probabilités o 2.2) Autres théories de l’incertain Théorie des possibilités P-boxes Théorie de Dempster-Shafer 6 / 30 2.1) Théorie des probabilités Approche classique pour l’analyse d’incertitude Quantification de l’incertitude par le choix d’une pdf + dépendances entre paramètres Propagation à travers le modèle par simulations de Monte-Carlo Analyse statistique des réponses : moyenne, variance, fonction de répartition, percentiles,….. Méthode générale et simple à mettre en oeuvre 7 / 30 2.1) Théorie des probabilités Temperature densité Temps Y = code de calcul (X1, …, Xn) Chaque variable incertaine Xi est représentée par une densité de probabilité. Modèle lt Sous-modèles Chaque résultat Y est aussi une variable aléatoire Résolution numérique : simulation de Monte-Carlo Loi des grands nombres : Statistiques usuelles : 8 / 30 1 N N ∑ G ( y ) → E ( G ( y )) N → ∞ i 1 G(x) = x G(x) = x2 G(x)=1 si x≤ ≤x0 et 0 sinon E(G(X)) : moyenne E(G(X)) : variance E(G(X)) : percentile de x0 2.1) Théorie des probabilités Rappel sur le calcul probabiliste Exemple : Considérons A et B 2 variables aléatoires indépendantes équidistribuées sur [ 0 , 1 ], et Y la somme : Y=A+B + 1 0 = 1 0 1 0 2 Gamme d’incertitude de B 1 Domaine d’incertitude de (A,B) densité de probabilité Y A+B = constante = 0.5 Vraisemblance de A+B proportionnelle à cette longueur 0 0 9 / 30 Gamme d’incertitude de A 1 1 2 2.1) Théorie des probabilités Effet de la dépendance sur le calcul probabiliste Reprise de l’exemple précédent en supposant A et B totalement positivement corrélées + 0 A 1 = 0 B 0 1 1 A+B 2 Reprise de l’exemple précédent en supposant A et B totalement négativement corrélées + 0 A 10 / 30 1 = 0 B 1 0 1 A+B 2 2.1) Théorie des probabilités Choix d’une densité Effet de la métrique métrique X métrique 1/X profondeur racinaire 0 10 20 inverse de la profondeur racinaire 30 40 0 cm 0,04 0,06 0,08 0,1 0,12 1/cm Inverse de Triang (10;20;30) Triang(10; 20; 30) X <= 13,162 5,0% 12% 0,02 12% X <= 26,838 95,0% 10% fréquence (%) 8% 6% 8% 6% 4% 4% 2% 2% 0% 5 10 15 20 25 30 35 0% 0, 03 3 0, 03 4 0, 03 6 0, 03 7 0, 03 8 0, 04 0 0, 04 2 0, 04 3 0, 04 5 0, 04 8 0, 05 0 0, 05 3 0, 05 6 0, 05 9 0, 06 3 0, 06 7 0, 07 1 0, 07 7 0, 08 3 0, 09 1 0, 10 0 fréquence (%) 10% 11 / 30 2.1) Théorie des probabilités Conclusion : La théorie des probabilités constitue : un moyen simple et performant pour propager des incertitudes Exemple la méthode de Monte-Carlo Pas de restriction sur le nombre de paramètres, sur la complexité de la fonction de transfert, mesure de la précision numérique pour tous les percentiles … nécessite de représenter l’ensemble des incertitudes “source” par une densité conjointe de probabilité Comment déterminer les incertitudes “source”, leurs densités marginales, leurs dépendances ⇒ besoin d’étendre les résultats de la théorie des probabilités à des familles de probabilité : théories de l’incertain 12 / 30 2.2) Autres théories de l’incertain : modéliser des sous-familles de probabilités Exemple Ω = {a ,a ,a ,a } 1 2 3 4 Théorie : ens. Théoriede DSl’évidence : ens.focaux focauxquelconques quelconques Probabilités Probabilités::ens. ens. focaux focaux==singletons singletons Probabilités imprécises 13 / 30 a1 a2 a3 a4 a2 a1 a3 Possibilités Possibilités::ens. ens. focaux focauxemboîtés emboîtés a4 a1 a2 Théorie des probabilités : théorie « point » Théorie Dempster Shafer : théorie « ensemble » a3 a4 2.2) Autres théories de l’incertain : Théorie des possibilités : sous-famille “emboitée” de probabilités Distribution de possibilité modélise un ensemble d’intervalles de confiance. Exemple un opinion d’expert sur les valeurs du pH d’un sol : Je suis certain que Je suis sûr à 80% que Je suis sûr à 60% que Je suis sûr à 40% que Je suis sûr à 20% que noyau support 14 / 30 2.2) Autres théories de l’incertain : possibilités Une possibilité correspond à une famille de probabilités : Exemple : possibilité de consommer une quantité de poisson Famille correspondante de CDFs Distribution de possibilité Quantité de poisson 1 Quantité de poisson 1 Loi triangulaire 0 20 30 40 50 60 70 80 probabilité haute ] −∞ , x ] imprécision probabilité basse ] −∞ , x ] 0 20 30 40 50 60 70 Une distribution de possibilité triangulaire contient toutes les probabilités continues de même mode et de même support. 15 / 30 80 2.2) Autres théories de l’incertain : P-boxes Une P-box est une famille de probabilité définie par une fonction de répartition inférieure et une fonction de répartition supérieure. Exemple : P-box d’une quantité de poisson Famille de fonction de répartitions Quantité de poisson 1 Loi triangulaire Fonction de répartition haute imprécision Fonction de répartition basse 0 20 30 40 50 60 70 80 Une distribution de possibilité triangulaire contient toutes les probabilités dont la fonction de répartition est comprise entre une limite sup et inf. 16 / 30 2.2) Autres théories de l’incertain : Théorie DS Une structure DS est une famille de probabilité définie par un ensemble d’éléments focaux pesants. Exemple de structure DS 1 5 2 0 N.B. ν1 6 3.5 3 4 6.5 7 ν2 Probabilité inférieure Probabilité supérieure ν3 ≤ Proba(xЄ[3, 7]) ≤ν1+ν2+ν3+ν4 ν3 ν4 Evidemment, les fonctions de répartition inférieures et supérieures s’obtiennent en considérant les intervalles ] −∞ , x ] 17 / 30 2.2) Autres théories de l’incertain : Exemples pratiques Phénomène variable de loi connue ⇒ théorie des probabilités nbre de morts sur les routes : loi de Poisson de paramètre µ = 6000/an Phénomène variable de loi empirique imprécise ⇒ P-box Concentration d’un polluant et peu de données expérimentales Grandeur fixe mais imprécise ⇒ théorie des possibilités nbre de chomeurs en France en 2006 : 2 millions ± Phénomène variable de loi connue mais de paramètre(s) imprécis ⇒ DS durée de vie d’un composant : loi exponentielle de λ = 0.05 ± 50% 18 / 30 3.1) Exemple en radioprotection Reprocessing plant Naval dockyards Waste disposal 10 km Nuclear power station 20 km 35 km 4 cas de leucémies observés pour 2 attendus Combien de cas de leucémies peuvent être expliqués par les installations nucléaires du Nord-Cotentin ? 19 / 30 3.1) Exemple en radioprotection Un exemple de voie d’atteinte : l’ingestion de produits laitiers Captation 0,9 Lait/produits laitiers 8,2 Translocation rendement 5 kg/m2 1 Dilution atmosphérique 4.10-8 s/m3 Vache/lait 0,002 day/l Quantité consommée 35 kg/jour Plante /sol 0,11 Densité du sol 1600 kg/m3 Profondeur racinaire 30 cm 20 / 30 Excès de risque dû aux installations nucléaires: 0.001 Mais: 2+0.001 ≠ 4 cas observés! frequency frequency 0 1 2 3 4 5 6 7 S r fro m m ilk to d airy p d t 8 0 0,5 1 1,5 da y/kg T ran slo catio n frequency 90 4,5 5 5,5 Yield 6 6,5 7 7,5 8 frequency 4 fres h k g/m 2/ye ar 1 3 5 7 9 11 13 frequency C T A m easu red /C T A calcu lated 0,001 0,002 0,003 0,004 0,005 0,006 0,007 frequency Sr fro m fo d d er to m ilk d ay /kg frequency 90 0,1 0 10 20 30 40 60 70 80 fresh kg /d ay 50 12 50 50 11 0 0 0 10 95 85 0 65 0 55 75 Soil density dry weight/m3 5 10 15 20 25 30 D ep th o f so il c m 21 / 30 35 0,2 0,3 0,4 0,5 0,6 0,7 0 ,8 0,9 S r fro m so il to m aïze dry/dry frequency frequency Am o u n t eaten 50 40 1 15 3.1) Exemple en radioprotection Résultats de l’analyse probabiliste Bande d’incertitude faible (en % de la valeur de référence): 111%(percentile 5%) – 272% (percentile 95%) 0.01 0.009 0.008 Bande d’incertitude ne peut pas être expliquée par l’effet de la taille de l’échantillon (cf. statistique d’ordre) 0.007 0.006 0.005 Valeur de 0.004 référence Calcul de référence en dehors de la bande d’incertitude, apparaissant comme fortement non conservatif bande d’incertitude 0.003 0.002 Résultats étonnants de l’analyse 0.001 0 0 100 22 / 30 200 300 400 500 probabiliste Monte-Carlo Exemple : quantité de viande/poisson consommée 1 1 boeuf porc 0.01 15 viande 0 30 50 70 90 0 25 110 1 50 75 1 volaille 0 25 100 35 45 55 65 75 oeuf 0 10 85 20 30 0 90 140 190 240 290 340 40 1 poisson 1 poisson 0 20 23 / 30 0 20 30 40 50 60 70 80 30 40 50 60 70 80 3.1) Exemple en radioprotection Méthode de Dempster-Shafer: extension des techniques de Monte-Carlo Propagation : gestion des tirages = cumul ou compensation des incertitudes 1 Variable X1 Variable 1 p1 αn ... 0 0 α -cut of Xn x1 yinf 1 ... yinf 24 / 30 L ysup ... 1 ysup L Xn 3.1) Exemple en radioprotection Résultats de l’analyse « Dempster-Shafer » 1 Résultats : 0,9 Probabilité haute 0,8 0,7 Probabilité basse 0,6 0,5 Percentile 95% : [90% , 2000%] Percentile 5% : [10% , 120%] 0,4 0,3 0,2 imprécision 0,1 Calcul de référence tout à fait possible. 0 0 500 25 / 30 1000 1500 2000 2500 3000 Résultat plus conforme à la connaissance réelle, confirme la non vraisemblance d’un cas de leucémie imputable aux installations nucléaires. 3.1) Exemple en radioprotection Conclusions Méthode probabiliste: facile à implémenter (Monte-Carlo), estimation simple des percentiles Pas adaptée quand peu de connaissance (hypothèses trop restrictive) Mais Réduction artificielle des marges d’incertitudes (facteur 3 dans la bande d’incertitude), manque de fiabilité pour la prise de décision Meilleure prise en compte de l’état de connaissance, extension des techniques de Monte-Carlo Marge d’incertitude + grande (/10, x20 = facteur 200 dans la bande d’incertitude) mais plus fiable (à intégrer dans une démarche itérative) Justification de la qualité/transparence des résultats obtenus 26 / 30 3.2) Exemple en sûreté nucléaire L2-5 test : 16/06/82 Simulation de la rupture guillotine de la branche froide d’un réacteur nucléaire Programme OCDE : BEMUSE CEA (France), ENUSA & UPC (Spain) , GRS (Germany), IRSN (France), JNES (Japan), KINS (Korea) NRI (Czech Republic), PSI (Switzerland), TAEK (Turkey), Università Degli Studi di Pisa (Italy) 27 / 30 3.2) Exemple en sûreté nucléaire Effet du choix de la densité de probabilité en supposant une dépendance épistémique Percentile 95% 1126 1040 1112 1058 Effet des dépendances 1150 1129 1141 1155 Effet du choix de la densité de probabilité en supposant une indépendance stochastique Valeur expérimentale Percentile 5% Effet du choix de la densité de probabilité en supposant une indépendance stochastique Effet des dépendances 971 928 938 947 962 983 1072 1082 Effet du choix de la densité de probabilité en supposant une dépendance épistémique 28 / 30 4) Méthode RaFu et logiciel SUNSET Propagating stochastic and epistemic uncertainties: principle step 1 step 2 step 3 Propagation through mathematical model Modeling input parameters and variables step 4 Resulting output variable(s) Final representation N Variables X1, X2,…..,XN Stochastic uncertainty: K random variables Variable X1 1 0 ... 1 0 x 1 Variable Xk Random fuzzy variable (FRV) Proba b ilistic calcu lus x 1 α1 k Epistemic uncertainty: N-K fuzzy variables Variable Variable XN Xk+1 1 1 αk+1 . . . αn +1 0 0 α-cut of Xk+1 α-cut of XN l calcu Fuzzy us Pairs of cumulated distributions (p-boxes) Post-processing α2 Methodology 1. Triplet of parameter (γγS,γγE ,γγA) defined by DM’s specification: γS: desired response stochastic quantity γE: desired response fuzzy (epistemic) quantity γA: desired final numerical accuracy 2. Definition of sample minimal size and nature 29 / 30 Example of DM’s specification γS: Percentile 95% γE: Hyper-cautious (αi=0, i=K+1,…,N)) γA: 99% certainty to cover true value Associated triplet (0.95;0;0.99) 5) Activités R&D Evaluation/Validation des sources d’incertitudes: Elicitation d’avis d’experts: cadre probabiliste, possibiliste,… Méthodes de fusion de l’information : informativité, calibration, conjonction… Problème inverse Propagation des incertitudes : Construction de méta-modèles (temps de calcul, calcul d’intervalle) Extension des techniques de propagation d’incertitude (p-boxes, clouds, dépendances) Analyse et synthèse des résultats : Méthodes de restitution de l’information Analyse de sensibilité 30 / 30