théorie des probabilités - GdR MASCOT-NUM

Transcription

théorie des probabilités - GdR MASCOT-NUM
Intérêt des théories de l'incertain pour
représenter et propager la connaissance
imprécise en évaluation des risques
Jean Baccou , Eric Chojnacki, Sébastien Destercke
Plan
1) Pourquoi modéliser l’incertitude?
2) Aperçu des théories de l’incertain
3) Exemples d’application : radioprotection et sûreté nucléaire
4) Méthode RaFu et logiciel SUNSET
5) Activités R&D
2 / 30
1) Pourquoi modéliser l’incertitude :
Motivations
Raisons économiques :
Utilisation de modèles et de données réalistes permet de réduire des marges prises à
cause d’hypothèses pénalisantes
Raisons de sûreté :
En France, l’article 4 de la loi sur la prévention des risques technologiques du 30 juillet
2003
« Le demandeur d’une installation nouvelle ou de la modification d’une installation
existante doit fournir une étude de dangers …
Cette étude donne lieu à une analyse de risque qui prend en compte la probabilité
d’occurrence, suivant une méthodologie qu’elle explicite. Elle définit et justifie les
mesures propres à réduire la probabilité et les effets de ces accidents.».
Outil de communication :
Permet de rendre visible l’état des connaissances et donc d’expliquer les règles de
sûreté prises.
3 / 30
1) Pourquoi modéliser l’incertitude :
Exemples
Paramètres et
variables d’entrée
Modèle
Coefficient de transfert de
chaleur gaz-paroi,….
Code de thermohydraulique,
incendie
Quantité de lait produit par
une vache, ….
Modèle de transfert d’un
polluant dans l’environnement
Date d’incorporation d’une
substance radioactive, …
Modèle de contamination
radioactive des travailleurs
4 / 30
Sortie ou
variable
d’intérêt
Pic de température de
gaine, température dans
le local,…
Concentration d’un
polluant,…
Dose, risque
2) Aperçu des théories de l’incertain
Objectif modéliser de l’information incertaine
2 types d’incertitude = Variabilité + Imprécision
Variabilité naturelle d’un phénomène (e.g. temps de
défaillance d’un composant, concentration d’un polluant) :
incertitude aléatoire
Imprécision due au manque de données ou de connaissances
(e.g. constante d’un modèle, date d’un évènement passé) :
incertitude épistémique
5 / 30
2) Aperçu des théories de l’incertain
o 2.1) Théorie des probabilités
o 2.2) Autres théories de l’incertain
Théorie des possibilités
P-boxes
Théorie de Dempster-Shafer
6 / 30
2.1) Théorie des probabilités
Approche classique pour l’analyse d’incertitude
Quantification de l’incertitude par le choix d’une
pdf + dépendances entre paramètres
Propagation à travers le modèle par
simulations de Monte-Carlo
Analyse statistique des réponses : moyenne, variance, fonction
de répartition, percentiles,…..
Méthode générale et simple à mettre en oeuvre
7 / 30
2.1) Théorie des probabilités
Temperature
densité
Temps
Y = code de calcul (X1, …, Xn)
Chaque variable incertaine Xi
est
représentée
par
une
densité de probabilité.
Modèle
lt
Sous-modèles
Chaque résultat Y est
aussi
une
variable
aléatoire
Résolution numérique : simulation de Monte-Carlo
Loi des grands nombres :
Statistiques usuelles :
8 / 30
1
N
N
∑ G ( y )    → E ( G ( y ))
N → ∞
i
1
G(x) = x
G(x) = x2
G(x)=1 si x≤
≤x0 et 0 sinon
E(G(X)) : moyenne
E(G(X)) : variance
E(G(X)) : percentile de x0
2.1) Théorie des probabilités
Rappel sur le calcul probabiliste
Exemple : Considérons A et B 2 variables aléatoires indépendantes équidistribuées sur [ 0 , 1 ],
et Y la somme : Y=A+B
+
1
0
=
1
0
1
0
2
Gamme d’incertitude de B
1
Domaine d’incertitude de (A,B)
densité de probabilité Y
A+B = constante = 0.5
Vraisemblance de
A+B
proportionnelle à
cette longueur
0
0
9 / 30
Gamme d’incertitude de A
1
1
2
2.1) Théorie des probabilités
Effet de la dépendance sur le calcul probabiliste
Reprise de l’exemple précédent en supposant A et B totalement positivement corrélées
+
0
A
1
=
0
B
0
1
1
A+B
2
Reprise de l’exemple précédent en supposant A et B totalement négativement corrélées
+
0
A
10 / 30
1
=
0
B
1
0
1
A+B
2
2.1) Théorie des probabilités
Choix d’une densité
Effet de la métrique
métrique X
métrique 1/X
profondeur racinaire
0
10
20
inverse de la profondeur racinaire
30
40
0
cm
0,04
0,06
0,08
0,1
0,12
1/cm
Inverse de Triang (10;20;30)
Triang(10; 20; 30)
X <= 13,162
5,0%
12%
0,02
12%
X <= 26,838
95,0%
10%
fréquence (%)
8%
6%
8%
6%
4%
4%
2%
2%
0%
5
10
15
20
25
30
35
0%
0,
03
3
0,
03
4
0,
03
6
0,
03
7
0,
03
8
0,
04
0
0,
04
2
0,
04
3
0,
04
5
0,
04
8
0,
05
0
0,
05
3
0,
05
6
0,
05
9
0,
06
3
0,
06
7
0,
07
1
0,
07
7
0,
08
3
0,
09
1
0,
10
0
fréquence (%)
10%
11 / 30
2.1) Théorie des probabilités
Conclusion :
La théorie des probabilités constitue :
un moyen simple et performant pour propager des incertitudes
Exemple la méthode de Monte-Carlo
Pas de restriction sur le nombre de paramètres, sur la complexité
de la fonction de transfert, mesure de la précision numérique pour
tous les percentiles …
nécessite de représenter l’ensemble des incertitudes “source” par une
densité conjointe de probabilité
Comment déterminer les incertitudes “source”, leurs densités marginales,
leurs dépendances
⇒ besoin d’étendre les résultats de la théorie des probabilités à des
familles de probabilité : théories de l’incertain
12 / 30
2.2) Autres théories de l’incertain :
modéliser des sous-familles de probabilités
Exemple
Ω = {a ,a ,a ,a }
1 2
3
4
Théorie
: ens.
Théoriede
DSl’évidence
:
ens.focaux
focauxquelconques
quelconques
Probabilités
Probabilités::ens.
ens.
focaux
focaux==singletons
singletons
Probabilités
imprécises
13 / 30
a1
a2
a3
a4
a2
a1
a3
Possibilités
Possibilités::ens.
ens.
focaux
focauxemboîtés
emboîtés
a4
a1
a2
Théorie des probabilités :
théorie « point »
Théorie Dempster Shafer :
théorie « ensemble »
a3
a4
2.2) Autres théories de l’incertain :
Théorie des possibilités : sous-famille “emboitée” de probabilités
Distribution de possibilité modélise un ensemble d’intervalles de confiance.
Exemple un opinion d’expert sur les valeurs du pH d’un sol :
Je suis certain que
Je suis sûr à 80% que
Je suis sûr à 60% que
Je suis sûr à 40% que
Je suis sûr à 20% que
noyau
support
14 / 30
2.2) Autres théories de l’incertain : possibilités
Une possibilité correspond à une famille de probabilités :
Exemple : possibilité de consommer une quantité de poisson
Famille correspondante
de CDFs
Distribution de possibilité
Quantité de poisson
1
Quantité de poisson
1
Loi triangulaire
0
20
30
40
50
60
70
80
probabilité haute
] −∞ , x ]
imprécision
probabilité basse
] −∞ , x ]
0
20
30
40
50
60
70
Une distribution de possibilité triangulaire contient toutes les probabilités
continues de même mode et de même support.
15 / 30
80
2.2) Autres théories de l’incertain : P-boxes
Une P-box est une famille de probabilité définie par une fonction de
répartition inférieure et une fonction de répartition supérieure.
Exemple : P-box d’une quantité de poisson
Famille de fonction de répartitions
Quantité de poisson
1
Loi triangulaire
Fonction de
répartition haute
imprécision
Fonction de répartition
basse
0
20
30
40
50
60
70
80
Une distribution de possibilité triangulaire contient toutes les probabilités
dont la fonction de répartition est comprise entre une limite sup et inf.
16 / 30
2.2) Autres théories de l’incertain : Théorie DS
Une structure DS est une famille de probabilité définie par un ensemble
d’éléments focaux pesants.
Exemple de structure DS
1
5
2
0
N.B.
ν1
6
3.5
3
4
6.5
7
ν2
Probabilité inférieure
Probabilité supérieure
ν3 ≤ Proba(xЄ[3, 7]) ≤ν1+ν2+ν3+ν4
ν3
ν4
Evidemment, les fonctions de répartition inférieures et supérieures s’obtiennent en considérant les
intervalles ] −∞ , x ]
17 / 30
2.2) Autres théories de l’incertain : Exemples pratiques
Phénomène variable de loi connue ⇒ théorie des probabilités
nbre de morts sur les routes : loi de Poisson de paramètre µ = 6000/an
Phénomène variable de loi empirique imprécise ⇒ P-box
Concentration d’un polluant et peu de données expérimentales
Grandeur fixe mais imprécise ⇒ théorie des possibilités
nbre de chomeurs en France en 2006 : 2 millions ±
Phénomène variable de loi connue mais de paramètre(s) imprécis ⇒ DS
durée de vie d’un composant : loi exponentielle de λ = 0.05 ± 50%
18 / 30
3.1) Exemple en radioprotection
Reprocessing plant
Naval dockyards
Waste disposal
10 km
Nuclear power station
20 km
35 km
4 cas de leucémies observés pour 2 attendus
Combien de cas de leucémies peuvent être expliqués par les installations nucléaires
du Nord-Cotentin ?
19 / 30
3.1) Exemple en radioprotection
Un exemple de voie d’atteinte : l’ingestion de produits laitiers
Captation
0,9
Lait/produits laitiers
8,2
Translocation
rendement
5 kg/m2
1
Dilution
atmosphérique
4.10-8 s/m3
Vache/lait
0,002 day/l
Quantité
consommée
35 kg/jour
Plante /sol
0,11
Densité du sol
1600 kg/m3
Profondeur
racinaire
30 cm
20 / 30
Excès de risque dû aux
installations nucléaires: 0.001
Mais: 2+0.001
≠ 4 cas observés!
frequency
frequency
0
1
2
3
4
5
6
7
S r fro m m ilk to d airy p d t
8
0
0,5
1
1,5
da y/kg
T ran slo catio n
frequency
90
4,5
5
5,5
Yield
6
6,5
7
7,5
8
frequency
4
fres h k g/m 2/ye ar
1
3
5
7
9
11
13
frequency
C T A m easu red /C T A calcu lated
0,001 0,002 0,003 0,004 0,005 0,006 0,007
frequency
Sr fro m fo d d er to m ilk d ay /kg
frequency
90
0,1
0
10
20
30
40
60
70
80
fresh kg /d ay
50
12
50
50
11
0
0
0
10
95
85
0
65
0
55
75
Soil density
dry weight/m3
5
10
15
20
25
30
D ep th o f so il c m
21 / 30
35
0,2
0,3
0,4
0,5
0,6
0,7
0 ,8
0,9
S r fro m so il to m aïze dry/dry
frequency
frequency
Am o u n t eaten
50
40
1
15
3.1) Exemple en radioprotection
Résultats de l’analyse probabiliste
Bande d’incertitude faible (en % de la
valeur de référence):
111%(percentile 5%) – 272%
(percentile 95%)
0.01
0.009
0.008
Bande d’incertitude ne peut pas être
expliquée par l’effet de la taille de
l’échantillon (cf. statistique d’ordre)
0.007
0.006
0.005
Valeur de
0.004
référence
Calcul de référence en dehors de la
bande
d’incertitude,
apparaissant
comme fortement non conservatif
bande
d’incertitude
0.003
0.002
Résultats étonnants de l’analyse
0.001
0
0
100
22 / 30
200
300
400
500
probabiliste Monte-Carlo
Exemple : quantité de viande/poisson consommée
1
1
boeuf
porc
0.01
15
viande
0
30
50
70
90
0
25
110
1
50
75
1
volaille
0
25
100
35
45
55
65
75
oeuf
0
10
85
20
30
0
90
140
190
240
290
340
40
1
poisson
1
poisson
0
20
23 / 30
0
20
30
40
50
60
70
80
30
40
50
60
70
80
3.1) Exemple en radioprotection
Méthode de Dempster-Shafer: extension des techniques de Monte-Carlo
Propagation : gestion des tirages = cumul ou compensation des
incertitudes
1
Variable
X1
Variable
1
p1
αn
...
0
0
α -cut of Xn
x1
yinf
1
...
yinf
24 / 30
L
ysup
...
1
ysup
L
Xn
3.1) Exemple en radioprotection
Résultats de l’analyse « Dempster-Shafer »
1
Résultats :
0,9
Probabilité haute
0,8
0,7
Probabilité basse
0,6
0,5
Percentile 95% :
[90% , 2000%]
Percentile 5% :
[10% , 120%]
0,4
0,3
0,2
imprécision
0,1
Calcul de référence tout à fait possible.
0
0
500
25 / 30
1000
1500
2000
2500
3000
Résultat plus conforme à la connaissance
réelle, confirme la non vraisemblance d’un
cas de leucémie imputable aux installations
nucléaires.
3.1) Exemple en radioprotection
Conclusions
Méthode probabiliste: facile à implémenter (Monte-Carlo), estimation
simple des percentiles
Pas adaptée quand peu de connaissance (hypothèses
trop restrictive)
Mais
Réduction artificielle des marges d’incertitudes (facteur 3 dans
la bande d’incertitude), manque de fiabilité pour la prise de
décision
Meilleure prise en compte de l’état de connaissance, extension des
techniques de Monte-Carlo
Marge d’incertitude + grande (/10, x20 = facteur 200 dans la
bande d’incertitude) mais plus fiable (à intégrer dans une
démarche itérative)
Justification de la qualité/transparence des résultats obtenus
26 / 30
3.2) Exemple en sûreté nucléaire
L2-5 test : 16/06/82
Simulation de la rupture guillotine de la
branche froide d’un réacteur nucléaire
Programme OCDE : BEMUSE
CEA (France), ENUSA & UPC (Spain) , GRS
(Germany), IRSN (France), JNES (Japan),
KINS (Korea) NRI (Czech Republic), PSI
(Switzerland), TAEK (Turkey), Università Degli
Studi di Pisa (Italy)
27 / 30
3.2) Exemple en sûreté nucléaire
Effet du choix de la densité de probabilité en supposant une dépendance épistémique
Percentile 95%
1126
1040
1112
1058
Effet des dépendances
1150
1129
1141
1155
Effet du choix de la densité de probabilité en supposant une indépendance stochastique
Valeur expérimentale
Percentile 5%
Effet du choix de la densité de probabilité en supposant une indépendance stochastique
Effet des dépendances
971
928
938
947
962
983
1072
1082
Effet du choix de la densité de probabilité en supposant une dépendance épistémique
28 / 30
4) Méthode RaFu et logiciel SUNSET
Propagating stochastic and epistemic uncertainties: principle
step 1
step 2
step 3
Propagation through
mathematical model
Modeling input parameters
and variables
step 4
Resulting output
variable(s)
Final representation
N Variables X1, X2,…..,XN
Stochastic uncertainty: K random variables
Variable X1
1
0
...
1
0
x
1
Variable Xk
Random fuzzy variable (FRV)
Proba
b
ilistic
calcu
lus
x
1
α1
k
Epistemic uncertainty: N-K fuzzy variables
Variable
Variable XN
Xk+1
1
1
αk+1
. . . αn
+1
0
0
α-cut of Xk+1
α-cut of XN
l
calcu
Fuzzy
us
Pairs of cumulated distributions (p-boxes)
Post-processing
α2
Methodology
1.
Triplet of parameter (γγS,γγE ,γγA) defined by DM’s specification:
γS: desired response stochastic quantity
γE: desired response fuzzy (epistemic) quantity
γA: desired final numerical accuracy
2.
Definition of sample minimal size and nature
29 / 30
Example of DM’s specification
γS: Percentile 95%
γE: Hyper-cautious (αi=0, i=K+1,…,N))
γA: 99% certainty to cover true value
Associated triplet (0.95;0;0.99)
5) Activités R&D
Evaluation/Validation des sources d’incertitudes:
Elicitation d’avis d’experts: cadre probabiliste, possibiliste,…
Méthodes de fusion de l’information : informativité, calibration, conjonction…
Problème inverse
Propagation des incertitudes :
Construction de méta-modèles (temps de calcul, calcul d’intervalle)
Extension des techniques de propagation d’incertitude (p-boxes, clouds,
dépendances)
Analyse et synthèse des résultats :
Méthodes de restitution de l’information
Analyse de sensibilité
30 / 30