GESTION DE STOCK On consid`ere un stock de marchandises, on

Transcription

GESTION DE STOCK On consid`ere un stock de marchandises, on
GESTION DE STOCK
1. L E MOD ÈLE G ÉN ÉRAL
On considère un stock de marchandises, on réparti le temps en périodes de longueur unité et on note
Xk : le stock de marchandise au début de la période numéro k ;
Uk : la quantité ≥ 0 de marchandise commandée et reçue immédiatement au début de la période k ;
Wk : la quantité ≥ 0 de marchandise demandée au début de la période k.
On suppose que la quantité de marchandise demandée et en stock est délivrée immédiatement, et que la
quantité demandée restante reste en attente jusqu’à ce qu’elle puisse être délivrée. Le stock peut donc
éventuellement être négatif et vérifie dans ce cas :
Xk+1 = Xk + Uk − Wk ∈ R .
On note C(x) > 0 le prix d’achat d’une quantité x > 0 de marchandise, H(x) le coût de stockage d’une
quantité x > 0 de marchandise, ou la pénalité de non délivrance d’une quantité −x > 0 de marchandise.
On pose H(0) = 0. Le coût de gestion du stock durant la période k est alors :
C(Uk ) + H(Xk+1 ) .
On suppose que (Wk )k≥0 est une suite de variables aléatoires indépendantes de même loi, et on cherche à
minimiser l’espérance du coût cumulé de gestion du stock.
2. U NE CHA ÎNE DE M ARKOV CONTROL ÉE À NOMBRE FINI D ’ ÉTATS
On suppose que Wk prend les valeurs 0 ou 1 avec probabilité 1 − p et p respectivement, que Uk prend
les valeurs 0 ou 1. On suppose aussi que l’excés de stock au dessus d’une quantité N est jeté et que toute
demande conduisant à une demande en attente supérieure à cette même quantité N est rejetée.
(1) Écrire l’équation de récurrence de Xk , et montrer que Xk peut être vu comme une chaı̂ne de Markov
contrôlée à valeur dans l’ensemble des états possibles S := {−N, −N + 1, . . . , 0, 1, . . . , N }, et
donner les probabilités de transition.
(2) On suppose que l’on veut minimiser l’espérance du coût cumulé de gestion de stock de l’instant
initial 0 à l’instant final T , c’est-à-dire pour les périodes 0 à T − 1. Écrire ce problème comme un
problème de contrôle stochastique avec critère additif, horizon fini, et nombre fini d’états.
(3) Écrire l’équation de la programmation dynamique associée à ce problème.
(4) On suppose que les coûts sont linéaires :
C(x) = cx,
H(x) = ax,
H(−x) = bx,
pour tout x ≥ 0
avec a > 0 et b > c > 0. Calculer la fonction vT (x) donnant la valeur du problème lorsque le stock
initial est x ∈ S et l’horizon T est égal à 1 ou 2, et donner une politique optimale en boucle fermée
πT (x) fonction du stock x, lorsque l’horizon restant est T . Montrer pour ces deux valeurs de T qu’il
existe un seuil sT tel que
πT (x) = 1 ⇔ x ≤ sT .
1
3. L E CAS D ’ UN NOMBRE INFINI D ÉTATS
On suppose maintenant que Wk peut prendre des valeurs entières positives quelconques, on note (pw )w∈N
la loi de chacune des variables Wk (pw = P (Wk = w)). On suppose aussi que Uk prend ses valeurs dans
U = R+ ou N. L’ensemble des états S est égal alors à Z ou R, selon le choix de U.
(1) Écrire (formellement) l’équation de la programmation dynamique associée à ce problème, vérifiée
par la fonction valeur vT (x) donnant la valeur du problème lorsque le stock initial est x ∈ S et
l’horizon est T .
(2) On note F : RS → RS l’opérateur de la programmation dynamique. Montrer que F vérifie :
F (v)(x) = H(x) + min{C(u) + G(v)(x + u)}
u∈U
où G :
RS
→
RS
est l’opérateur linéaire donné par
G(v)(x) = E [v(x − W0 )] =
X
pw v(x − w) .
w∈N
On note C l’ensemble des fonctions convexes f dont la croissance à l’infini est linéaire, c’est-à-dire
vérifiant :
f (x) ≥ af |x| − bf
pour certaines constantes af , bf > 0. On suppose que C et H sont dans C, et que W0 est d’espérance
finie. Montrer que F envoie l’ensemble C dans lui-même. On utilisera la propriété que pour toute
fonction g : R2 → R convexe minorée, la fonction f : R → R définie par f (x) = inf y∈R g(x, y)
est encore convexe.
(3) Déduire du point précédent que pour tout T , vT ∈ C et qu’il existe une politique optimale en boucle
fermée πT (x) fonction du stock x ∈ S donnée par l’équation de la programmation dynamique.
(4) On suppose C et H positives ou nulles. Montrer que vk ≤ vk+1 pour tout k ≥ 0.
(5) On suppose maintenant que C(u) = cu pour une certaine constante c > 0. Montrer qu’il existe un
seuil sT tel qu’une politique optimale est donnée par :
(
sT − x si x ≤ sT
πT (x) =
0
sinon.
(6) On suppose que H est de plus affine sur tous les intervalles [x, x + 1]. En déduire que vT et G(vT )
sont affines sur tous les intervalles [x, x + 1], et que sT ∈ Z pour tout T .
(7) On note y0 un optimum de G(H). Montrer que y0 ∈ Z et que
y0 ≤ sk ⇒ sk+1 = y0
y0 > sk ⇒ sk+1 ≥ sk
En déduire que la suite sk est stationnaire pour k plus grand qu’un certain k0 , et que donc la politique
optimale est aussi stationnaire à partir de k0 .
(8) La suite vk est-elle stationnaire à partir de k0 ?
2

Documents pareils