base-stock 策略适用一个多阶段报童模型,构建动态规划模型:
可变订货成本 c c c, 单位库存持有成本 h h h,缺货惩罚成本 π \pi π
状态变量:每阶段初始库存水平
x
t
−
1
x_{t-1}
xt−1
决策变量:补货上限
y
t
y_t
yt, (
y
t
=
x
t
−
1
+
Q
t
y_t=x_{t-1}+Q_t
yt=xt−1+Qt,
Q
t
Q_t
Qt 为订货量)
状态转移方程:
x
t
+
1
=
y
t
−
ξ
t
x_{t+1}=y_t-\xi_t
xt+1=yt−ξt
最优指标函数:
f
t
(
x
t
−
1
)
f_t(x_{t-1})
ft(xt−1),表示既定初始库存
x
t
−
1
x_{t-1}
xt−1 时, 从
t
t
t 阶段到最后一阶段的最小成本和。
递推方程(省掉下标):
f
t
(
x
)
=
min
x
≤
y
L
(
y
)
+
c
(
y
−
x
)
+
∫
0
∞
f
t
+
1
(
y
−
ξ
)
d
ξ
f_t(x)=\min_{x\leq y} L(y)+c(y-x)+ \int_0^\infty f_{t+1}(y-\xi)d_{\xi}
ft(x)=x≤yminL(y)+c(y−x)+∫0∞ft+1(y−ξ)dξ
其中:
L
(
y
)
=
h
∫
0
y
(
y
−
ξ
)
ϕ
(
ξ
)
d
ξ
+
π
∫
y
∞
(
ξ
−
y
)
ϕ
(
ξ
)
d
ξ
=
h
I
+
+
π
I
−
=
h
I
+
+
π
(
I
+
−
y
+
μ
)
L(y)=h\int_0^y(y-\xi)\phi(\xi)d\xi+\pi\int_y^{\infty}(\xi-y)\phi(\xi)d\xi=h I^+ + \pi I^-=hI^{+}+\pi(I^+ -y+\mu)
L(y)=h∫0y(y−ξ)ϕ(ξ)dξ+π∫y∞(ξ−y)ϕ(ξ)dξ=hI++πI−=hI++π(I+−y+μ)
定义另一个表达式:
G
(
y
)
=
L
(
y
)
+
c
y
+
∫
0
∞
f
(
y
−
ξ
)
d
ξ
G(y)=L(y)+cy+ \int_0^\infty f(y-\xi)d_{\xi}
G(y)=L(y)+cy+∫0∞f(y−ξ)dξ
当
f
t
+
1
f_{t+1}
ft+1 为凸函数时,具有以下性质:
证明:
通过从最后一阶段递推,可以得出每个阶段的最优订货策略都为: base-stock 策略,这与 (s, S) 策略的最大区别在于:多阶段报童模型里面没有固定订货成本,若含有固定订货成本 K K K,则需要证明递推函数为 K-凸,然后得出最优订货策略 (s, S).
关键节点 (critical fraction):使 L ( y ) L(y) L(y) 最小的点 π π + h \frac{\pi}{\pi+h} π+hπ
还有一个定理:若界限函数的斜率为 − c -c −c,则每个阶段的补货上限 S = π − ( 1 − α ) c π + h S=\frac{\pi-(1-\alpha)c}{\pi+h} S=π+hπ−(1−α)c. 其中, α \alpha α 为一个阶段的折扣率。
证明:此时必须假设界限函数的形式为 − c x -cx −cx,含义是多余的库存可以按进价处理掉,而缺货的必须补上。先证明最后一个阶段的最小值在 S S S 处达到,然后递推分析即可得证。 □ \Box □
参考资料1:
Porteus, E. L. (2002). Foundations of stochastic inventory theory. Stanford University Press (pp 67-69). ↩︎