base-stock 策略适用一个多阶段报童模型,构建动态规划模型:
可变订货成本 cc, 单位库存持有成本 hh,缺货惩罚成本 ππ
状态变量:每阶段初始库存水平 xt−1xt−1
决策变量:补货上限 ytyt, (yt=xt−1+Qtyt=xt−1+Qt,QtQt 为订货量)
状态转移方程: xt+1=yt−ξtxt+1=yt−ξt
最优指标函数:ft(xt−1)ft(xt−1),表示既定初始库存 xt−1xt−1 时, 从 tt 阶段到最后一阶段的最小成本和。
递推方程(省掉下标):
其中:
L(y)=h∫y0(y−ξ)ϕ(ξ)dξ+π∫∞y(ξ−y)ϕ(ξ)dξ=hI++πI−=hI++π(I+−y+μ)L(y)=h∫0y(y−ξ)ϕ(ξ)dξ+π∫y∞(ξ−y)ϕ(ξ)dξ=hI++πI−=hI++π(I+−y+μ)
定义另一个表达式:
当 ft+1ft+1 为凸函数时,具有以下性质:
1. G(y)G(y) 为凸函数
2. tt 阶段的最优订货策略为 base-stock 策略
3. f(x)f(x) 为凸函数
证明:
1. 显然 L(y)L(y) 为凸函数,其一阶导数为 (h+π)∫y0ϕ(ξ)dξ−π(h+π)∫0yϕ(ξ)dξ−π。第二项是线型。第三项根据性质:一个凸函数在一个随机变量上的期望仍然是凸函数。因此 G(y)G(y) 是凸函数。
2. 根据凸函数的图形特点可以直接得出第二个命题的证明。
3. 根据性质:最小化一个联合凸函数形成的单变量函数仍是凸函数,可以证明第三个命题。
通过从最后一阶段递推,可以得出每个阶段的最优订货策略都为: base-stock 策略,这与 (s, S) 策略的最大区别在于:多阶段报童模型里面没有固定订货成本,若含有固定订货成本 KK,则需要证明递推函数为 K-凸,然后得出最优订货策略 (s, S).
关键节点:使 L(y)L(y) 最小的点 ππ+hππ+h
还有一个定理:若界限函数的斜率为 −c−c,则每个阶段的补货上限 S=π−cπ+hS=π−cπ+h.
证明:此时必须假设界限函数的形式为 −cx−cx,含义是多余的库存可以按进价处理掉,而缺货的必须补上。先证明最后一个阶段的最小值在 SS 处达到,然后递推分析即可得证。 □◻