当前位置: 首页 > 工具软件 > base-x > 使用案例 >

base-stock 策略的相关证明

公羊宗清
2023-12-01

base-stock 策略适用一个多阶段报童模型,构建动态规划模型:

可变订货成本 c c c, 单位库存持有成本 h h h,缺货惩罚成本 π \pi π

状态变量:每阶段初始库存水平 x t − 1 x_{t-1} xt1
决策变量:补货上限 y t y_t yt, ( y t = x t − 1 + Q t y_t=x_{t-1}+Q_t yt=xt1+Qt Q t Q_t Qt 为订货量)
状态转移方程: x t + 1 = y t − ξ t x_{t+1}=y_t-\xi_t xt+1=ytξt
最优指标函数: f t ( x t − 1 ) f_t(x_{t-1}) ft(xt1),表示既定初始库存 x t − 1 x_{t-1} xt1 时, 从 t t t 阶段到最后一阶段的最小成本和。

递推方程(省掉下标):
f t ( x ) = min ⁡ x ≤ y L ( y ) + c ( y − x ) + ∫ 0 ∞ f t + 1 ( y − ξ ) d ξ f_t(x)=\min_{x\leq y} L(y)+c(y-x)+ \int_0^\infty f_{t+1}(y-\xi)d_{\xi} ft(x)=xyminL(y)+c(yx)+0ft+1(yξ)dξ
其中:
L ( y ) = h ∫ 0 y ( y − ξ ) ϕ ( ξ ) d ξ + π ∫ y ∞ ( ξ − y ) ϕ ( ξ ) d ξ = h I + + π I − = h I + + π ( I + − y + μ ) L(y)=h\int_0^y(y-\xi)\phi(\xi)d\xi+\pi\int_y^{\infty}(\xi-y)\phi(\xi)d\xi=h I^+ + \pi I^-=hI^{+}+\pi(I^+ -y+\mu) L(y)=h0y(yξ)ϕ(ξ)dξ+πy(ξy)ϕ(ξ)dξ=hI++πI=hI++π(I+y+μ)

定义另一个表达式:
G ( y ) = L ( y ) + c y + ∫ 0 ∞ f ( y − ξ ) d ξ G(y)=L(y)+cy+ \int_0^\infty f(y-\xi)d_{\xi} G(y)=L(y)+cy+0f(yξ)dξ

f t + 1 f_{t+1} ft+1 为凸函数时,具有以下性质:

  1. G ( y ) G(y) G(y) 为凸函数
  2. t t t 阶段的最优订货策略为 base-stock 策略
  3. f ( x ) f(x) f(x) 为凸函数

证明:

  1. 显然 L ( y ) L(y) L(y) 为凸函数,其一阶导数为 ( h + π ) ∫ 0 y ϕ ( ξ ) d ξ − π (h+\pi)\int_0^y\phi(\xi)d\xi-\pi (h+π)0yϕ(ξ)dξπ。第二项是线性。第三项根据性质:一个凸函数在一个随机变量上的期望仍然是凸函数。因此 G ( y ) G(y) G(y) 是凸函数。
  2. 根据凸函数的图形特点可以直接得出第二个命题的证明。
  3. 根据性质:最小化一个联合凸函数形成的单变量函数仍是凸函数,可以证明第三个命题。 □ \Box

通过从最后一阶段递推,可以得出每个阶段的最优订货策略都为: base-stock 策略,这与 (s, S) 策略的最大区别在于:多阶段报童模型里面没有固定订货成本,若含有固定订货成本 K K K,则需要证明递推函数为 K-凸,然后得出最优订货策略 (s, S).

关键节点 (critical fraction):使 L ( y ) L(y) L(y) 最小的点 π π + h \frac{\pi}{\pi+h} π+hπ

还有一个定理:若界限函数的斜率为 − c -c c,则每个阶段的补货上限 S = π − ( 1 − α ) c π + h S=\frac{\pi-(1-\alpha)c}{\pi+h} S=π+hπ(1α)c. 其中, α \alpha α 为一个阶段的折扣率。

证明:此时必须假设界限函数的形式为 − c x -cx cx,含义是多余的库存可以按进价处理掉,而缺货的必须补上。先证明最后一个阶段的最小值在 S S S 处达到,然后递推分析即可得证。 □ \Box

参考资料1


  1. Porteus, E. L. (2002). Foundations of stochastic inventory theory. Stanford University Press (pp 67-69). ↩︎

 类似资料: