当前位置: 首页 > 工具软件 > mdp > 使用案例 >

马尔科夫决策过程介绍(MDP)

丁德义
2023-12-01

背景介绍与引入

  • 随机过程
    随机过程可以这么理解,在一个时间轴上,不断地进行随机试验(可以是离散或者连续的),而且我们不知道每次随机试验时结果可能服从的分布情况,每个时间点对应的结果的分布是未知的,即 X ( t ) X(t) X(t)未知,有很多种情况。但是,如果我们从开始实验到某个固定的结束时间点,都可以得到一组随机变量 X
 类似资料: