当前位置: 首页 > 工具软件 > mdp 2 > 使用案例 >

MDP

甄志
2023-12-01

部分可观察马尔可夫决策过程

wiki百科链接
  代理人无法直接观察目前的状态。相反的,它必须要根据模型的全域与部分区域观察结果来推断状态的分布。

 类似资料: