当前位置: 首页 > 工具软件 > 人工生命 > 使用案例 >

人工生命在开始它们的虚拟生活时,都拥有相同程度的智慧

狄兴业
2023-12-01

  人工生命的角斗场
  在模拟中研究者不仅改变了人工生命的身体形态还改变了它们的训练环境和执行的任务使得实验的复杂度远高于之前的同类研究通过锦标赛式的达尔文进化方案该模拟能够确保每一种人工生命的态都不会被一票否决就算在不利的环境下依然有机会将形态传递给下一代该方法既保持了种群的多样性又降低了仿真的计算量
  图2. 深度进化强化学习框架Deep Evolutionary Reinforcement Learning)绿框标出的强化学习发生在个体层面而红框的突变改变身体形态是该框架中进化算法的体现
  每次模拟开始于576个独特的人工生命包括一个“球体”(头部)和一个由不数量的圆柱形节肢以不同方式排列而成的“身体”每个人工生命都以相同的方式感知世界并以相同的神经结构和学习算法开始模拟换句话说,所有的人工生命在开始它们的虚拟生活时都拥有相同程度的智慧只是身体形状不同。
  图3. 人工生命所需要经历的各类环境
  然后每一个人工生命都要经过一个学习阶段在这个阶段中它要么穿越平坦的地形要么穿越包括块状山脊阶梯和平滑山丘等更具挑战性的地形还有一些人工生命必须移动箱子到目标位置才可以跨越复杂的地形
  图4. 人工生命分别通过平坦需要绕障和需要将箱子推至指定位置的环境。
  训练结束后每个人工生命与其它三个在相同的环境/任务组合下训的人工生命参加锦标赛,获胜者能够产生后代后代在面临与其父母相同的任务之前经历了四肢或关节的微小突变所有的人工生命(包括获胜者)都参加了多项锦标赛只有当新的后代出现时才会开始衰老
  身体进化,
  使得习得有利的行为更快
  在每个环境完成三次进化迭代(每次迭代产生4000种形态)后幸存下来的人工生命平均经历了10代的进化,其形态十分多样,包括两足动物、三足动物以及有或没有手臂的四足动物(见图5)。

 类似资料: