问题：

使用转置表进行α-β修剪

呼延光明

2023-03-14

我不明白为什么表条目的标志被原样使用。例如，考虑具有α-β修剪和转置表的Negamax的伪代码，并集中于TT部分。

(* Transposition Table Lookup; node is the lookup key for ttEntry *)
ttEntry := transpositionTableLookup(node)
if ttEntry is valid and ttEntry.depth ≥ depth then
    if ttEntry.flag = EXACT then
        return ttEntry.value
    else if ttEntry.flag = LOWERBOUND then
        α := max(α, ttEntry.value)
    else if ttEntry.flag = UPPERBOUND then
        β := min(β, ttEntry.value)

    if α ≥ β then
        return ttEntry.value

没关系。如果条目包含确切值的下限，我们尝试从左侧缩小窗口，依此类推。

(* Transposition Table Store; node is the lookup key for ttEntry *)
ttEntry.value := value
if value ≤ alphaOrig then
    ttEntry.flag := UPPERBOUND
else if value ≥ β then
    ttEntry.flag := LOWERBOUND
else
    ttEntry.flag := EXACT
ttEntry.depth := depth  
transpositionTableStore(node, ttEntry)

而这部分我不明白。如果值太小，为什么我们设置上限标志？值位于搜索窗口的左侧 - 它小于已知的下限 - alpha。所以看起来值应该是一个下限。

从我的测试和每个人都使用那个版本的事实来看，我肯定是错的。但我不明白为什么。

共有1个答案

丌官星渊

2023-03-14

再一想，这个问题很琐碎:)

事实上，如果子节点值太好而导致β截止(值≥ β)，这意味着父节点具有至少与值一样好的移动，但是可能有一些甚至更好的移动。所以这个值是精确节点值的下界。

value≤alphaOrig表示所有移动都比alphaOrig差。这意味着值是所有移动后果的上界。

下限和上限是当前节点值的边界，而不是根节点，正如我以某种方式暗示的那样。

类似资料：

带换位表的α-β剪枝，迭代深化

我正在尝试用换位表实现增强的α-β-最小-最大修剪。我使用这个伪代码作为参考： http://people.csail.mit.edu/plaat/mtdf.html#abmem 这个算法有三个问题: > 我相信我应该在每个保存的换位表条目中存储深度（=到叶级的距离），并且仅在 entry.depth 时才使用条目我想存储每个位置的最佳移动，以便在搜索停止后使用它进行移动排序和提取最佳移动。在纯
有必要为α-β修剪算法创建一棵树吗？

我在网上看到过minimax和alpha-beta修剪算法的实现。这些实现使用数组而不是树结构来生成可能的游戏动作。有必要为这些算法创建一棵树，使用带节点的结构吗？为什么使用数组来存储游戏树？
最小化/α-β修剪如何优先考虑较短的路径？

我正在研究一个简单的tic-tac-toe问题，我正在努力理解Minimax算法是如何工作的。如果我使用效用函数1表示X win，-1表示O win，0表示正在进行的游戏，那么我不明白算法如何优先考虑较短的解决方案。据我所知，它首先到达最深的节点，如果它不是最短的路径，但它会导致可能的胜利，那么它会选择它。让我在例子中解释一下。这是电路板的状态和X转角（符号来自https://www.hack
如何用极小极大算法解决Tic-Tac-Toe 4x4游戏。α-β修剪

我做了一个Tic-Tac-Toe游戏，使用Minimax和Alpha-Beta修剪。我想为Tic-Tac-Toe（10x10）游戏制作一个计算机AI，但它的游戏树大得离谱。我的代码是这样的，我只需要更改两个变量就可以更改一行中所需的板大小单元格。例子：和我希望你明白了。所以，我把我的计划从10x10改为3x3，效果很好。然后我改变和，使其成为（4x4）井字游戏。现在，我认为使用Alph
具有α-β剪枝问题的极小极大

我在为游戏筷子做一个C程序。这是一个非常简单的游戏，总共只有625个游戏状态（如果考虑到对称性和不可到达的状态，它甚至更低）。我读过minimax和alpha-beta算法，主要是针对tic-tac-toe的，但我遇到的问题是，在tic-tac-toe中，不可能循环回到以前的状态，而这在筷子中很容易发生。因此，当运行代码时，它将以堆栈溢出结束。我通过添加以前访问过的州的标志来解决这个问题(我不
如何使用 alpha beta 修剪实现转置表

我试图在我的negamax中实现转置表。但首先我想理解伪代码中的所有思想: ' 函数 negamax（节点，深度， α， β，颜色）是 alphaOrig ：= α 但我想知道的一件事是旗帜是什么？喜欢、和？

使用转置表进行α-β修剪

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档