我正在尝试为一个游戏创建一个AI播放器,使用带有alpha-beta修剪的minimax算法。我在正确地执行它时遇到了一些困难。我有两个功能要使用,一个用于评估给定玩家(返回一些分数)getBoardScore的当前棋盘状态,另一个用于返回每个可能移动(从给定玩家的给定棋盘状态)GetPossibleBoard创建的所有可能棋盘状态。
我的AI通过最初调用alphaBeta,将其传递到当前的板状态来进行移动。然后,它根据alphaBeta函数递归修改的变量“bestBoard”设置新的板状态。以下是我的alphaBeta函数的代码:
static int MAX = -1;
static int MIN = 1;
Board node;
Board bestBoard;
public int alphaBeta(Board node, int depth, int alpha, int beta, int player) {
if (depth == 0 || node.gameFinished()) {
return node.getBoardScore(player);
}
ArrayList<Board> childNodes = node.getPossibleBoards(player); //All valid moves from current the board state
if (player == MAX) {
for (Board currentBoard: childNodes) {
int result = alphaBeta(currentBoard, depth-1, alpha, beta, -player);
if (alpha < result) {
alpha = result;
bestBoard = currentBoard;
}
if (beta <= alpha) {
break; //alpha cut-off
}
}
return alpha;
}
else {
for (Board currentBoard: childNodes) {
int result = alphaBeta(currentBoard, depth-1, alpha, beta, -player);
if (beta > result) {
beta = result;
bestBoard = currentBoard;
}
if (beta <= alpha) {
break; //alpha cut-off
}
}
return beta;
}
}
我的问题是,它只是把我的最佳董事会变量设置为最后一个董事会状态(而不是最佳状态)。我似乎不知道我应该在哪里设置我最好的董事会变量(或者我在设置它之前是否应该有一些条件)。谁能给我指出正确的方向?谢啦
我认为问题在于,只有当您处于搜索的第一阶段时,才需要保存bestBoard
。
我很难让Alpha-beta修剪正常工作。我有一个函数Minimax算法,我试着去适应,但没有用。我在维基百科上用了这个例子 目前,该算法似乎在大多数情况下都按预期运行,但不管怎样,它都会选择第一个测试节点。 这可能是因为缺乏理解,但我已经花了数小时阅读了这篇文章。让我困惑的是,在零和博弈中,算法如何知道当达到深度极限时哪个节点是最佳选择;在哪一点上,我们还不能确定哪位球员会从这样的举动中受益最大
我试图在我的极小值中添加阿尔法贝塔修剪,但我不明白我哪里出错了。 目前,我正在经历5000次迭代,根据一个朋友的说法,我应该经历大约16000次迭代。当选择第一个位置时,它返回-1(一个损失),而它应该能够在这一点上肯定返回0(一个平局),因为它应该能够从一个空的棋盘中抽签,但是我看不到我哪里出错了,因为我跟着我的代码走似乎没问题 奇怪的是,如果我在我的检查中切换返回α和β(以实现返回0),计算机
在我的方法newminimax49中,我有一个minimax算法,它利用了本文中建议给我的记忆和其他一般性改进。该方法使用一个简单的启发式电路板评估函数。我的问题基本上是关于alpha-beta修剪,即我的minimax方法是否使用alpha-beta修剪。据我所知,我相信这是真的,然而,我用来实现它的东西似乎太简单了,不可能是真的。此外,其他人建议我使用alpha-beta剪枝,正如我所说的,我
我目前正在从事我的第一个C项目,并选择使用基于Minimax的AI编写一个Connect Four(又名Score 4),更具体地说是基于Alpha-Beta修剪方法。 到目前为止,我了解到AB修剪包含在一个递归算法中,该算法考虑了一个alpha和一个beta参数,这是您在游戏树中找不到的“极限”。此外,我们定义了最大化和最小化玩家,前者是第一个开始玩游戏的玩家。最后,还有一个“深度”,我把它理解
我试图让Alpha-beta修剪工作,但与我的Minimax函数相比,它给了我完全错误的动作。这是我的极大极小函数,它现在工作得很好。 这是我的Alphabeta修剪函数 两者都使用相同的评估,不确定这里出了什么问题。谢谢你的帮助。
我在写国际象棋的最小化算法。 对于不带alpha-beta修剪的minimax和带alpha-beta修剪的minimax,我得到了不同的最终结果值。 下面是我的伪代码。有人能帮我吗? 极小极大() αβ() 董事会代表董事会。对于每一次移动,我都在传递的董事会对象的副本上移动,然后将这个临时董事会传递给进一步的调用。 evaluateBoard(董事会b)接收董事会并根据给定董事会情景计算分数。