Минимакс с альфа-бета-обрезкой; переменные класса или отправка их через рекурсию?

При использовании Minimax с отсечкой альфа-бета, возможно ли иметь альфа и бета в качестве переменных класса вместо отправки их через рекурсию?

Вместо:

private ValuedMove AlphaBetaSearch(Board state)
{
    return MaxValue(state, 0, int.MinValue, int.MaxValue);
}

private ValuedMove MaxValue(Board state, int d, int alpha, int beta)
{
    if (d == depth || state.GameRunning == false)
        return new ValuedMove(Heuristic.BoardValue(state, Player));

    ValuedMove v = new ValuedMove(int.MinValue);
    foreach (Move move in LegalMoves)
    {
        ValuedMove minCheck = MinValue(state.ImagineMove(move), d + 1, alpha, beta);
        if (v.Value >= beta)
            return v;
        alpha = Max(alpha, v.Value);
    }

    return v;
}

private ValuedMove MinValue(Board state, int d, int alpha, int beta)
{
    //Minimax and Alpha-Beta logic here
}

Могу ли я написать:

int alpha, beta;

private ValuedMove AlphaBetaSearch(Board state)
{
    alpha = int.MinValue;
    beta = int.MaxValue;
    return MaxValue(state, 0);
}

private ValuedMove MaxValue(Board state, int d)
{
    //Minimax and Alpha-Beta logic here
}

private ValuedMove MinValue(Board state, int d)
{
    //Minimax and Alpha-Beta logic here
}

Я спрашиваю, потому что, когда я пытался оптимизировать код, делая это (я думал, что, если мне не нужно отправлять целые числа для каждой рекурсии, я мог бы очистить немного времени), мой шахматист внезапно стал идиотом, жертвуя своей королевой, чтобы убить пешку, и делая другие глупые ошибки.

Он постоянно работает намного беднее своего "обычного альфа-бета" оппонента, что, я думаю, связано с тем, что он также ищет только небольшой процент дерева по сравнению со своим оппонентом (они оба используют одинаковую глубину, но модифицированный игрок, кажется, обрезает более агрессивный, и, следовательно, сокращение количества посещаемых узлов). Я сделал это дважды сейчас, чтобы убедиться, и я не изменяю ничего, кроме того, что я вычеркнул здесь.

Если я правильно понял алгоритм альфа-бета, это не должно иметь никакого значения, но для моего шахматиста это так. Я делаю что-то не так?

Итак, мой главный вопрос сейчас не в том, стоит ли делать это с оптимизацией или практикой кода, а скорее о том, должно ли это быть возможно или нет.

1 ответ

Решение

Вы не можете сделать это на самом деле. AlphaBeta - это рекурсивный алгоритм. Это означает, что он сам себя называет. Каждый раз, когда он вызывает себя, он делает это (возможно) с различными значениями для альфы и беты. Каждой рекурсии нужна своя версия переменных, которая будет содержать разные значения. Если вы включите переменные в класс, у вас будет только один набор переменных, совместно используемых всеми (рекурсивными) вызовами AlphaBeta.

При этом замена параметров функции членами класса, вероятно, не является хорошей оптимизацией. Оба метода имеют свою стоимость. Параметры должны быть помещены в стек перед вызовом, а доступ к членам должен осуществляться косвенно через указатель (скрытый this указатель). Давайте забудем о том, какая стоимость выше. Эта микрооптимизация, вероятно, слишком незначительна, чтобы вообще что-то менять.

Другие вопросы по тегам