Какой самый известный алгоритм транзитивного замыкания для ориентированного графа?

С точки зрения времени выполнения, каков наиболее известный алгоритм транзитивного замыкания для ориентированных графов?

Я в настоящее время использую алгоритм Варшалла, но его O(n^3). Хотя из-за представления графа моя реализация работает немного лучше (вместо проверки всех ребер, она только проверяет все идущие ребра). Есть ли алгоритм транзитивного закрытия, который лучше, чем этот? В частности, есть ли что-то конкретно для многопоточных архитектур с разделяемой памятью?

3 ответа

Эта статья обсуждает производительность различных алгоритмов транзитивного замыкания:


Одна интересная идея из статьи состоит в том, чтобы избежать пересчета всего замыкания при изменении графика.

Также есть эта страница от Esko Nuutila, которая перечисляет несколько более свежих алгоритмов:


Его кандидатская диссертация, перечисленная на этой странице, может быть лучшим местом для начала:


С этой страницы:

Эксперименты также показывают, что с помощью представления интервалов и новых алгоритмов транзитивное замыкание может быть вычислено обычно за время, линейное по отношению к размеру входного графа.

Руководство по разработке алгоритмов содержит полезную информацию. Ключевые моменты:

  • Транзитивное замыкание так же сложно, как умножение матриц; поэтому наиболее известной границей является алгоритм Копперсмита – Винограда, который работает в O(n^2.376), но на практике, вероятно, не стоит использовать алгоритмы умножения матриц.
  • Для эвристического ускорения сначала рассчитайте сильно связанные компоненты.

Удивительно, но мне не удалось найти никаких реализаций STACK_TCалгоритм, описанный Эско Нуутила (связанный AmigoNico в другом ответе).

Поэтому я написал свою простую реализацию на C++. Он немного отличается от исходного алгоритма, пояснения см. В комментариях в коде.

Он успешно проходит несколько тестов, которые я пробовал, но читателям рекомендуется проверить его еще раз и сверить с исходной статьей. Код, вероятно, не оптимизирован.

      struct TransitiveClosure
    // The nodes of the graph are grouped into 'components'.
    // In a component, each node is reachable (possibly indirectly) from every other node.
    // If the number of components is same as the number of nodes, your graph has no cycles.
    // Otherwise there will be less components.
    // The components form a graph called 'condensation graph', which is always acyclic.
    // The components are numbered in a way that 'B is reachable from A' implies `B <= A`.

    struct Node
        // An arbitrarily selected node in the same component. Same for all nodes in this component.
        std::size_t root = -1;
        // Index if the component this node belongs to.
        std::size_t comp = -1;
    std::vector<Node> nodes; // Size is the number of nodes, which was passed in the argument.

    struct Component
        // Nodes that are a part of this component.
        std::vector<std::size_t> nodes;
        // Which components are reachable (possibly indirectly) from this one.
        // Unordered, but has no duplicates. May or may not contain itself.
        std::vector<std::size_t> next;
        // A convenicene array.
        // `next_contains[i]` is 1 if and only if `next` contains `i`.
        // Some trailing zeroes might be missing, check the size before accessing it.
        std::vector<unsigned char/*boolean*/> next_contains;
    std::vector<Component> components; // Size is the number of components.

[[nodiscard]] TransitiveClosure ComputeTransitiveClosure(std::size_t n, std::function<bool(std::size_t a, std::size_t b)> have_edge_from_to)
    // Implementation of the 'STACK_TC' algorithm, described by Esko Nuutila (1995), in
    // 'Efficient Transitive Closure Computation in Large Digraphs'.

    constexpr std::size_t nil = -1;

    TransitiveClosure ret;
    std::vector<std::size_t> vstack, cstack; // Vertex and component stacks.

    auto StackTc = [&](auto &StackTc, std::size_t v)
        if (ret.nodes[v].root != nil)
            return; // We already visited `v`.
        ret.nodes[v].root = v;
        ret.nodes[v].comp = nil;
        std::size_t saved_height = cstack.size();
        bool self_loop = false;
        for (std::size_t w = 0; w < n; w++)
            if (!have_edge_from_to(v, w))
            if (v == w)
                self_loop = true;
                StackTc(StackTc, w);
                if (ret.nodes[w].comp == nil)
                    ret.nodes[v].root = std::min(ret.nodes[v].root, ret.nodes[w].root);

                // The paper that this is based on had an extra condition on this last `else` branch,
                // which I wasn't able to understand: `if (v,w) is not a forward edge`.
                // However! Ivo Gabe de Wolff (2019) in "Higher ranked region inference for compile-time garbage collection"
                // says that it doesn't affect correctness:
                // > In the loop over the successors, the original algorithm Stack_TC checks whether
                // > an edge is a so called forward edge. We do not perform this check, which may cause
                // > that a component is pushed multiple times to cstack. As duplicates are removed in the
                // > topological sort, these will be removed later on and not cause problems with correctness.
        if (ret.nodes[v].root == v)
            std::size_t c = ret.components.size();
            TransitiveClosure::Component &this_comp = ret.components.back();

            this_comp.next_contains.assign(ret.components.size(), false); // Sic.

            if (vstack.back() != v || self_loop)
                this_comp.next_contains[c] = true;

            // Topologically sort a part of the component stack.
            std::sort(cstack.begin() + saved_height, cstack.end(), [&comp = ret.components](std::size_t a, std::size_t b) -> bool
                if (b >= comp[a].next_contains.size())
                    return false;
                return comp[a].next_contains[b];
            // Remove duplicates.
            cstack.erase(std::unique(cstack.begin() + saved_height, cstack.end()), cstack.end());

            while (cstack.size() != saved_height)
                std::size_t x = cstack.back();
                if (!this_comp.next_contains[x])
                    if (!this_comp.next_contains[x])
                        this_comp.next_contains[x] = true;

                    this_comp.next.reserve(this_comp.next.size() + ret.components[x].next.size());
                    for (std::size_t c : ret.components[x].next)
                        if (!this_comp.next_contains[c])
                            this_comp.next_contains[c] = true;

            std::size_t w;
                w = vstack.back();
                ret.nodes[w].comp = c;
            while (w != v);

    for (std::size_t v = 0; v < n; v++)
        StackTc(StackTc, v);

    return ret;

Мои тест-кейсы (из той же статьи):

  • Вход: (матрица смежности, Y - источник кромки, X - конечная точка)



  • Вход:

            //      a b c d e f g h i j
    /* a */{0,1,0,0,0,1,0,1,0,0},
    /* b */{1,0,1,0,0,0,0,0,0,0},
    /* c */{0,1,0,1,0,0,0,0,0,0},
    /* d */{0,0,0,0,1,0,0,0,0,0},
    /* e */{0,0,0,1,0,0,0,0,0,0},
    /* f */{0,0,0,0,0,0,1,0,0,0},
    /* g */{0,0,0,1,0,1,0,0,0,0},
    /* h */{0,0,0,0,0,0,0,0,1,0},
    /* i */{0,0,1,0,1,0,0,1,0,1},
    /* j */{0,0,0,0,0,0,0,0,0,0},


