Эффективный алгоритм пересечения списка

Question

Эффективный алгоритм пересечения списка

С учетом двух списков (необязательно отсортированных), каков наиболее эффективный нерекурсивный алгоритм для поиска пересечения этих списков?

83

list algorithm set-intersection

Источник

30 янв '09 в 21:35

16 ответов

Другие вопросы по тегам list algorithm set-intersection

user60628 30 янв '09 в 21:39 2009-01-30 21:39 · Answer 1 · 2009-01-30 21:39

Вы можете поместить все элементы первого списка в хэш-набор. Затем выполните итерацию второго и для каждого из его элементов проверьте хеш, чтобы увидеть, существует ли он в первом списке. Если это так, выведите его как элемент пересечения.

47

Источник

user60628 30 янв '09 в 21:39

user305149 23 май '10 в 16:22 2010-05-23 16:22 · Answer 2 · 2010-05-23 16:22

Возможно, вы захотите взглянуть на фильтры Bloom. Это битовые векторы, которые дают вероятностный ответ о том, является ли элемент членом набора. Задание пересечения может быть реализовано с помощью простой побитовой операции И. Если у вас есть большое количество нулевых пересечений, фильтр Блума может помочь вам быстро их устранить. Однако вам все равно придется прибегнуть к одному из других алгоритмов, упомянутых здесь, чтобы вычислить фактическое пересечение. http://en.wikipedia.org/wiki/Bloom_filter

user8435 30 янв '09 в 21:49 2009-01-30 21:49 · Answer 3 · 2009-01-30 21:49

Без хеширования, я полагаю, у вас есть два варианта:

Наивным способом будет сравнение каждого элемента с каждым другим элементом. O(N ^2)
Другой способ - сначала отсортировать списки, а затем выполнить итерации по ним: O(n lg n) * 2 + 2 * O(n)

10

Источник

user8435 30 янв '09 в 21:49

user2583 23 май '10 в 16:56 2010-05-23 16:56 · Answer 4 · 2010-05-23 16:56

Из списка возможностей eviews кажется, что он поддерживает сложные слияния и объединения (если это "соединение", как в терминологии БД, он вычислит пересечение). Теперь покопайтесь в вашей документации:-)

Кроме того, eviews имеет свой собственный пользовательский форум - почему бы не спросить там?

user335081 07 май '10 в 04:41 2010-05-07 04:41 · Answer 5 · 2010-05-07 04:41

В C++ можно попробовать следующее с использованием карты STL

vector<int> set_intersection(vector<int> s1, vector<int> s2){

    vector<int> ret;
    map<int, bool> store;
    for(int i=0; i < s1.size(); i++){

        store[s1[i]] = true;
    }
    for(int i=0; i < s2.size(); i++){

        if(store[s2[i]] == true) ret.push_back(s2[i]);

    }
    return ret;
}

6

Источник

user335081 07 май '10 в 04:41

user718182 21 апр '11 в 02:23 2011-04-21 02:23 · Answer 6 · 2011-04-21 02:23

С набором 1 построить двоичное дерево поиска с O(log n) и итерации set2 и искать BST m X O(log n) итого O(log n) + O(m)+O(log n) ==> O(log n)(m+1)

6

Источник

user718182 21 апр '11 в 02:23

user1768312 04 янв '13 в 19:55 2013-01-04 19:55 · Answer 7 · 2013-01-04 19:55

Вот еще одно возможное решение, которое я придумала: использование O(nlogn) во временной сложности и без дополнительной памяти. Вы можете проверить это здесь https://gist.github.com/4455373

Вот как это работает. Предполагая, что наборы не содержат повторений, объедините все наборы в один и отсортируйте их. Затем переберите объединенный набор и на каждой итерации создайте подмножество между текущим индексом i и i+n, где n - количество наборов, доступных в юниверсе. То, что мы ищем в цикле, - это повторяющаяся последовательность размером n, равной количеству множеств в юниверсе.

Если это подмножество в i равно этому подмножеству в n, это означает, что элемент в i повторяется n раз, что равно общему количеству множеств. И поскольку в любом наборе нет повторений, это означает, что каждый из наборов содержит это значение, поэтому мы добавляем его в пересечение. Затем мы сдвигаем индекс на i +, что остается между ним и n, потому что определенно ни один из этих индексов не будет образовывать повторяющуюся последовательность.

user56761 30 янв '09 в 21:47 2009-01-30 21:47 · Answer 8 · 2009-01-30 21:47

Сначала отсортируйте оба списка с помощью быстрой сортировки: O(n*log(n). Затем сравните списки, сначала просмотрев самые низкие значения, и добавьте общие значения. Например, в lua):

function findIntersection(l1, l2)
    i, j = 1,1
    intersect = {}

    while i < #l1 and j < #l2 do
        if l1[i] == l2[i] then
            i, j = i + 1, j + 1
            table.insert(intersect, l1[i])
        else if l1[i] > l2[j] then
            l1, l2 = l2, l1
            i, j = j, i
        else
            i = i + 1
        end
    end

    return intersect
end

который O(max(n, m)) где n а также m Размеры списков.

РЕДАКТИРОВАТЬ: быстрая сортировка является рекурсивной, как сказано в комментариях, но похоже, что есть нерекурсивные реализации

user1824135 16 июн '16 в 14:11 2016-06-16 14:11 · Answer 9 · 2016-06-16 14:11

Использование указателей пропуска и инструкций SSE может повысить эффективность пересечения списков.

2

Источник

user1824135 16 июн '16 в 14:11

user21384 30 янв '09 в 21:54 2009-01-30 21:54 · Answer 10 · 2009-01-30 21:54

Если есть поддержка наборов (как вы их называете в заголовке) как встроенных, то обычно существует метод пересечения.

Во всяком случае, как кто-то сказал, вы можете сделать это легко (я не буду публиковать код, кто-то уже сделал это), если у вас есть отсортированные списки. Если вы не можете использовать рекурсию, нет проблем. Существуют быстрые сортировки без рекурсии.

user58866 30 янв '09 в 21:53 2009-01-30 21:53 · Answer 11 · 2009-01-30 21:53

Почему бы не реализовать собственную простую хэш-таблицу или хэш-набор? Это стоит того, чтобы избежать пересечения nlogn, если ваши списки большие, как вы говорите.

Поскольку вы заранее знаете немного о своих данных, вы сможете выбрать хорошую хэш-функцию.

1

Источник

user58866 30 янв '09 в 21:53

user61027 31 янв '09 в 22:55 2009-01-31 22:55 · Answer 12 · 2009-01-31 22:55

Я придерживаюсь идеи "множеств". В JavaScript вы можете использовать первый список для заполнения объекта, используя элементы списка в качестве имен. Затем вы используете элементы списка из второго списка и посмотрите, существуют ли эти свойства.

1

Источник

user61027 31 янв '09 в 22:55

user1170677 19 окт '15 в 10:08 2015-10-19 10:08 · Answer 13 · 2015-10-19 10:08

Из определения Big-Oh обозначений:

T (N) = O (f (N)), если существуют положительные постоянные c и n 0, такие что T(N) ≤ cf(N), когда N ≥ n 0.

Что на практике означает, что, если два списка относительно малы по размеру, скажем, что в каждом из двух циклов примерно 100 элементов, то это прекрасно работает. Зациклите первый список и найдите похожий объект во втором. В моем случае это работает просто отлично, потому что в моих списках не будет более 10 - 20 элементов max. Однако, хорошим решением является сортировка первого O(n log n), сортировка второго также O (n log n) и объединение их, еще один O(n log n), грубо говоря O (3 n log n), скажем, что два списка имеют одинаковый размер.

16 июл '09 в 12:47 2009-07-16 12:47 · Answer 14 · 2009-07-16 12:47

В PHP что-то вроде

function intersect($X) { // X is an array of arrays; returns intersection of all the arrays
  $counts = Array(); $result = Array();
  foreach ($X AS $x) {
    foreach ($x AS $y) { $counts[$y]++; }
  }
  foreach ($counts AS $x => $count) {
    if ($count == count($X)) { $result[] = $x; }
  }
  return $result;
}

0

Источник

16 июл '09 в 12:47

user12301279 29 июн '21 в 17:41 2021-06-29 17:41 · Answer 15 · 2021-06-29 17:41

Время: O(n) Пространство: O(n) Решение для определения точек пересечения.

Например, два заданных узла будут определять точку пересечения, меняя местами указатели каждый раз, когда они достигнут конца. Пояснение к видео здесь.

      public ListNode getIntersectionNode(ListNode headA, ListNode headB) {
    ListNode pA = headA;
    ListNode pB = headB;
    while (pA != pB) {
        pA = pA == null ? headB : pA.next;
        pB = pB == null ? headA : pB.next;
    }
    return pA;
}

user16391 30 янв '09 в 21:51 2009-01-30 21:51 · Answer 16 · 2009-01-30 21:51

Я получил от этого несколько хороших ответов, которые вы можете применить. У меня пока нет возможности попробовать их, но, поскольку они также охватывают перекрестки, вы можете найти их полезными.

-1

Источник

user16391 30 янв '09 в 21:51