Найти пересечение двух вложенных списков?
Я знаю, как получить пересечение двух плоских списков:
b1 = [1,2,3,4,5,9,11,15]
b2 = [4,5,6,7,8]
b3 = [val for val in b1 if val in b2]
или же
def intersect(a, b):
return list(set(a) & set(b))
print intersect(b1, b2)
Но когда мне нужно найти пересечение для вложенных списков, тогда начинаются мои проблемы:
c1 = [1, 6, 7, 10, 13, 28, 32, 41, 58, 63]
c2 = [[13, 17, 18, 21, 32], [7, 11, 13, 14, 28], [1, 5, 6, 8, 15, 16]]
В конце я хотел бы получить:
c3 = [[13,32],[7,13,28],[1,6]]
Ребята, можете ли вы помочь мне с этим?
связанные с
21 ответ
Если ты хочешь:
c1 = [1, 6, 7, 10, 13, 28, 32, 41, 58, 63]
c2 = [[13, 17, 18, 21, 32], [7, 11, 13, 14, 28], [1, 5, 6, 8, 15, 16]]
c3 = [[13, 32], [7, 13, 28], [1,6]]
Тогда вот ваше решение для Python 2:
c3 = [filter(lambda x: x in c1, sublist) for sublist in c2]
В питоне 3 filter
возвращает итерацию вместо list
так что вам нужно завернуть filter
звонки с list()
:
c3 = [list(filter(lambda x: x in c1, sublist)) for sublist in c2]
Объяснение:
Часть фильтра берет элемент каждого подсписка и проверяет, находится ли он в исходном списке c1. Понимание списка выполняется для каждого подсписка в c2.
Вам не нужно определять пересечение. Это уже первоклассная часть сета.
>>> b1 = [1,2,3,4,5,9,11,15]
>>> b2 = [4,5,6,7,8]
>>> set(b1).intersection(b2)
set([4, 5])
Для людей, которые просто ищут пересечение двух списков, Аскер предоставил два метода:
b1 = [1,2,3,4,5,9,11,15] b2 = [4,5,6,7,8] b3 = [val for val in b1 if val in b2]
а также
def intersect(a, b): return list(set(a) & set(b)) print intersect(b1, b2)
Но есть гибридный метод, который более эффективен, потому что вам нужно сделать только одно преобразование между списком / множеством, а не три:
b1 = [1,2,3,4,5]
b2 = [3,4,5,6]
s2 = set(b2)
b3 = [val for val in b1 if val in s2]
Это будет работать в O(n), тогда как его оригинальный метод, включающий понимание списка, будет работать в O(n^2)
Функциональный подход:
input_list = [[1, 2, 3, 4, 5], [2, 3, 4, 5, 6], [3, 4, 5, 6, 7]]
result = reduce(set.intersection, map(set, input_list))
и это может быть применено к более общему случаю списков 1+
Версия для понимания чистого списка
>>> c1 = [1, 6, 7, 10, 13, 28, 32, 41, 58, 63]
>>> c2 = [[13, 17, 18, 21, 32], [7, 11, 13, 14, 28], [1, 5, 6, 8, 15, 16]]
>>> c1set = frozenset(c1)
Свести вариант:
>>> [n for lst in c2 for n in lst if n in c1set]
[13, 32, 7, 13, 28, 1, 6]
Вложенный вариант:
>>> [[n for n in lst if n in c1set] for lst in c2]
[[13, 32], [7, 13, 28], [1, 6]]
Оператор & принимает пересечение двух множеств.
{1, 2, 3} & {2, 3, 4} Out [1]: {2, 3}
Питонический способ пересечения двух списков:
[x for x in list1 if x in list2]
Вы должны сгладить, используя этот код (взят из http://kogs-www.informatik.uni-hamburg.de/~meine/python_tricks), код не проверен, но я уверен, что он работает:
def flatten(x):
"""flatten(sequence) -> list
Returns a single, flat list which contains all elements retrieved
from the sequence and all recursively contained sub-sequences
(iterables).
Examples:
>>> [1, 2, [3,4], (5,6)]
[1, 2, [3, 4], (5, 6)]
>>> flatten([[[1,2,3], (42,None)], [4,5], [6], 7, MyVector(8,9,10)])
[1, 2, 3, 42, None, 4, 5, 6, 7, 8, 9, 10]"""
result = []
for el in x:
#if isinstance(el, (list, tuple)):
if hasattr(el, "__iter__") and not isinstance(el, basestring):
result.extend(flatten(el))
else:
result.append(el)
return result
После того, как вы сгладили список, вы выполняете пересечение обычным способом:
c1 = [1, 6, 7, 10, 13, 28, 32, 41, 58, 63]
c2 = [[13, 17, 18, 21, 32], [7, 11, 13, 14, 28], [1, 5, 6, 8, 15, 16]]
def intersect(a, b):
return list(set(a) & set(b))
print intersect(flatten(c1), flatten(c2))
Поскольку intersect
было определено, достаточно базового понимания списка:
>>> c3 = [intersect(c1, i) for i in c2]
>>> c3
[[32, 13], [28, 13, 7], [1, 6]]
Улучшение благодаря замечанию С. Лотта и связанному замечанию ТМ:
>>> c3 = [list(set(c1).intersection(i)) for i in c2]
>>> c3
[[32, 13], [28, 13, 7], [1, 6]]
Дано:
> c1 = [1, 6, 7, 10, 13, 28, 32, 41, 58, 63]
> c2 = [[13, 17, 18, 21, 32], [7, 11, 13, 14, 28], [1, 5, 6, 8, 15, 16]]
Я считаю, что следующий код работает хорошо и, возможно, более кратко, если использовать операцию set:
> c3 = [list(set(f)&set(c1)) for f in c2]
Получилось:
> [[32, 13], [28, 13, 7], [1, 6]]
Если заказ необходим:
> c3 = [sorted(list(set(f)&set(c1))) for f in c2]
у нас есть:
> [[13, 32], [7, 13, 28], [1, 6]]
Кстати, для более Python стиля, этот тоже хорошо:
> c3 = [ [i for i in set(f) if i in c1] for f in c2]
Рассматриваете ли вы [1,2]
пересекаться с [1, [2]]
? То есть вас интересуют только цифры или структура списка?
Если только цифры, исследуйте, как "сгладить" списки, затем используйте set()
метод.
Я не знаю, опаздываю ли я на ваш вопрос. После прочтения вашего вопроса я придумал функцию intersect(), которая может работать как со списком, так и с вложенным списком. Я использовал рекурсию, чтобы определить эту функцию, она очень интуитивна. Надеюсь, это то, что вы ищете:
def intersect(a, b):
result=[]
for i in b:
if isinstance(i,list):
result.append(intersect(a,i))
else:
if i in a:
result.append(i)
return result
Пример:
>>> c1 = [1, 6, 7, 10, 13, 28, 32, 41, 58, 63]
>>> c2 = [[13, 17, 18, 21, 32], [7, 11, 13, 14, 28], [1, 5, 6, 8, 15, 16]]
>>> print intersect(c1,c2)
[[13, 32], [7, 13, 28], [1, 6]]
>>> b1 = [1,2,3,4,5,9,11,15]
>>> b2 = [4,5,6,7,8]
>>> print intersect(b1,b2)
[4, 5]
Чтобы определить пересечение, которое правильно учитывает количество элементов, используйте Counter
:
from collections import Counter
>>> c1 = [1, 2, 2, 3, 4, 4, 4]
>>> c2 = [1, 2, 4, 4, 4, 4, 5]
>>> list((Counter(c1) & Counter(c2)).elements())
[1, 2, 4, 4, 4]
Я также искал способ сделать это, и в итоге все закончилось так:
def compareLists(a,b):
removed = [x for x in a if x not in b]
added = [x for x in b if x not in a]
overlap = [x for x in a if x in b]
return [removed,added,overlap]
c1 = [1, 6, 7, 10, 13, 28, 32, 41, 58, 63]
c2 = [[13, 17, 18, 21, 32], [7, 11, 13, 14, 28], [1, 5, 6, 8, 15, 16]]
c3 = [list(set(i) & set(c1)) for i in c2]
c3
[[32, 13], [28, 13, 7], [1, 6]]
Для меня это очень элегантный и быстрый способ к ней:)
плоский список может быть составлен через reduce
с легкостью.
Все, что вам нужно для использования инициализатора - третий аргумент вreduce
функция.
reduce(
lambda result, _list: result.append(
list(set(_list)&set(c1))
) or result,
c2,
[])
Приведенный выше код работает как для python2, так и для python3, но вам необходимо импортировать модуль сокращения как from functools import reduce
. См. Ссылку ниже для получения подробной информации.
# Problem: Given c1 and c2:
c1 = [1, 6, 7, 10, 13, 28, 32, 41, 58, 63]
c2 = [[13, 17, 18, 21, 32], [7, 11, 13, 14, 28], [1, 5, 6, 8, 15, 16]]
# how do you get c3 to be [[13, 32], [7, 13, 28], [1, 6]] ?
Вот один из способов установить c3
это не включает наборы:
c3 = []
for sublist in c2:
c3.append([val for val in c1 if val in sublist])
Но если вы предпочитаете использовать только одну строку, вы можете сделать это:
c3 = [[val for val in c1 if val in sublist] for sublist in c2]
Это понимание списков внутри понимания списков, что немного необычно, но я думаю, что вам не должно быть особых проблем с этим.
Мы можем использовать методы set для этого:
c1 = [1, 6, 7, 10, 13, 28, 32, 41, 58, 63]
c2 = [[13, 17, 18, 21, 32], [7, 11, 13, 14, 28], [1, 5, 6, 8, 15, 16]]
result = []
for li in c2:
res = set(li) & set(c1)
result.append(list(res))
print result
c1 = [1, 6, 7, 10, 13, 28, 32, 41, 58, 63]
c2 = [[13, 17, 18, 21, 32], [7, 11, 13, 14, 28], [1, 5, 6, 8, 15, 16]]
c3 = [list(set(c2[i]).intersection(set(c1))) for i in xrange(len(c2))]
c3
->[[32, 13], [28, 13, 7], [1, 6]]
from random import *
a = sample(range(0, 1000), 100)
b = sample(range(0, 1000), 100)
print(a)
print(b)
print(set(a).intersection(set(b)))
Простой способ найти разницу и пересечение между итерациями
Используйте этот метод, если важно повторение
from collections import Counter
def intersection(a, b):
"""
Find the intersection of two iterables
>>> intersection((1,2,3), (2,3,4))
(2, 3)
>>> intersection((1,2,3,3), (2,3,3,4))
(2, 3, 3)
>>> intersection((1,2,3,3), (2,3,4,4))
(2, 3)
>>> intersection((1,2,3,3), (2,3,4,4))
(2, 3)
"""
return tuple(n for n, count in (Counter(a) & Counter(b)).items() for _ in range(count))
def difference(a, b):
"""
Find the symmetric difference of two iterables
>>> difference((1,2,3), (2,3,4))
(1, 4)
>>> difference((1,2,3,3), (2,3,4))
(1, 3, 4)
>>> difference((1,2,3,3), (2,3,4,4))
(1, 3, 4, 4)
"""
diff = lambda x, y: tuple(n for n, count in (Counter(x) - Counter(y)).items() for _ in range(count))
return diff(a, b) + diff(b, a)