Нахождение значений пересечения с помощью Python matplotlib-venn
Я использовал matplotlib-venn для генерации диаграммы Венна из 3 комплектов. Показано ниже.
Я хотел спросить, как можно найти значения пересечений этих множеств. Например, каковы 384 значения, которые пересекают множество A и множество B? Какие 144 значения пересекают множество A, множество B и множество C? и так стоит.
Спасибо.
Родриго
2 ответа
Предполагая, что вы используете встроенный Python set
объекты, это очень просто, чтобы получить пересечение между двумя наборами. Смотрите этот пример:
>>> a = set(range(30))
>>> b = set(range(25,50))
>>> a.intersection(b)
set([25, 26, 27, 28, 29])
Я знаю, что это старый вопрос, но я недавно работал над аналогичной проблемой. Ради будущих посетителей я поделюсь своим решением здесь. Приведенный ниже код предоставляет решение для определения принадлежности каждого раздела диаграммы Венна. Одних пересечений недостаточно, вы также должны вычесть ненужные множества.
def get_venn_sections(sets):
"""
Given a list of sets, return a new list of sets with all the possible
mutually exclusive overlapping combinations of those sets. Another way
to think of this is the mutually exclusive sections of a venn diagram
of the sets. If the original list has N sets, the returned list will
have (2**N)-1 sets.
Parameters
----------
sets : list of set
Returns
-------
combinations : list of tuple
tag : str
Binary string representing which sets are included / excluded in
the combination.
set : set
The set formed by the overlapping input sets.
"""
num_combinations = 2 ** len(sets)
bit_flags = [2 ** n for n in range(len(sets))]
flags_zip_sets = [z for z in zip(bit_flags, sets)]
combo_sets = []
for bits in range(num_combinations - 1, 0, -1):
include_sets = [s for flag, s in flags_zip_sets if bits & flag]
exclude_sets = [s for flag, s in flags_zip_sets if not bits & flag]
combo = set.intersection(*include_sets)
combo = set.difference(combo, *exclude_sets)
tag = ''.join([str(int((bits & flag) > 0)) for flag in bit_flags])
combo_sets.append((tag, combo))
return combo_sets