Обнаружение последовательных целых чисел в списке
У меня есть список, содержащий данные как таковые:
[1, 2, 3, 4, 7, 8, 10, 11, 12, 13, 14]
Я хотел бы распечатать диапазоны последовательных целых чисел:
1-4, 7-8, 10-14
Есть ли встроенный / быстрый / эффективный способ сделать это?
8 ответов
Из документов:
>>> from itertools import groupby
>>> from operator import itemgetter
>>> data = [ 1, 4,5,6, 10, 15,16,17,18, 22, 25,26,27,28]
>>> for k, g in groupby(enumerate(data), lambda (i, x): i-x):
... print map(itemgetter(1), g)
...
[1]
[4, 5, 6]
[10]
[15, 16, 17, 18]
[22]
[25, 26, 27, 28]
Вы можете приспособить это довольно легко, чтобы получить напечатанный набор диапазонов.
Краткое решение, которое работает без дополнительного импорта. Он принимает любые итерируемые, сортирует несортированные данные и удаляет повторяющиеся элементы:
def ranges(nums):
nums = sorted(set(nums))
gaps = [[s, e] for s, e in zip(nums, nums[1:]) if s+1 < e]
edges = iter(nums[:1] + sum(gaps, []) + nums[-1:])
return list(zip(edges, edges))
Пример:
>>> ranges([2, 3, 4, 7, 8, 9, 15])
[(2, 4), (7, 9), (15, 15)]
>>> ranges([-1, 0, 1, 2, 3, 12, 13, 15, 100])
[(-1, 3), (12, 13), (15, 15), (100, 100)]
>>> ranges(range(100))
[(0, 99)]
>>> ranges([0])
[(0, 0)]
>>> ranges([])
[]
Это то же самое, что и решение @ dansalmo, которое мне показалось поразительным, хотя и немного сложным для чтения и применения (поскольку оно не дано как функция).
Обратите внимание, что его можно легко изменить, чтобы он выплевывал "традиционные" открытые диапазоны. [start, end)
Например, изменив оператор return:
return [(s, e+1) for s, e in zip(edges, edges)]
Это напечатает точно так, как вы указали:
>>> nums = [1, 2, 3, 4, 7, 8, 10, 11, 12, 13, 14]
>>> ranges = sum((list(t) for t in zip(nums, nums[1:]) if t[0]+1 != t[1]), [])
>>> iranges = iter(nums[0:1] + ranges + nums[-1:])
>>> print ', '.join([str(n) + '-' + str(next(iranges)) for n in iranges])
1-4, 7-8, 10-14
Если в списке есть отдельные диапазоны номеров, они будут показаны как nn:
>>> nums = [1, 2, 3, 4, 5, 7, 8, 9, 12, 15, 16, 17, 18]
>>> ranges = sum((list(t) for t in zip(nums, nums[1:]) if t[0]+1 != t[1]), [])
>>> iranges = iter(nums[0:1] + ranges + nums[-1:])
>>> print ', '.join([str(n) + '-' + str(next(iranges)) for n in iranges])
1-5, 7-9, 12-12, 15-18
Встроенный: Нет, насколько я знаю.
Вы должны пройти через массив. Начните с помещения первого значения в переменную и распечатайте его, затем, пока вы продолжаете нажимать следующее число, ничего не делайте, кроме как запомните последнее число в другой переменной. Если следующий номер не в строке, сравните последний запомненный номер с первым номером. Если это то же самое, ничего не делать. Если это не так, выведите "-" и последний номер. Затем поместите текущее значение в первую переменную и начните сначала. В конце массива вы выполняете ту же процедуру, как если бы вы набрали число вне строки.
Конечно, я мог бы написать код, но я не хочу портить вашу домашнюю работу:-)
Используя операцию set, можно выполнить следующий алгоритм
def get_consecutive_integer_series(integer_list):
integer_list = sorted(integer_list)
start_item = integer_list[0]
end_item = integer_list[-1]
a = set(integer_list) # Set a
b = range(start_item, end_item+1)
# Pick items that are not in range.
c = set(b) - a # Set operation b-a
li = []
start = 0
for i in sorted(c):
end = b.index(i) # Get end point of the list slicing
li.append(b[start:end]) # Slice list using values
start = end + 1 # Increment the start point for next slicing
li.append(b[start:]) # Add the last series
for sliced_list in li:
if not sliced_list:
# list is empty
continue
if len(sliced_list) == 1:
# If only one item found in list
yield sliced_list[0]
else:
yield "{0}-{1}".format(sliced_list[0], sliced_list[-1])
a = [1, 2, 3, 6, 7, 8, 4, 14, 15, 21]
for series in get_consecutive_integer_series(a):
print series
Вывод для приведенного выше списка "а"
1-4
6-8
14-15
21
У меня была похожая проблема, и я использую следующее для отсортированного списка. Он выводит словарь с диапазонами значений, перечисленных в словаре. Ключи отделяют каждую серию последовательных чисел, а также представляют собой промежуточную сумму непоследовательных элементов между числами в последовательности.
Ваш список дает мне вывод {0: [1, 4], 1: [7, 8], 2: [10, 14]}
def series_dictf(index_list):
from collections import defaultdict
series_dict = defaultdict(list)
sequence_dict = dict()
list_len = len(index_list)
series_interrupts = 0
for i in range(list_len):
if i == (list_len - 1):
break
position_a = index_list[i]
position_b = index_list[i + 1]
if position_b == (position_a + 1):
sequence_dict[position_a] = (series_interrupts)
sequence_dict[position_b] = (series_interrupts)
if position_b != (position_a + 1):
series_interrupts += 1
for position, series in sequence_dict.items():
series_dict[series].append(position)
for series, position in series_dict.items():
series_dict[series] = [position[0], position[-1]]
return series_dict
Вот еще одно базовое решение без использования какого-либо модуля, которое подходит для интервью, как правило, в интервью, которое они задавали, без использования каких-либо модулей:
#!/usr/bin/python
def split_list(n):
"""will return the list index"""
return [(x+1) for x,y in zip(n, n[1:]) if y-x != 1]
def get_sub_list(my_list):
"""will split the list base on the index"""
my_index = split_list(my_list)
output = list()
prev = 0
for index in my_index:
new_list = [ x for x in my_list[prev:] if x < index]
output.append(new_list)
prev += len(new_list)
output.append([ x for x in my_list[prev:]])
return output
my_list = [1, 3, 4, 7, 8, 10, 11, 13, 14]
print get_sub_list(my_list)
Выход:
[[1], [3, 4], [7, 8], [10, 11], [13, 14]]
Вы можете использовать библиотеку коллекций, которая имеет класс Counter. Счетчик может пригодиться, если попытаться опрашивать нет отдельных элементов в любой итерируемой
from collections import Counter
data = [ 1, 4,5,6, 10, 15,16,17,18, 22, 25,26,27,28]
cnt=Counter(data)
print(cnt)
выход для этого выглядит как
Counter({1: 1, 4: 1, 5: 1, 6: 1, 10: 1, 15: 1, 16: 1, 17: 1, 18: 1, 22: 1, 25: 1, 26: 1, 27: 1, 28: 1})
который, как и любой другой словарь, может быть опрошен для ключевых значений