В чем разница между функциями range и xrange в Python 2.X?

Очевидно, что xrange быстрее, но я понятия не имею, почему он быстрее (и нет никаких доказательств, кроме того, что он раньше был быстрее) или чем, кроме этого, отличается

for i in range(0, 20):
for i in xrange(0, 20):

28 ответов

Решение

Range создает список, так что если вы делаете range(1, 10000000) он создает список в памяти с 9999999 элементы.

xrange является объектом последовательности, который оценивает лениво.

Следует добавить из подсказки @Thiago, что в python3 range делает эквивалент xrange Python

Range создает список, так что если вы делаете range(1, 10000000) он создает список в памяти с 9999999 элементы.

xrange является генератором, так что это объект последовательности , который оценивает лениво.

Это правда, но в Python 3 .range() будет реализован на Python 2 .xrange(), Если вам нужно сгенерировать список, вам нужно сделать:

list(range(1,100))

Помните, используйте timeit модуль для проверки, какой из небольших фрагментов кода быстрее!

$ python -m timeit 'for i in range(1000000):' ' pass'
10 loops, best of 3: 90.5 msec per loop
$ python -m timeit 'for i in xrange(1000000):' ' pass'
10 loops, best of 3: 51.1 msec per loop

Лично я всегда использую .range()Если только я не имел дело с действительно огромными списками - как видите, по времени, для списка из миллиона записей, дополнительные издержки составляют всего 0,04 секунды. И, как указывает Кори, в Python 3.0 .xrange() уйдет и .range() в любом случае даст вам хорошее поведение итератора.

xrange сохраняет только параметры диапазона и генерирует числа по запросу. Однако реализация Python на C в настоящее время ограничивает свои аргументы C longs:

xrange(2**32-1, 2**32+1)  # When long is 32 bits, OverflowError: Python int too large to convert to C long
range(2**32-1, 2**32+1)   # OK --> [4294967295L, 4294967296L]

Обратите внимание, что в Python 3.0 есть только range и он ведет себя как 2.x xrange но без ограничений на минимальные и максимальные конечные точки.

xrange возвращает итератор и одновременно хранит только одно число в памяти. Диапазон хранит весь список чисел в памяти.

Потратьте некоторое время на Библиотечный справочник. Чем более вы знакомы с ним, тем быстрее вы сможете найти ответы на подобные вопросы. Особенно важны первые несколько глав о встроенных объектах и ​​типах.

Преимущество типа xrange заключается в том, что объект xrange всегда будет занимать один и тот же объем памяти, независимо от размера диапазона, который он представляет. Там нет последовательных преимуществ производительности.

Другой способ найти быструю информацию о конструкции Python - это строка документации и функция помощи:

print xrange.__doc__ # def doc(x): print x.__doc__ is super useful
help(xrange)

Я в шоке, никто не читал док:

Эта функция очень похожа на range(), но возвращает xrange объект вместо списка. Это непрозрачный тип последовательности, который выдает те же значения, что и соответствующий список, фактически не сохраняя их все одновременно. Преимущество xrange() над range() минимальный (так как xrange() все еще должен создавать значения, когда их запрашивают) за исключением случаев, когда очень большой диапазон используется на машине с нехваткой памяти или когда все элементы диапазона никогда не используются (например, когда цикл обычно завершается с помощью break).

range() против xrange() в python:

range() и xrange() - это две функции, которые можно использовать для итерации определенного числа циклов for в Python. В Python 3 нет xrange, но функция диапазона ведет себя как xrange в Python 2. Если вы хотите написать код, который будет работать как на Python 2, так и на Python 3, вы должны использовать range().

range() - возвращает список чисел, созданных с помощью функции range().

xrange() - эта функция возвращает объект генератора, который может использоваться для отображения чисел только путем зацикливания. Только определенный диапазон отображается по требованию и поэтому называется "ленивая оценка".

Оба реализуются по-разному и имеют разные характеристики, связанные с ними. Точки сравнения:

  1. Возвращаемый тип Память Операция Использование Скорость
  2. объем памяти
  3. Использование операции
  4. скорость

1. Тип возврата:

range() возвращает - список как тип возвращаемого значения.

xrange() возвращает - объект xrange().

# initializing a with range()
a = range(1,10000)

# initializing a with xrange()
x = xrange(1,10000)

# testing the type of a
print ("The return type of range() is : ")
print (type(a))

# testing the type of x
print ("The return type of xrange() is : ")
print (type(x))

Выход:

The return type of range() is :
<type 'list'>
The return type of xrange() is :
<type 'xrange'>

2. Память:

Переменная, хранящая диапазон, созданный range(), занимает больше памяти по сравнению с переменной, хранящей диапазон, используя xrange(). Основной причиной этого является тип возвращаемого значения range() - list, а xrange() - объект xrange().

# initializing a with range()
a = range(1,10000)

# initializing a with xrange()
x = xrange(1,10000)

# testing the size of a
print ("The size allotted using range() is : ")
print (sys.getsizeof(a))

# testing the size of a
print ("The size allotted using xrange() is : ")
print (sys.getsizeof(x))

Выход:

The size allotted using range() is : 
80064
The size allotted using xrange() is : 
40

3. Использование операций:

Поскольку range() возвращает список, все операции, которые могут быть применены к списку, могут использоваться с ним. С другой стороны, поскольку xrange() возвращает объект xrange, операции, связанные со списком, не могут быть применены к ним, что является недостатком.

# Python code to demonstrate range() vs xrange()
# on  basis of operations usage 

# initializing a with range()
a = range(1,6)

# initializing a with xrange()
x = xrange(1,6)

# testing usage of slice operation on range()
print ("The list after slicing using range is : ")
print (a[2:5])

# testing usage of slice operation on xrange()
print ("The list after slicing using xrange is : ")
print (x[2:5])

Выход:

The list after slicing using range is :
[3, 4, 5]
The list after slicing using xrange is :
Traceback (most recent call last):
  File "pp.py", line 18, in <module>
    print (x[2:5])
TypeError: sequence index must be integer, not 'slice'

4. Скорость:

Из-за того, что xrange() оценивает только объект-генератор, содержащий только те значения, которые требуются для ленивых вычислений, следовательно, быстрее в реализации, чем range().

Важные моменты:

  1. Если вы хотите написать код, который будет работать как на Python 2, так и на Python 3, используйте range(), так как функция xrange устарела в Python 3.
  2. range() работает быстрее, если повторять одну и ту же последовательность несколько раз.
  3. xrange() должен каждый раз восстанавливать целочисленный объект, но range() будет иметь реальные целочисленные объекты. (Это всегда будет работать хуже с точки зрения памяти, однако).

Ссылка

Вы найдете преимущество xrange над range в этом простом примере:

import timeit

t1 = timeit.default_timer()
a = 0
for i in xrange(1, 100000000):
    pass
t2 = timeit.default_timer()

print "time taken: ", (t2-t1)  # 4.49153590202 seconds

t1 = timeit.default_timer()
a = 0
for i in range(1, 100000000):
    pass
t2 = timeit.default_timer()

print "time taken: ", (t2-t1)  # 7.04547905922 seconds

Приведенный выше пример не отражает ничего существенно лучшего в случае xrange,

Теперь посмотрим на следующий случай, когда range действительно очень медленно, по сравнению с xrange,

import timeit

t1 = timeit.default_timer()
a = 0
for i in xrange(1, 100000000):
    if i == 10000:
        break
t2 = timeit.default_timer()

print "time taken: ", (t2-t1)  # 0.000764846801758 seconds

t1 = timeit.default_timer()
a = 0
for i in range(1, 100000000):
    if i == 10000:
        break
t2 = timeit.default_timer() 

print "time taken: ", (t2-t1)  # 2.78506207466 seconds

С range, он уже создает список от 0 до 100000000(отнимает много времени), но xrange является генератором, и он генерирует числа только на основе потребности, то есть, если итерация продолжается.

В Python-3 реализация range функциональность такая же, как у xrange в Python-2, пока они покончили с xrange в Python-3

Удачного кодирования!

range создает список, поэтому, если вы сделаете range(1, 10000000), он создаст список в памяти с 10000000 элементов. xrange - генератор, поэтому он оценивает лениво.

Это дает вам два преимущества:

  1. Вы можете перебирать более длинные списки, не получая MemoryError,
  2. Поскольку каждое число лениво разрешается, если вы остановите итерацию раньше, вы не будете тратить время на создание всего списка.

Это из соображений оптимизации.

range () создаст список значений от начала до конца (0 .. 20 в вашем примере). Это станет дорогой операцией на очень больших диапазонах.

С другой стороны, xrange () гораздо более оптимизирован. он будет вычислять следующее значение только при необходимости (через объект последовательности xrange) и не создаст список всех значений, таких как range ().

range(x,y) возвращает список каждого числа между x и y, если вы используете for петля, то range медленнее. По факту, range имеет больший индексный диапазон. range(x.y) распечатает список всех чисел между x и y

xrange(x,y) возвращается xrange(x,y) но если вы использовали for петля, то xrange быстрее. xrange имеет меньший индексный диапазон. xrange будет не только распечатывать xrange(x,y) но он все равно сохранит все числа, которые есть в нем.

[In] range(1,10)
[Out] [1, 2, 3, 4, 5, 6, 7, 8, 9]
[In] xrange(1,10)
[Out] xrange(1,10)

Если вы используете for петля, тогда это будет работать

[In] for i in range(1,10):
        print i
[Out] 1
      2
      3
      4
      5
      6
      7
      8
      9
[In] for i in xrange(1,10):
         print i
[Out] 1
      2
      3
      4
      5
      6
      7
      8
      9

При использовании петель нет большой разницы, хотя есть разница только при печати!

range (): range (1, 10) возвращает список от 1 до 10 чисел и сохраняет весь список в памяти.

xrange (): аналогично range(), но вместо возврата списка возвращает объект, который генерирует числа в диапазоне по запросу. Для цикла это немного быстрее, чем range () и более эффективно использовать память. xrange() объект как итератор и генерирует числа по требованию.(Ленивая оценка)

In [1]: range(1,10)

Out[1]: [1, 2, 3, 4, 5, 6, 7, 8, 9]

In [2]: xrange(10)

Out[2]: xrange(10)

In [3]: print xrange.__doc__

xrange([start,] stop[, step]) -> xrange object

В некоторых других ответах упоминается, что Python 3 исключил 2.x range и переименовал 2.x xrange в range, Однако, если вы не используете 3.0 или 3.1 (что никому не должно быть), это на самом деле несколько другой тип.

Как сказано в документах 3.1:

Объекты Range имеют очень небольшое поведение: они поддерживают только индексирование, итерацию и len функция.

Однако в 3.2+ range является полной последовательностью - она ​​поддерживает расширенные срезы и все методы collections.abc.Sequence с той же семантикой, что и list, *

И, по крайней мере, в CPython и PyPy (только две реализации 3.2+, которые существуют в настоящее время), он также имеет постоянные реализации index а также count методы и in оператор (до тех пор, пока вы передаете ему только целые числа). Это значит писать 123456 in r разумно в 3.2+, в то время как в 2.7 или 3.1 это было бы ужасной идеей.


* Дело в том, что issubclass(xrange, collections.Sequence) возвращается True в 2.6-2.7 и 3.0-3.1 - это ошибка, которая была исправлена ​​в 3.2 и не была портирована.

В Python 2.x

range (x) возвращает список, созданный в памяти с x элементами.

>>> a = range(5)
>>> a
[0, 1, 2, 3, 4]

xrange (x) возвращает объект xrange, который является генератором obj, который генерирует числа по требованию. они вычисляются во время цикла for (Lazy Evaluation).

Для цикла это немного быстрее, чем range () и более эффективно использовать память.

>>> b = xrange(5)
>>> b
xrange(5)

При тестировании диапазона против xrange в цикле (я знаю, что должен использовать timeit, но это было быстро взломано из памяти с помощью простого примера понимания списка), я обнаружил следующее:

import time

for x in range(1, 10):

    t = time.time()
    [v*10 for v in range(1, 10000)]
    print "range:  %.4f" % ((time.time()-t)*100)

    t = time.time()
    [v*10 for v in xrange(1, 10000)]
    print "xrange: %.4f" % ((time.time()-t)*100)

который дает:

$python range_tests.py
range:  0.4273
xrange: 0.3733
range:  0.3881
xrange: 0.3507
range:  0.3712
xrange: 0.3565
range:  0.4031
xrange: 0.3558
range:  0.3714
xrange: 0.3520
range:  0.3834
xrange: 0.3546
range:  0.3717
xrange: 0.3511
range:  0.3745
xrange: 0.3523
range:  0.3858
xrange: 0.3997 <- garbage collection?

Или, используя xrange в цикле for:

range:  0.4172
xrange: 0.3701
range:  0.3840
xrange: 0.3547
range:  0.3830
xrange: 0.3862 <- garbage collection?
range:  0.4019
xrange: 0.3532
range:  0.3738
xrange: 0.3726
range:  0.3762
xrange: 0.3533
range:  0.3710
xrange: 0.3509
range:  0.3738
xrange: 0.3512
range:  0.3703
xrange: 0.3509

Правильно ли тестируется мой фрагмент? Есть какие-нибудь комментарии по поводу более медленного экземпляра xrange? Или лучший пример:-)

xrange() и range () в python работают так же, как и для пользователя, но разница возникает, когда мы говорим о том, как выделяется память при использовании обеих функций.

Когда мы используем range (), мы выделяем память для всех переменных, которые он генерирует, поэтому его не рекомендуется использовать с большим значением no. переменных, которые будут сгенерированы.

xrange(), с другой стороны, генерирует только определенное значение за раз и может использоваться только с циклом for для печати всех требуемых значений.

Range генерирует весь список и возвращает его. xrange не делает - генерирует числа в списке по запросу.

Прочитайте следующий пост для сравнения диапазона и xrange с графическим анализом.

Диапазон Python против Xrange

xrange использует итератор (генерирует значения на лету), range возвращает список.

range() в Python 2.x

Эта функция по сути старая range() функция, которая была доступна в Python 2.x и возвращает экземпляр list объект, содержащий элементы в указанном диапазоне.

Однако эта реализация слишком неэффективна, когда дело доходит до инициализации списка с диапазоном чисел. Например,for i in range(1000000) было бы очень дорого выполнить команду, как с точки зрения использования памяти, так и времени, поскольку для этого требуется сохранение этого списка в памяти.


range() в Python 3.x а также xrange() в Python 2.x

Python 3.x представила новую реализацию range() (в то время как более новая реализация уже была доступна на Python 2.x сквозь xrange() функция).

В range()использует стратегию, известную как ленивое вычисление. Вместо того, чтобы создавать огромный список элементов в диапазоне, более новая реализация представляет классrange, легкий объект, который представляет требуемые элементы в заданном диапазоне, не сохраняя их явно в памяти (это может звучать как генераторы, но концепция ленивого вычисления отличается).


В качестве примера рассмотрим следующее:

# Python 2.x
>>> a = range(10)
>>> type(a)
<type 'list'>
>>> b = xrange(10)
>>> type(b)
<type 'xrange'>

а также

# Python 3.x
>>> a = range(10)
>>> type(a)
<class 'range'>

С помощью документов.

Python 2.7.12

>>> print range.__doc__
range(stop) -> list of integers
range(start, stop[, step]) -> list of integers

Return a list containing an arithmetic progression of integers.
range(i, j) returns [i, i+1, i+2, ..., j-1]; start (!) defaults to 0.
When step is given, it specifies the increment (or decrement).
For example, range(4) returns [0, 1, 2, 3].  The end point is omitted!
These are exactly the valid indices for a list of 4 elements.

>>> print xrange.__doc__
xrange(stop) -> xrange object
xrange(start, stop[, step]) -> xrange object

Like range(), but instead of returning a list, returns an object that
generates the numbers in the range on demand.  For looping, this is 
slightly faster than range() and more memory efficient.

Python 3.5.2

>>> print(range.__doc__)
range(stop) -> range object
range(start, stop[, step]) -> range object

Return an object that produces a sequence of integers from start (inclusive)
to stop (exclusive) by step.  range(i, j) produces i, i+1, i+2, ..., j-1.
start defaults to 0, and stop is omitted!  range(4) produces 0, 1, 2, 3.
These are exactly the valid indices for a list of 4 elements.
When step is given, it specifies the increment (or decrement).

>>> print(xrange.__doc__)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
NameError: name 'xrange' is not defined

Разница очевидна. В Python 2.x range возвращает список, xrange возвращает объект xrange, который является итеративным.

В Python 3.x range становится xrange Python 2.x, и xrange устранен.

Все это очень хорошо объяснили. Но я хотел увидеть это сам. Я использую python3. Итак, я открыл монитор ресурсов (в Windows!) И сначала выполнил следующую команду:

a=0
for i in range(1,100000):
    a=a+i

а затем проверил изменения в памяти "В использовании". Это было незначительно. Затем я запустил следующий код:

for i in list(range(1,100000)):
    a=a+i

И это заняло большой кусок памяти для использования, мгновенно. И я был убежден. Вы можете попробовать это для себя.

Если вы используете Python 2X, тогда замените range () на xrange() в первом коде, а list (range ()) - range ().

Какие?
range возвращает статический список во время выполнения.
xrange возвращает object (который действует как генератор, хотя, конечно, не один), из которого генерируются значения, когда и когда это требуется.

Когда использовать что?

  • использование xrange если вы хотите создать список для гигантского диапазона, скажем, 1 миллиард, особенно если у вас есть "чувствительная к памяти система", такая как сотовый телефон.
  • использование range если вы хотите перебрать список несколько раз.

PS: Python 3.x range функция == Python 2.x xrange функция.

По требованию к сканированию / печати 0-N предметов, range и xrange работает следующим образом.

range () - создает новый список в памяти, принимает от 0 до N элементов (всего N+1) и печатает их. xrange() - создает экземпляр итератора, который просматривает элементы и сохраняет в памяти только текущий обнаруженный элемент, следовательно, все время используя один и тот же объем памяти.

Если требуемый элемент находится в начале списка только тогда, он экономит много времени и памяти.

Разница уменьшается для меньших аргументов range(..) / xrange(..):

$ python -m timeit "for i in xrange(10111):" " for k in range(100):" "  pass"
10 loops, best of 3: 59.4 msec per loop

$ python -m timeit "for i in xrange(10111):" " for k in xrange(100):" "  pass"
10 loops, best of 3: 46.9 msec per loop

В этом случае xrange(100) только на 20% эффективнее.

Кроме того, если сделать list(xrange(...)) будет эквивалентно range(...),

Так list медленный.

Также xrange на самом деле не полностью закончить последовательность

Так вот почему это не список, это xrange объект

Range возвращает список, в то время как xrange возвращает объект xrange, который занимает одну и ту же память независимо от размера диапазона, так как в этом случае генерируется только один элемент, и он доступен для каждой итерации, тогда как в случае использования диапазона все элементы генерируются одновременно и доступны в памяти.

range:-range заполнит все сразу. Это означает, что каждый номер диапазона будет занимать память.

xrange: -xrange - это что-то вроде генератора, он появляется, когда вы хотите диапазон чисел, но вы не хотите, чтобы они были сохранены, например, когда вы хотите использовать в for loop.so эффективное использование памяти.

Смотрите этот пост, чтобы найти разницу между range и xrange:

Цитировать:

range возвращает именно то, что вы думаете: список последовательных целых чисел, определенной длины, начиная с 0. xrangeоднако возвращает "объект xrange", который очень похож на итератор

Другие вопросы по тегам