Несоответствие между%time и%timeit в IPython
Я сталкиваюсь со странной ситуацией, которую не могу объяснить. Вот мой тестовый выбор времени генерации большого списка кортежей:
In [1]: def get_list_of_tuples():
...: return [(i,) for i in range(10**6)]
...:
In [2]: %time res = get_list_of_tuples()
CPU times: user 0.93 s, sys: 0.08 s, total: 1.01 s
Wall time: 0.98 s
In [3]: %timeit res = get_list_of_tuples()
1 loops, best of 3: 92.1 ms per loop
Как видите, генерация этого большого списка кортежей занимает чуть меньше секунды. timeit сообщает, что время выполнения составляет около 0,1 секунды. Почему в двух отчетах такая большая разница?
(Проверено на IPython 0.11, Python 2.6.5.)
3 ответа
Основное отличие заключается в том, что " по умолчанию timeit() временно отключает сборку мусора во время синхронизации".
Включение сборки мусора возвращает результаты, аналогичные показанным в вопросе, т.е. время выполнения со сборкой мусора на величину больше, чем без:
In [1]: import timeit
# Garbage collection on.
In [2]: N = 10; timeit.timeit('[(i,) for i in range(10**6)]', 'gc.enable()', number=N) / N
Out[2]: 0.74884700775146484
# 749 ms per loop.
# Garbage collection off.
In [3]: N = 10; timeit.timeit('[(i,) for i in range(10**6)]', number=N) / N
Out[3]: 0.15906109809875488
# 159 ms per loop.
Benoit,
Если я использую Python 2.6.6 и IPython 0.10, я вижу похожие ответы на ваши. Используя Python 2.7.1 и IPython 0.10.1, я получаю нечто более разумное:
% ipython
Python 2.7.1 (r271:86832, Nov 3 2011, 16:23:57)
Type "copyright", "credits" or "license" for more information.
IPython 0.10.1 -- An enhanced Interactive Python.
In [1]: def get_list_of_tuples():
...: return [(i,) for i in range(10**6)]
...:
In [2]: %time res = get_list_of_tuples()
CPU times: user 0.25 s, sys: 0.10 s, total: 0.35 s
Wall time: 0.35 s
In [3]: %timeit res = get_list_of_tuples()
1 loops, best of 3: 215 ms per loop
%time - выполняет оператор только один раз и имеет ошибку измерения
%timeit - запускает оператор несколько раз и выбирает наиболее точное время.
См. Документацию модуля Python Timeit для некоторых объяснений.