Агентное моделирование: проблема производительности: Python против NetLogo & Repast
Я копирую небольшой фрагмент имитационной модели агента Sugarscape в Python 3. Я обнаружил, что производительность моего кода примерно в 3 раза ниже, чем у NetLogo. Вероятно, это проблема моего кода, или это может быть внутреннее ограничение Python?
Очевидно, это всего лишь фрагмент кода, но именно здесь Python тратит две трети времени выполнения. Я надеюсь, что если я напишу что-то действительно неэффективное, оно может появиться в этом фрагменте:
UP = (0, -1)
RIGHT = (1, 0)
DOWN = (0, 1)
LEFT = (-1, 0)
all_directions = [UP, DOWN, RIGHT, LEFT]
# point is just a tuple (x, y)
def look_around(self):
max_sugar_point = self.point
max_sugar = self.world.sugar_map[self.point].level
min_range = 0
random.shuffle(self.all_directions)
for r in range(1, self.vision+1):
for d in self.all_directions:
p = ((self.point[0] + r * d[0]) % self.world.surface.length,
(self.point[1] + r * d[1]) % self.world.surface.height)
if self.world.occupied(p): # checks if p is in a lookup table (dict)
continue
if self.world.sugar_map[p].level > max_sugar:
max_sugar = self.world.sugar_map[p].level
max_sugar_point = p
if max_sugar_point is not self.point:
self.move(max_sugar_point)
Примерно эквивалентный код в NetLogo (этот фрагмент делает немного больше, чем функция Python выше):
; -- The SugarScape growth and motion procedures. --
to M ; Motion rule (page 25)
locals [ps p v d]
set ps (patches at-points neighborhood) with [count turtles-here = 0]
if (count ps > 0) [
set v psugar-of max-one-of ps [psugar] ; v is max sugar w/in vision
set ps ps with [psugar = v] ; ps is legal sites w/ v sugar
set d distance min-one-of ps [distance myself] ; d is min dist from me to ps agents
set p random-one-of ps with [distance myself = d] ; p is one of the min dist patches
if (psugar >= v and includeMyPatch?) [set p patch-here]
setxy pxcor-of p pycor-of p ; jump to p
set sugar sugar + psugar-of p ; consume its sugar
ask p [setpsugar 0] ; .. setting its sugar to 0
]
set sugar sugar - metabolism ; eat sugar (metabolism)
set age age + 1
end
На моем компьютере код Python занимает 15,5 секунд, чтобы выполнить 1000 шагов; на том же ноутбуке симуляция NetLogo, работающая на Java внутри браузера, завершает 1000 шагов менее чем за 6 секунд.
РЕДАКТИРОВАТЬ: Только что проверил Repast, используя реализацию Java. И это примерно так же, как NetLogo на 5,4 сек. Недавние сравнения между Java и Python не дают никаких преимуществ для Java, поэтому я думаю, что виноват только мой код?
РЕДАКТИРОВАТЬ: Я понимаю, что MASON должен быть даже быстрее, чем Repast, и все же он все еще работает Java в конце.
4 ответа
Это, вероятно, не даст резкого ускорения, но вы должны знать, что локальные переменные в Python намного быстрее по сравнению с доступом к глобальным или атрибутам. Таким образом, вы можете попробовать присвоить некоторые значения, которые используются во внутреннем цикле, локальным, например так:
def look_around(self):
max_sugar_point = self.point
max_sugar = self.world.sugar_map[self.point].level
min_range = 0
selfx = self.point[0]
selfy = self.point[1]
wlength = self.world.surface.length
wheight = self.world.surface.height
occupied = self.world.occupied
sugar_map = self.world.sugar_map
all_directions = self.all_directions
random.shuffle(all_directions)
for r in range(1, self.vision+1):
for dx,dy in all_directions:
p = ((selfx + r * dx) % wlength,
(selfy + r * dy) % wheight)
if occupied(p): # checks if p is in a lookup table (dict)
continue
if sugar_map[p].level > max_sugar:
max_sugar = sugar_map[p].level
max_sugar_point = p
if max_sugar_point is not self.point:
self.move(max_sugar_point)
Вызовы функций в Python также имеют относительно высокие издержки (по сравнению с Java), поэтому вы можете попытаться оптимизировать их, заменив occupied
функция с прямым поиском в словаре.
Вы также должны взглянуть на психо. Это своевременный компилятор для Python, который в некоторых случаях может значительно повысить скорость. Тем не менее, он пока не поддерживает Python 3.x, поэтому вам нужно будет использовать более старую версию Python.
Я собираюсь догадаться, что так neighborhood
Реализация в NetLogo отличается от двойного цикла, который у вас есть. В частности, я думаю, что они предварительно рассчитывают вектор соседства, как
n = [ [0,1],[0,-1],[1,0],[-1,0]....]
(вам понадобится другой для vision=1,2,...), а затем используйте только один цикл n
вместо вложенного цикла, как вы делаете. Это устраняет необходимость в умножениях.
Я не думаю, что это даст вам ускорение в 3 раза.
Это старый вопрос, но я предлагаю вам изучить использование NumPy для ускорения ваших операций. Места, в которых вы используете диктовки и списки, которые логически организованы (1-, 2-, 3- или N-мерная сетка) однородного объекта данных (все целые числа или все числа с плавающей точкой и т. Д.), Будут иметь меньшие издержки при представлении и доступе как Numpy массивы.
Вот сравнительно свежее сравнение NetLogo и одной версии Repast. Я бы не обязательно предполагал, что Repast работает быстрее. NETLogo, кажется, содержит несколько очень умных алгоритмов, которые могут компенсировать любые расходы. http://condor.depaul.edu/slytinen/abm/Lytinen-Railsback-EMCSR_2012-02-17.pdf