Агентное моделирование: проблема производительности: Python против NetLogo & Repast

Я копирую небольшой фрагмент имитационной модели агента Sugarscape в Python 3. Я обнаружил, что производительность моего кода примерно в 3 раза ниже, чем у NetLogo. Вероятно, это проблема моего кода, или это может быть внутреннее ограничение Python?

Очевидно, это всего лишь фрагмент кода, но именно здесь Python тратит две трети времени выполнения. Я надеюсь, что если я напишу что-то действительно неэффективное, оно может появиться в этом фрагменте:

UP = (0, -1)
RIGHT = (1, 0)
DOWN = (0, 1)
LEFT = (-1, 0)
all_directions = [UP, DOWN, RIGHT, LEFT]
# point is just a tuple (x, y)
def look_around(self):
    max_sugar_point = self.point
    max_sugar = self.world.sugar_map[self.point].level
    min_range = 0

    random.shuffle(self.all_directions)
    for r in range(1, self.vision+1):
        for d in self.all_directions:
            p = ((self.point[0] + r * d[0]) % self.world.surface.length,
                (self.point[1] + r * d[1]) % self.world.surface.height)
            if self.world.occupied(p): # checks if p is in a lookup table (dict)
                continue
            if self.world.sugar_map[p].level > max_sugar:
                max_sugar = self.world.sugar_map[p].level
                max_sugar_point = p
    if max_sugar_point is not self.point:
        self.move(max_sugar_point)

Примерно эквивалентный код в NetLogo (этот фрагмент делает немного больше, чем функция Python выше):

; -- The SugarScape growth and motion procedures. --
to M    ; Motion rule (page 25)
    locals [ps p v d]
    set ps (patches at-points neighborhood) with [count turtles-here = 0]
    if (count ps > 0) [
        set v psugar-of max-one-of ps [psugar]              ; v is max sugar w/in vision
        set ps ps with [psugar = v]                         ; ps is legal sites w/ v sugar
        set d distance min-one-of ps [distance myself]      ; d is min dist from me to ps agents
        set p random-one-of ps with [distance myself = d]   ; p is one of the min dist patches
        if (psugar >= v and includeMyPatch?) [set p patch-here]
        setxy pxcor-of p pycor-of p                         ; jump to p
        set sugar sugar + psugar-of p                       ; consume its sugar
        ask p [setpsugar 0]                                 ; .. setting its sugar to 0
    ]
    set sugar sugar - metabolism    ; eat sugar (metabolism)
    set age age + 1
end

На моем компьютере код Python занимает 15,5 секунд, чтобы выполнить 1000 шагов; на том же ноутбуке симуляция NetLogo, работающая на Java внутри браузера, завершает 1000 шагов менее чем за 6 секунд.

РЕДАКТИРОВАТЬ: Только что проверил Repast, используя реализацию Java. И это примерно так же, как NetLogo на 5,4 сек. Недавние сравнения между Java и Python не дают никаких преимуществ для Java, поэтому я думаю, что виноват только мой код?

РЕДАКТИРОВАТЬ: Я понимаю, что MASON должен быть даже быстрее, чем Repast, и все же он все еще работает Java в конце.

4 ответа

Решение

Это, вероятно, не даст резкого ускорения, но вы должны знать, что локальные переменные в Python намного быстрее по сравнению с доступом к глобальным или атрибутам. Таким образом, вы можете попробовать присвоить некоторые значения, которые используются во внутреннем цикле, локальным, например так:

def look_around(self):
    max_sugar_point = self.point
    max_sugar = self.world.sugar_map[self.point].level
    min_range = 0

    selfx = self.point[0]
    selfy = self.point[1]
    wlength = self.world.surface.length
    wheight = self.world.surface.height
    occupied = self.world.occupied
    sugar_map = self.world.sugar_map
    all_directions = self.all_directions

    random.shuffle(all_directions)
    for r in range(1, self.vision+1):
        for dx,dy in all_directions:
            p = ((selfx + r * dx) % wlength,
                (selfy + r * dy) % wheight)
            if occupied(p): # checks if p is in a lookup table (dict)
                continue
            if sugar_map[p].level > max_sugar:
                max_sugar = sugar_map[p].level
                max_sugar_point = p
    if max_sugar_point is not self.point:
        self.move(max_sugar_point)

Вызовы функций в Python также имеют относительно высокие издержки (по сравнению с Java), поэтому вы можете попытаться оптимизировать их, заменив occupied функция с прямым поиском в словаре.

Вы также должны взглянуть на психо. Это своевременный компилятор для Python, который в некоторых случаях может значительно повысить скорость. Тем не менее, он пока не поддерживает Python 3.x, поэтому вам нужно будет использовать более старую версию Python.

Я собираюсь догадаться, что так neighborhood Реализация в NetLogo отличается от двойного цикла, который у вас есть. В частности, я думаю, что они предварительно рассчитывают вектор соседства, как

n = [ [0,1],[0,-1],[1,0],[-1,0]....]

(вам понадобится другой для vision=1,2,...), а затем используйте только один цикл n вместо вложенного цикла, как вы делаете. Это устраняет необходимость в умножениях.

Я не думаю, что это даст вам ускорение в 3 раза.

Это старый вопрос, но я предлагаю вам изучить использование NumPy для ускорения ваших операций. Места, в которых вы используете диктовки и списки, которые логически организованы (1-, 2-, 3- или N-мерная сетка) однородного объекта данных (все целые числа или все числа с плавающей точкой и т. Д.), Будут иметь меньшие издержки при представлении и доступе как Numpy массивы.

http://numpy.org/

Вот сравнительно свежее сравнение NetLogo и одной версии Repast. Я бы не обязательно предполагал, что Repast работает быстрее. NETLogo, кажется, содержит несколько очень умных алгоритмов, которые могут компенсировать любые расходы. http://condor.depaul.edu/slytinen/abm/Lytinen-Railsback-EMCSR_2012-02-17.pdf

Другие вопросы по тегам