Почему вывод Keras LSTM медленнее на jetson gpu, чем на jetson cpu?

Я проверил производительность вывода на JETSON.

Я использовал следующий код.

https://github.com/keras-team/keras/blob/master/examples/lstm_text_generation.py

В результате о скорости вывода

  • GPU

    • LSTM: умозаключение: 0.08-0.17s
    • CuDNNLSTM: вывод: 0,006-0,01 с
  • ЦПУ

    • LSTM: вывод: 0,006 - 0,013 с

Код проверки скорости вывода следующий.

`` `

@contextmanager
def timer(title):
    t0 = time.time()
    yield
    print("{} - done in {:.10f}s".format(title, time.time() - t0))

Я не могу понять, почему вывод LSTM на GPU медленнее, чем CPU.

Кто-нибудь может мне помочь, почему вывод LSTM на GPU медленнее, чем CPU?

Информация об окружающей среде

  • версия python: 3.5.2
  • Версия tennsflow: 1.9.0rc0
  • Керас версия: 2.2.2
  • версия cuda: 9.0
  • Джетсон: TX2

0 ответов

Другие вопросы по тегам