Почему вывод Keras LSTM медленнее на jetson gpu, чем на jetson cpu?
Я проверил производительность вывода на JETSON.
Я использовал следующий код.
https://github.com/keras-team/keras/blob/master/examples/lstm_text_generation.py
В результате о скорости вывода
GPU
- LSTM: умозаключение: 0.08-0.17s
- CuDNNLSTM: вывод: 0,006-0,01 с
ЦПУ
- LSTM: вывод: 0,006 - 0,013 с
Код проверки скорости вывода следующий.
`` `
@contextmanager
def timer(title):
t0 = time.time()
yield
print("{} - done in {:.10f}s".format(title, time.time() - t0))
Я не могу понять, почему вывод LSTM на GPU медленнее, чем CPU.
Кто-нибудь может мне помочь, почему вывод LSTM на GPU медленнее, чем CPU?
Информация об окружающей среде
- версия python: 3.5.2
- Версия tennsflow: 1.9.0rc0
- Керас версия: 2.2.2
- версия cuda: 9.0
- Джетсон: TX2