loss.backward() pytorch 1.0 медленно работает на Tesla V100
Я использую сеть U-Net 3D на Titan XP и V100 и обнаружил, что V100 намного медленнее, чем Titan XP. Причина в loss.backward()
занимает 5 секунд / эпоха в V100 по сравнению с 1 секундой / эпохой в Titan XP. Кто-нибудь может дать некоторые подсказки? Благодарю.
Наше окружение:
- Анаконда среда.
Python 3.6.6
Pytorch 1.0.1
,CUDA 10.0
,CUDNN 7.4.2
,NVIDIA driver 410.79
,