Сравнение производительности Caffe2 и CUDA
Кто-нибудь выполнил сравнение производительности caffe2 и настроенного вручную C/C++ CUDA (т.е. полностью встроенного в C или C++ с cuda runtime/ driver api)?
Было бы здорово, если бы вы могли поделиться результатами.
Спасибо