Самый быстрый многопоточный итеративный разрежитель на процессоре?

Библиотека Intel MKL предлагает оптимизированный набор многопоточных функций, но в случае итеративного разреженного решателя (ISS) предобусловленный метод сопряженного градиента не кажется простым для потоковой обработки.

Чтобы быть более точным, используя методы предварительной обработки, такие как неполная факторизация Холецкого или ILU, в некоторой точке требуются разреженные треугольные решатели, но соответствующая функция MKL для выполнения треугольного решения mkl_cspblas_?csrtrsv не с резьбой. У меня вопрос, есть ли какие-нибудь разреженные библиотеки решателей, чтобы побить текущую версию MKL (которая не является полностью поточной) на многоядерных процессорах?

1 ответ

Я не знаю, превосходит ли он MKL - это, в конце концов, исследовательский проект, но есть доступная ветвь OpemMP+MPI в смешанном режиме PETSc. В экспериментах моей группы с реализацией SpMV она хорошо подходила для простых матриц, но не для более сложных, с которыми мы имеем дело регулярно. Возможно, вам повезет больше, в зависимости от вашей проблемы.

Другие вопросы по тегам