Описание тега knights-landing

Knights Landing — это название семейства продуктов Intel Xeon Phi второго поколения. Используйте этот тег, если у вас есть вопросы, относящиеся к работе на одном из этих процессоров.
1 ответ

Ошибка доступа к памяти с помощью _mm512_i64gather_pd()

Я пытаюсь использовать очень простой пример инструкций по сбору AVX-512: double __attribute__((aligned(64))) array3[17] = {1.0, 2.0, 3.0, 4.0, 5.0, 6.0, 7.0, 8.0, 9.0, 10.0, 11.0, 12.0, 13.0, 14.0, 15.0, 16.0, 17.0}; int __attribute__((aligned(64)))…
20 дек '18 в 14:33
0 ответов

Преобразовать массив из восьми байтов в восемь целых

Я работаю с Xeon Phi Knights Landing. Мне нужно сделать операцию сбора из массива пар. Список индексов происходит из массива символов. Операции по сбору либо _mm512_i32gather_pd или же _mm512_i64gather_pd, Насколько я понимаю, мне нужно либо преобра…
24 ноя '18 в 14:25
0 ответов

Экран htop на маленький

Я использую htop для мониторинга распараллеливания программы, работающей на архитектуре Intels Knight Landing. Проблема в том, что он имеет 68 ядер x 4 Hyper Thread, и это не подходит ни на одном из моих экранов: Как видите, ядра 58-68 отсутствуют. …
19 авг '18 в 16:11
1 ответ

Как обнаружить Xeon Phi (приземление рыцарей)

Инженеры Intel написали, что мы должны использовать VZEROUPPER/VZEROALL, чтобы избежать дорогостоящего перехода в состояние без VEX на всех процессорах, включая будущий процессор Xeon, но не на Xeon Phi: https://software.intel.com/pt-br/node/704023 …
09 июн '17 в 20:12
1 ответ

Поддерживают ли ядра Airmont инструкции по SIMD для Knight's Landing Xeon Phi?

Согласно источнику на странице Википедии на чипе Knight's Landing, у него есть ядра Airmont. Согласно этой странице, эти ядра поддерживают инструкции SSE4.2, то есть инструкции SIMD в регистрах SIMD. Это действительно так? Если да, то какова на само…
1 ответ

Что такое _kmp_fork_barrier и как посмотреть, есть ли дисбаланс нагрузки?

Я использую Intel VTune Amplifier, чтобы увидеть, как масштабируется мое параллельное приложение. Обратите внимание, я не использую какой-либо явный механизм блокировки Он хорошо масштабируется на моем 4-ядерном ноутбуке (учитывая, что есть части ал…
1 ответ

Добавление флага компилятора Intel "-march=native" в строку компиляции приводит к исключению с плавающей запятой в KNL

У меня есть код, который я запускаю на процессоре Intel Xeon Phi Knights Landing (KNL) 7210 (64 ядра) (это ПК в собственном режиме) и использую компилятор Intel C++ (icpc) версии 17.0.4. Также я запускаю тот же код на процессоре Intel Core i7, где в…
0 ответов

Фильтр Собеля (реализация OpenMP)

Я пытаюсь реализовать параллельную + векторизованную версию Sobel Filter в C с прагмами OpenMP для параллелизации и #pragma simd для векторизации. Мой ввод - это изображение.pgm размером 1024 на 1024. Я компилирую его с помощью Intel Compiler на про…
08 июн '17 в 08:30
1 ответ

Доступные темы в Knights Landing

Я программирую на узле Knights Landing, который имеет 68 ядер и 4 гиперпотока / ядро. Я работаю над гибридным приложением MPI/OpenMP. Мой вопрос заключается в том, предназначены ли эти 4 гиперпотока для использования в качестве потоков OpenMP или ка…
3 ответа

Какой самый эффективный способ очистить один или несколько регистров ZMM в Knights Landing?

Скажем, я хочу очистить 4 zmm регистров. Будет ли следующий код обеспечивать максимальную скорость? vpxorq zmm0, zmm0, zmm0 vpxorq zmm1, zmm1, zmm1 vpxorq zmm2, zmm2, zmm2 vpxorq zmm3, zmm3, zmm3 На AVX2, если я хотел очистить регистры ymm, vpxor бы…
16 июн '17 в 00:27
2 ответа

Могу ли я компилировать программы Go на процессорах Xeon Phi (Knight's Landing)?

Я любитель, которому нравится запускать свои собственные программы на Go, и по мере того, как процессоры Xeon Phi становятся старше, они также становятся чрезвычайно дешевыми. Так дешево, что я могу построить машину с двумя сокетами 2015/16 года мен…
20 янв '21 в 01:17