Описание тега knights-landing
Knights Landing — это название семейства продуктов Intel Xeon Phi второго поколения. Используйте этот тег, если у вас есть вопросы, относящиеся к работе на одном из этих процессоров.
1
ответ
Ошибка доступа к памяти с помощью _mm512_i64gather_pd()
Я пытаюсь использовать очень простой пример инструкций по сбору AVX-512: double __attribute__((aligned(64))) array3[17] = {1.0, 2.0, 3.0, 4.0, 5.0, 6.0, 7.0, 8.0, 9.0, 10.0, 11.0, 12.0, 13.0, 14.0, 15.0, 16.0, 17.0}; int __attribute__((aligned(64)))…
20 дек '18 в 14:33
0
ответов
Преобразовать массив из восьми байтов в восемь целых
Я работаю с Xeon Phi Knights Landing. Мне нужно сделать операцию сбора из массива пар. Список индексов происходит из массива символов. Операции по сбору либо _mm512_i32gather_pd или же _mm512_i64gather_pd, Насколько я понимаю, мне нужно либо преобра…
24 ноя '18 в 14:25
0
ответов
Экран htop на маленький
Я использую htop для мониторинга распараллеливания программы, работающей на архитектуре Intels Knight Landing. Проблема в том, что он имеет 68 ядер x 4 Hyper Thread, и это не подходит ни на одном из моих экранов: Как видите, ядра 58-68 отсутствуют. …
19 авг '18 в 16:11
1
ответ
Как обнаружить Xeon Phi (приземление рыцарей)
Инженеры Intel написали, что мы должны использовать VZEROUPPER/VZEROALL, чтобы избежать дорогостоящего перехода в состояние без VEX на всех процессорах, включая будущий процессор Xeon, но не на Xeon Phi: https://software.intel.com/pt-br/node/704023 …
09 июн '17 в 20:12
1
ответ
Поддерживают ли ядра Airmont инструкции по SIMD для Knight's Landing Xeon Phi?
Согласно источнику на странице Википедии на чипе Knight's Landing, у него есть ядра Airmont. Согласно этой странице, эти ядра поддерживают инструкции SSE4.2, то есть инструкции SIMD в регистрах SIMD. Это действительно так? Если да, то какова на само…
16 мар '17 в 22:09
1
ответ
Что такое _kmp_fork_barrier и как посмотреть, есть ли дисбаланс нагрузки?
Я использую Intel VTune Amplifier, чтобы увидеть, как масштабируется мое параллельное приложение. Обратите внимание, я не использую какой-либо явный механизм блокировки Он хорошо масштабируется на моем 4-ядерном ноутбуке (учитывая, что есть части ал…
28 апр '17 в 10:48
1
ответ
Добавление флага компилятора Intel "-march=native" в строку компиляции приводит к исключению с плавающей запятой в KNL
У меня есть код, который я запускаю на процессоре Intel Xeon Phi Knights Landing (KNL) 7210 (64 ядра) (это ПК в собственном режиме) и использую компилятор Intel C++ (icpc) версии 17.0.4. Также я запускаю тот же код на процессоре Intel Core i7, где в…
01 окт '18 в 13:16
0
ответов
Фильтр Собеля (реализация OpenMP)
Я пытаюсь реализовать параллельную + векторизованную версию Sobel Filter в C с прагмами OpenMP для параллелизации и #pragma simd для векторизации. Мой ввод - это изображение.pgm размером 1024 на 1024. Я компилирую его с помощью Intel Compiler на про…
08 июн '17 в 08:30
1
ответ
Доступные темы в Knights Landing
Я программирую на узле Knights Landing, который имеет 68 ядер и 4 гиперпотока / ядро. Я работаю над гибридным приложением MPI/OpenMP. Мой вопрос заключается в том, предназначены ли эти 4 гиперпотока для использования в качестве потоков OpenMP или ка…
21 окт '17 в 16:25
3
ответа
Какой самый эффективный способ очистить один или несколько регистров ZMM в Knights Landing?
Скажем, я хочу очистить 4 zmm регистров. Будет ли следующий код обеспечивать максимальную скорость? vpxorq zmm0, zmm0, zmm0 vpxorq zmm1, zmm1, zmm1 vpxorq zmm2, zmm2, zmm2 vpxorq zmm3, zmm3, zmm3 На AVX2, если я хотел очистить регистры ymm, vpxor бы…
16 июн '17 в 00:27
2
ответа
Могу ли я компилировать программы Go на процессорах Xeon Phi (Knight's Landing)?
Я любитель, которому нравится запускать свои собственные программы на Go, и по мере того, как процессоры Xeon Phi становятся старше, они также становятся чрезвычайно дешевыми. Так дешево, что я могу построить машину с двумя сокетами 2015/16 года мен…
20 янв '21 в 01:17