Описание тега intel-mic

Архитектура Intel с множеством интегрированных ядер
1 ответ

libiomp5.so (с поддержкой ompt) не может вызвать ompt_intialize() в разгрузочной среде openmp

Я запускаю разгрузочное openmp-приложение Intel MIC, используя openmp runtime (с поддержкой ompt, как на стороне процессора, так и на стороне MIC), в то время как libiomp5.so на стороне процессора может запускать его ompt_intialize() и получать данн…
19 ноя '15 в 07:33
1 ответ

Управляйте операциями Intel MIC SIMD вручную с помощью встроенных функций или инструкций

Я хочу вручную управлять своим кодом SIMD-операциями на MIC и написать внутреннюю информацию ниже _k_mask = _mm512_int2mask(0x7ff); // 0000 0111 1111 1111 _tempux2_512 = _mm512_mask_loadunpacklo_ps(_tempux2_512,_k_mask, &u_x[POSITION_INDEX_X(k,j…
17 фев '14 в 04:06
1 ответ

Получить конкретную модель Xeon Phi

Я пытаюсь найти точную модель сопроцессора Xeon Phi, который я использую. Я запускаю micpinfo и вот что я получаю ***************************/opt/intel/mic/bin/micinfo*************************** MicInfo Utility Log Created Fri Jan 10 13:09:40 2014 S…
10 янв '14 в 18:14
1 ответ

Неопределенная ссылка при использовании встроенного

Я хочу проверить SIMD, свойственную Xeon Phi. Поэтому я написал следующий код: #pragma offload target(mic) in(a:length(N)) #pragma omp parallel for for(int i=0;i<16;++i){ __m512i p ; p = _mm512_loadunpackhi_epi64(p, &a[i*10]); } При компиляци…
24 июн '13 в 06:27
1 ответ

Intel MIC - ошибка разгрузки: передача данных

У меня проблема с передачей данных с сопроцессора Intel Xeon Phi на центральный процессор. Я пытаюсь реализовать вычисления с использованием модели разгрузки. В начале моих вычислений я передаю все данные в сопроцессор (один массив). После вычислени…
12 дек '15 в 16:09
1 ответ

Назначение Xeon-Phi процессу MPI

Моя система имеет две карты xeon-phi, подключенные к одному узлу. Я пытаюсь запустить распределенный код MPI, который использует ускорение xeon-phi в режиме разгрузки. Мне интересно, если я запускаю два процесса MPI на узел, как бы я назначил xeon-p…
05 апр '14 в 19:12
1 ответ

Что нужно, чтобы разгрузка OpenACC/OpenMP4.0 на nvidia/mic работала с GCC?

Я пытаюсь понять, как именно я могу использовать OpenACC для выгрузки вычислений на мой графический процессор nvidia на GCC 5.3. Чем больше я гуглю, тем больше путаюсь. Все руководства, которые я нахожу, включают перекомпиляцию всего gcc вместе с дв…
09 июл '16 в 15:40
2 ответа

Другая среда при запуске sudo от имени пользователя root?

Я пытаюсь установить сопроцессор Xeon Phi. Специфическое поведение, вероятно, связано с используемыми инструментами - мой вопрос носит более общий характер. Когда я выполняю команду как root, я получаю ошибку сегментации. Когда я выполняю его как ro…
03 апр '13 в 15:22
1 ответ

Как отключить Intel XEON PH сопроцессор?

У меня есть сервер с четырьмя микрофонными картами (mic0-mic3), и он работает хорошо. Я хочу отключить некоторые микрофоны, например mic3, теперь доступен только mic0 - mic2. что я должен делать?
02 авг '16 в 01:59
1 ответ

Запуск Haskell на Xeon-Phi

Есть ли способ скомпилировать Haskell для запуска на сопроцессоре Xeon Phi? Некоторые исследователи из Intel недавно сообщили о компиляторе исследований Haskell (который не является общедоступным, что делает их результаты практически невоспроизводим…
07 мар '14 в 14:49
1 ответ

Требуемое время для выгрузки функции в Intel Xeon Phi

Существует ли заранее определенное время, необходимое для вызова разгрузки для передачи данных (параметров) функции с хоста на Intel MIC(сопроцессор Xeon Phi серии 3120)? В частности, я выполняю вызов разгрузки ("#pragma offload target(mic)") для фу…
28 ноя '17 в 22:39
3 ответа

Разгрузи демон на xeon phi 5110p

Мне известно, что у сопроцессора Intel Xeon phi SE10X есть 61 ядро, и предлагается использовать только 60 ядер, поскольку одно ядро ​​используется для демона разгрузки. Кроме того, так как сопроцессор Intel Xeon Phi 5110P имеет 60 ядер, предлагается…
10 июн '13 в 06:13
1 ответ

Разгрузка Intel MIC - как это работает с STL?

Я работаю с системой, которая реализована в коде C++/OpenMP, и она повсеместно использует структуры данных STL и Eigen. С алгоритмической точки зрения код кажется отличным кандидатом на ускорение с новыми картами Intel MIC ( Xeon Phi). Типичный пара…
31 мар '13 в 08:16
1 ответ

Как провести различие между процессорами Intel Xeon Phi 7120P, 7120X, 7120D, 7120A

У меня есть Xeon phi сопроцессор 7120P.Когда я запускаю micinfo, я вижу, что SKU платы будет C0PRQ-7120 P/A/X/D.Я заметил, что SMC HW Revision сообщает о продукте 300W Passive CS, и я прочитал на tomshardware, что P означает пассивное охлаждение для…
27 июн '14 в 06:06
0 ответов

Ошибка прагмы разгрузки Intel MIC

Что это за ошибка? Не могу найти ничего полезного, прибегая к помощи * об этом:/ error: this pragma must immediately precede a statement #pragma offload target(mic) \ ^ Изменить 1: это моя прагма: #pragma offload target(mic) \ in (v1: length(B)) \ i…
20 мар '14 в 14:03
3 ответа

Способы ускорения сокращения операций на процессорах Xeon, GPU и Xeon Phi

У меня есть приложение, где операции сокращения (например, сумма, максимум) на большой матрице являются узким местом. Мне нужно сделать это как можно быстрее. Есть ли в Mkl векторные инструкции для этого? Есть ли специальный аппаратный блок для рабо…
22 июл '14 в 16:21
1 ответ

loaddup_pd/unpacklo_pd на Xeon Phi

Если у меня есть следующие двойные числа в векторе SIMD шириной 512, как в регистре Xeon Phi: m0 = |b4|a4|b3|a3|b2|a2|b1|a1| Можно ли сделать это в: m0_d = |a4|a4|a3|a3|a2|a2|a1|a1| используя одну инструкцию? Кроме того, поскольку для двойников не с…
12 мар '13 в 05:09
0 ответов

Будет ли _mm512_mask_prefetch_i32gather_ps() предварительно извлекать целую строку кэша для каждого элемента?

Собрать предварительную выборку _mm512_mask_prefetch_i32gather_ps может использоваться для предварительной выборки 32-битных чисел в Knights Corner. Поскольку соответствующей встроенной функции для двойников не существует, как следует использовать э…
08 июл '14 в 09:08
1 ответ

Scatter/Gather in Xeon Phi

Я имел в виду руководство Intel по набору инструкций Xeon Phi и не смог понять, как работают инструкции разброса / сбора. Предположим, если у меня есть следующий вектор двойных чисел: A-> |b4|a4|b3|a3|b2|a2|b1|a1| Можно ли создать 4 вектора следу…
12 мар '13 в 07:33
1 ответ

Выгрузка в intel MIC с использованием выровненных данных

Когда я компилирую код ниже, я получаю предупреждение: src/parallel_hashing.cpp(50): warning #3218: *MIC* class/struct may fail when offloaded because this field is misaligned or contains data that is misaligned __declspec(align(64)) list<HashEnt…
11 дек '15 в 08:51