Описание тега intel-mic
Архитектура Intel с множеством интегрированных ядер
1
ответ
libiomp5.so (с поддержкой ompt) не может вызвать ompt_intialize() в разгрузочной среде openmp
Я запускаю разгрузочное openmp-приложение Intel MIC, используя openmp runtime (с поддержкой ompt, как на стороне процессора, так и на стороне MIC), в то время как libiomp5.so на стороне процессора может запускать его ompt_intialize() и получать данн…
19 ноя '15 в 07:33
1
ответ
Управляйте операциями Intel MIC SIMD вручную с помощью встроенных функций или инструкций
Я хочу вручную управлять своим кодом SIMD-операциями на MIC и написать внутреннюю информацию ниже _k_mask = _mm512_int2mask(0x7ff); // 0000 0111 1111 1111 _tempux2_512 = _mm512_mask_loadunpacklo_ps(_tempux2_512,_k_mask, &u_x[POSITION_INDEX_X(k,j…
17 фев '14 в 04:06
1
ответ
Получить конкретную модель Xeon Phi
Я пытаюсь найти точную модель сопроцессора Xeon Phi, который я использую. Я запускаю micpinfo и вот что я получаю ***************************/opt/intel/mic/bin/micinfo*************************** MicInfo Utility Log Created Fri Jan 10 13:09:40 2014 S…
10 янв '14 в 18:14
1
ответ
Неопределенная ссылка при использовании встроенного
Я хочу проверить SIMD, свойственную Xeon Phi. Поэтому я написал следующий код: #pragma offload target(mic) in(a:length(N)) #pragma omp parallel for for(int i=0;i<16;++i){ __m512i p ; p = _mm512_loadunpackhi_epi64(p, &a[i*10]); } При компиляци…
24 июн '13 в 06:27
1
ответ
Intel MIC - ошибка разгрузки: передача данных
У меня проблема с передачей данных с сопроцессора Intel Xeon Phi на центральный процессор. Я пытаюсь реализовать вычисления с использованием модели разгрузки. В начале моих вычислений я передаю все данные в сопроцессор (один массив). После вычислени…
12 дек '15 в 16:09
1
ответ
Назначение Xeon-Phi процессу MPI
Моя система имеет две карты xeon-phi, подключенные к одному узлу. Я пытаюсь запустить распределенный код MPI, который использует ускорение xeon-phi в режиме разгрузки. Мне интересно, если я запускаю два процесса MPI на узел, как бы я назначил xeon-p…
05 апр '14 в 19:12
1
ответ
Что нужно, чтобы разгрузка OpenACC/OpenMP4.0 на nvidia/mic работала с GCC?
Я пытаюсь понять, как именно я могу использовать OpenACC для выгрузки вычислений на мой графический процессор nvidia на GCC 5.3. Чем больше я гуглю, тем больше путаюсь. Все руководства, которые я нахожу, включают перекомпиляцию всего gcc вместе с дв…
09 июл '16 в 15:40
2
ответа
Другая среда при запуске sudo от имени пользователя root?
Я пытаюсь установить сопроцессор Xeon Phi. Специфическое поведение, вероятно, связано с используемыми инструментами - мой вопрос носит более общий характер. Когда я выполняю команду как root, я получаю ошибку сегментации. Когда я выполняю его как ro…
03 апр '13 в 15:22
1
ответ
Как отключить Intel XEON PH сопроцессор?
У меня есть сервер с четырьмя микрофонными картами (mic0-mic3), и он работает хорошо. Я хочу отключить некоторые микрофоны, например mic3, теперь доступен только mic0 - mic2. что я должен делать?
02 авг '16 в 01:59
1
ответ
Запуск Haskell на Xeon-Phi
Есть ли способ скомпилировать Haskell для запуска на сопроцессоре Xeon Phi? Некоторые исследователи из Intel недавно сообщили о компиляторе исследований Haskell (который не является общедоступным, что делает их результаты практически невоспроизводим…
07 мар '14 в 14:49
1
ответ
Требуемое время для выгрузки функции в Intel Xeon Phi
Существует ли заранее определенное время, необходимое для вызова разгрузки для передачи данных (параметров) функции с хоста на Intel MIC(сопроцессор Xeon Phi серии 3120)? В частности, я выполняю вызов разгрузки ("#pragma offload target(mic)") для фу…
28 ноя '17 в 22:39
3
ответа
Разгрузи демон на xeon phi 5110p
Мне известно, что у сопроцессора Intel Xeon phi SE10X есть 61 ядро, и предлагается использовать только 60 ядер, поскольку одно ядро используется для демона разгрузки. Кроме того, так как сопроцессор Intel Xeon Phi 5110P имеет 60 ядер, предлагается…
10 июн '13 в 06:13
1
ответ
Разгрузка Intel MIC - как это работает с STL?
Я работаю с системой, которая реализована в коде C++/OpenMP, и она повсеместно использует структуры данных STL и Eigen. С алгоритмической точки зрения код кажется отличным кандидатом на ускорение с новыми картами Intel MIC ( Xeon Phi). Типичный пара…
31 мар '13 в 08:16
1
ответ
Как провести различие между процессорами Intel Xeon Phi 7120P, 7120X, 7120D, 7120A
У меня есть Xeon phi сопроцессор 7120P.Когда я запускаю micinfo, я вижу, что SKU платы будет C0PRQ-7120 P/A/X/D.Я заметил, что SMC HW Revision сообщает о продукте 300W Passive CS, и я прочитал на tomshardware, что P означает пассивное охлаждение для…
27 июн '14 в 06:06
0
ответов
Ошибка прагмы разгрузки Intel MIC
Что это за ошибка? Не могу найти ничего полезного, прибегая к помощи * об этом:/ error: this pragma must immediately precede a statement #pragma offload target(mic) \ ^ Изменить 1: это моя прагма: #pragma offload target(mic) \ in (v1: length(B)) \ i…
20 мар '14 в 14:03
3
ответа
Способы ускорения сокращения операций на процессорах Xeon, GPU и Xeon Phi
У меня есть приложение, где операции сокращения (например, сумма, максимум) на большой матрице являются узким местом. Мне нужно сделать это как можно быстрее. Есть ли в Mkl векторные инструкции для этого? Есть ли специальный аппаратный блок для рабо…
22 июл '14 в 16:21
1
ответ
loaddup_pd/unpacklo_pd на Xeon Phi
Если у меня есть следующие двойные числа в векторе SIMD шириной 512, как в регистре Xeon Phi: m0 = |b4|a4|b3|a3|b2|a2|b1|a1| Можно ли сделать это в: m0_d = |a4|a4|a3|a3|a2|a2|a1|a1| используя одну инструкцию? Кроме того, поскольку для двойников не с…
12 мар '13 в 05:09
0
ответов
Будет ли _mm512_mask_prefetch_i32gather_ps() предварительно извлекать целую строку кэша для каждого элемента?
Собрать предварительную выборку _mm512_mask_prefetch_i32gather_ps может использоваться для предварительной выборки 32-битных чисел в Knights Corner. Поскольку соответствующей встроенной функции для двойников не существует, как следует использовать э…
08 июл '14 в 09:08
1
ответ
Scatter/Gather in Xeon Phi
Я имел в виду руководство Intel по набору инструкций Xeon Phi и не смог понять, как работают инструкции разброса / сбора. Предположим, если у меня есть следующий вектор двойных чисел: A-> |b4|a4|b3|a3|b2|a2|b1|a1| Можно ли создать 4 вектора следу…
12 мар '13 в 07:33
1
ответ
Выгрузка в intel MIC с использованием выровненных данных
Когда я компилирую код ниже, я получаю предупреждение: src/parallel_hashing.cpp(50): warning #3218: *MIC* class/struct may fail when offloaded because this field is misaligned or contains data that is misaligned __declspec(align(64)) list<HashEnt…
11 дек '15 в 08:51