The Portland Group (PGI) produces compilers (Fortran, C & C++) for high-performance computers. They also provide Fortran compilers with GPU support (CUDA Fortran as well as an implementation of OpenACC).
1 ответ

Зависит ли время вычисления арифметики от IEEE от значения?

Я использую строгую арифметику IEEE с плавающей запятой в решателе CFD. Мой алгоритм является явным и детерминированным (он будет выполнять одинаковое количество вычислений на каждом временном шаге). Тем не менее, я наблюдаю, что в периоды, когда ре…
25 июл '14 в 17:33
2 ответа

Директивы акселератора не работают

Это код для умножения матриц program ex implicit none real :: a(256,256),b(256,256),c(256,256),t1,t2 integer i,j,k,sum sum=0 do j = 1,256 do i = 1,256 a(i,j) = 1 b(i,j) = 1 c(i,j) = 0.0 enddo enddo call cpu_time(t1) !$acc region do do i=1,256 do j=1…
20 мар '12 в 14:46
2 ответа

OpenACC должен иметь стандартную информационную ошибку

Я пытаюсь распараллелить простую программу mandelbrot c, но я получаю эту ошибку, которая не связана с обычной информацией. Кроме того, я не уверен, должен ли я копировать данные в параллельный раздел и из него. PS Я относительно новичок в параллель…
31 май '17 в 01:14
4 ответа

ЗГУ Фланг Гитхуб исчез

Кто-нибудь знает, куда Фланг или PGI/LLNL/Nvidia Fortran для LLVM (не dragonegg) пошел? Я нашел некоторую документацию к странице github, которая больше не существует.
07 апр '17 в 21:28
2 ответа

Fortran: инициализировать все переменные для определенного значения по умолчанию

Я работаю над спагетти-кодом Fortran ~40 лет с большим количеством переменных, которые неявно объявляются. Поэтому нет простого способа узнать, какие переменные существуют в коде, чтобы инициализировать их значения. Теперь, есть ли способ сказать ко…
11 сен '14 в 16:57
1 ответ

Ошибка зависимости вложенного цикла OpenACC

Пожалуйста, мне нужна помощь с использованием модели параллельных вычислений OpenACC (C++). Проблема заключается в следующем: Существует зависимость между переменными W, hbias, vbias (она должна обновляться на каждой итерации) и вычислением средств …
26 янв '17 в 23:55
2 ответа

Планирование OpenACC

Скажи, что у меня есть такая конструкция: for(int i=0;i<5000;i++){ const int upper_bound = f(i); #pragma acc parallel loop for(int j=0;j<upper_bound;j++){ //Do work... } } куда f является монотонно убывающей функцией i, поскольку num_gangs, nu…
19 июн '18 в 18:02
3 ответа

Определить компилятор с помощью #ifdef

Я пытаюсь создать небольшой код, который работает на нескольких платформах и компиляторах. Я использую утверждения, большинство из которых можно отключить, но при компиляции с PGI pgicpp с помощью -mp для поддержки OpenMP, он автоматически используе…
05 авг '09 в 13:58
1 ответ

ЗГУ 18,1 против ЗГУ 18,4

Есть ли какие-либо изменения в PGi версии 18.1 до 18.4 в отношении подпрограммы #pragma seq, код, который у меня работает, отлично работает с версией 18.1, но выдает ошибку, когда я использую более новую версию. Я генерирую ядра, используя математич…
25 окт '18 в 15:27
0 ответов

Ошибка компиляции Fortran PGI "константное выражение неправильного типа данных"

У меня есть большая программа, написанная на Фортране, которую я пытаюсь скомпилировать. Я получаю ошибку: PGF90-S-0091-Constant expression of wrong data type (main.f90: 476) PGF90-S-0091-Constant expression of wrong data type (main.f90: 476) PGF90-…
2 ответа

Использование OpenACC для распараллеливания вложенных циклов

Я очень новичок в openacc и обладаю только знаниями высокого уровня, поэтому любая помощь и объяснение того, что я делаю неправильно, будут оценены. Я пытаюсь ускорить (распараллелить) не такой простой вложенный цикл, который обновляет уплощенный (о…
24 авг '15 в 19:56
1 ответ

Значение, отправленное хостом, не возвращается правильно устройством, использующим CUDA Fortran

Я взял пример передачи данных между хостом и устройством для CUDA Fortran и нашел это: Код хоста: program incTest use cudafor use simpleOps_m implicit none integer, parameter :: n = 256 integer :: a(n), b, i integer, device :: a_d(n) a = 1 b = 3 a_d…
11 апр '17 в 08:16
1 ответ

Могут ли компиляторы PGI выводить сгенерированный код Cuda в файл

Я хотел бы, чтобы сгенерированный код CUDA был сохранен в файле для проверки. Возможно ли это с компиляторами OpenAcc и PGI?
21 окт '15 в 15:38
0 ответов

Сравнение Fortran/OpenMP на 2 платформах (компиляторы GCC и PGI). Неожиданные сроки исполнения

Я скомпилировал (с помощью компиляторов GCC и PGI) и запустил небольшую программу на Fortran/OpenMP на двух разных платформах (на основе Haswell и Skylake), просто чтобы почувствовать разницу в производительности. Я не знаю, как интерпретировать рез…
10 мар '17 в 09:51
1 ответ

Поддержка GPU компилятора OpenACC PGI

Какие графические процессоры поддерживают компилятор PGI (OpenACC и объединенная память cuda)? Кеплер, Максвелл, Паскаль? А как насчет GTX 670, 770, 970? М-серия (для ноутбуков)? Это правда, что поддержка только для Tesla и всех паскалей?
16 янв '19 в 19:27
1 ответ

Как реализовать определяемое пользователем сокращение с помощью OpenACC?

Есть ли способ реализовать пользовательское сокращение с помощью OpenACC, аналогичное объявлению сокращения в OpenMP? Чтобы я мог написать что-то вроде#pragma acc loop reduction(my_function:my_result) Или как правильно реализовать эффективное сокращ…
21 янв '19 в 18:35
0 ответов

PGI компилируется с -multicore

Я компилирую свой код, используя компилятор PGI с openmpi с -multicore флаг, и я получаю эту ошибку. undefined reference to `**__pgi_uacc_cuda_stream**' undefined reference to `**__pgi_uacc_cuda_initdinfoflags**' undefined reference to `**__pgi_uacc…
15 фев '19 в 21:19
1 ответ

Расчет PI с помощью Fortran & CUDA

Я пытаюсь сделать простую программу в Фортран компилятор PGI. Эта простая программа будет использовать графическую карту для вычисления числа пи с помощью алгоритма "дартс". После долгой борьбы с этой программой, я наконец-то получил ее по большей ч…
28 апр '14 в 00:58
2 ответа

Продолжение линии с pgfortran

Я пытаюсь скомпилировать файл с pgf90 или pgfortran(который может обрабатывать все виды исходных файлов, например, f90 или f77), который написан с помощью конструкций fortran 77 (то есть имеет расширение.f). У меня вопрос с продолжением строки. open…
08 июл '17 в 01:34
1 ответ

cuDevicePrimaryCtxRetain возвращает CUDA_ERROR_INVALID_DEVICE после acc_init

Я пробовал новую версию сообщества PGI (17.4) на игрушечном примере (см. Ниже), и я получаю сообщение об ошибке внутри API драйвера CUDA при вызове acc_init, Код для воспроизведения ошибки: #include <openacc.h> #include <cuda_runtime_api.h&…
29 авг '17 в 16:52