Случайный код выхода при увеличении размеров массива в DPC++ Vector Addition
Я пытаюсь запустить образец oneAPI DPC++ hello-world, который добавляет два одномерных массива как на CPU, так и на GPU, и проверяет результаты. Код показан ниже:
/*
DataParallel Addition of two Vectors
*/
#include <CL/sycl.hpp>
#include <array>
#include <iostream>
using namespace sycl;
constexpr size_t array_size = 100000;
typedef std::array<int, array_size> IntArray;
// Initialize array with the same value as its index
void InitializeArray(IntArray& a) { for (size_t i = 0; i < a.size(); i++) a[i] = i; }
/*
Create an asynchronous Exception Handler for sycl
*/
static auto exception_handler = [](cl::sycl::exception_list eList) {
for (std::exception_ptr const& e : eList) {
try {
std::rethrow_exception(e);
}
catch (std::exception const& e) {
std::cout << "Failure" << std::endl;
std::terminate();
}
}
};
void VectorAddParallel(queue &q, const IntArray& x, const IntArray& y, IntArray& parallel_sum) {
range<1> num_items{ x.size() };
buffer x_buf(x);
buffer y_buf(y);
buffer sum_buf(parallel_sum.data(), num_items);
/*
Submit a command group to the queue by a lambda
which contains data access permissions and device computation
*/
q.submit([&](handler& h) {
auto xa = x_buf.get_access<access::mode::read>(h);
auto ya = y_buf.get_access<access::mode::read>(h);
auto sa = sum_buf.get_access<access::mode::write>(h);
std::cout << "Adding on GPU (Parallel)\n";
h.parallel_for(num_items, [=](id<1> i) { sa[i] = xa[i] + ya[i]; });
std::cout << "Done on GPU (Parallel)\n";
});
/*
queue runs the kernel asynchronously. Once beyond the scope,
buffers' data is copied back to the host.
*/
}
int main() {
default_selector d_selector;
IntArray a, b, sequential, parallel;
InitializeArray(a);
InitializeArray(b);
try {
// Queue needs: Device and Exception handler
queue q(d_selector, exception_handler);
std::cout << "Accelerator: "
<< q.get_device().get_info<info::device::name>() << "\n";
std::cout << "Vector size: " << a.size() << "\n";
VectorAddParallel(q, a, b, parallel);
}
catch (std::exception const& e) {
std::cout << "Exception while creating Queue. Terminating...\n";
std::terminate();
}
/*
Do the sequential, which is supposed to be slow
*/
std::cout << "Adding on CPU (Scalar)\n";
for (size_t i = 0; i < sequential.size(); i++) {
sequential[i] = a[i] + b[i];
}
std::cout << "Done on CPU (Scalar)\n";
/*
Verify results, the old-school way
*/
for (size_t i = 0; i < parallel.size(); i++) {
if (parallel[i] != sequential[i]) {
std::cout << "Fail: " << parallel[i] << " != " << sequential[i] << std::endl;
std::cout << "Failed. Results do not match.\n";
return -1;
}
}
std::cout << "Success!\n";
return 0;
}
При относительно небольшом
array_size
, (Я протестировал 100-50 тыс. Элементов), вычисление проходит нормально. Пример вывода:
Accelerator: Intel(R) Gen9
Vector size: 50000
Adding on GPU (Parallel)
Done on GPU (Parallel)
Adding on CPU (Scalar)
Done on CPU (Scalar)
Success!
Можно отметить, что для завершения вычислений как на CPU, так и на GPU требуется всего секунда. Но когда я увеличиваю
array_size
, сказать,
100000
, Я получаю эту, казалось бы, невежественную ошибку:
C:\Users\myuser\source\repos\dpcpp-iotas\x64\Debug\dpcpp-iotas.exe (process 24472) exited with code -1073741571.
Хотя я не уверен, при каком точном значении начинает возникать ошибка, но я уверен, что это произойдет примерно через
70000
. Кажется, я понятия не имею, почему это происходит, какие-либо идеи о том, что может быть не так?
2 ответа
Оказывается, это связано с усилением размера стека VS. Непрерывный массив со слишком большим количеством элементов привел к переполнению стека.
Как упоминал @user4581301, код ошибки
-107374171
в шестнадцатеричном формате дает
C00000FD
, который является подписанным представлением "исчерпания / переполнения стека" в Visual Studio.
Способы исправить это:
- Увеличить
/STACK
зарезервировать для чего-то более 1 МБ (это значение по умолчанию) в свойствах проекта> компоновщик> система> значения стека зарезервировать / зафиксировать. - Используйте двоичный редактор (editbin.exe и dumpbin.exe) для редактирования
/STACK:reserve
. - Использовать
std::vector
вместо этого, что позволяет динамическое размещение (предложено @Retired Ninja).
Я не мог найти возможность изменить
/STACK
в oneAPI, как показано здесь в свойствах компоновщика.
Я решил использовать динамическое размещение.
Связанный: /questions/9083984/protsess-zavershen-s-kodom-vyihoda-1073741571/9084001#9084001
Когда я программирую большие приложения, я всегда
ulimit -s unlimited
чтобы объяснить оболочке, что я вырос и мне действительно нужно немного места в моем стеке.
Вот это
bash
синтаксис, но вы, очевидно, можете адаптироваться к некоторым другим оболочкам.
Я предполагаю, что может быть эквивалент для ОС, отличной от UNIX?