Описание тега cupy
CuPy - это реализация многомерного массива, совместимого с NumPy, на CUDA.
1
ответ
Нужна помощь в понимании скорости передачи ядра на графическом процессоре (numba, cupy, cuda)
Несмотря на то, что графические процессоры ускоряют математические вычисления, существуют фиксированные издержки для перемещения ядра в графический процессор для выполнения, которое является высоким. Я использую Cupy и Numba. В первый раз, когда я в…
03 дек '18 в 21:10
1
ответ
Почему я получаю ModuleNotFoundError для импорта Cupy?
Я установил Cupy, используя pip install cupy-cuda90, Установка прошла успешно (после установки MSVC 2017) и pip list показывает cupy-cuda90. Когда я печатаю import cupy Я получаю следующую ошибку: Traceback (most recent call last): File "<ipython…
03 дек '18 в 13:02
1
ответ
Где задокументирован @cupy.fuse cupy python decorator?
Я видел некоторые демонстрации @cupy.fuse, которые являются не чем иным, как чудом для программирования на GPU с использованием синтаксиса Numpy. Основная проблема с Cupy состоит в том, что каждая операция, такая как добавление, является полным запу…
05 дек '18 в 19:49
2
ответа
TypeError: индексы списка должны быть целыми или кусочками, а не cupy.core.core.ndarray
В алгоритмах обнаружения объекта используется Non-Maximum Suppression(NMS) для отбрасывания дополнительных результатов обнаружения для объекта, например транспортного средства. Обычно горизонтальные ограничивающие рамки используются в алгоритмах обн…
11 фев '19 в 01:22
0
ответов
Существуют ли функции, аналогичные функции python multiprocessing.Process() в pycuda, numba или cupy?
У меня был код, в котором я использовал функцию python multiprocessing.Process(), но теперь я хочу перейти на использование cuda и связанных с ним библиотек, чтобы использовать преимущества ядра моего графического процессора Nvidia для моего паралле…
18 фев '19 в 19:06
2
ответа
Cupy получает ошибку в multithread.pool, если графический процессор уже используется
Я пытался использовать cupy в двух частях моей программы, одна из которых была распараллелена с пулом. Мне удалось воспроизвести это на простом примере: import cupy import numpy as np from multiprocessing import pool def f(x): return cupy.asnumpy(2*…
21 фев '19 в 13:21
1
ответ
Как создать подкласс массива CuPy?
Для NumPy можно использовать class A(np.ndarray): pass a = np.random.rand(10, 10).view(A) print(a) # OK Но для Cupy следующая операция приводит к segfault: class A(cp.ndarray): pass a = cp.random.rand(10, 10).view(A) print(a) # segfault Я просмотрел…
25 фев '19 в 01:49
1
ответ
Cupy становятся медленнее при увеличении итераций
Я учусь использовать Cupy. Но я нашел проблему действительно запутанной. Кажется, что сначала Кьюпи хорошо выступает в программе. Когда он работает некоторое время, Cupy кажется намного медленнее. Вот код: import cupy as np from line_profiler import…
26 янв '19 в 06:32
2
ответа
Медленное сравнение GPU в Cupy
Я хочу с помощью cupy проверить, является ли число с плавающей точкой положительным, например: import cupy as cp u = cp.array(1.3) u < 2. >>> array(True) Моя проблема в том, что эта операция очень медленная:%timeit u < 2. дает 26 микр…
19 фев '19 в 14:57
1
ответ
cupy.cuda.cudnn.CuDNNError: CUDNN_STATUS_INTERNAL_ERROR
Мои версии Cupy и Chainer следующие Chainer: 4.1.0 NumPy: 1.15.4 CuPy: CuPy Версия: 4.1.0 Корень CUDA: /usr/local/cuda-9.0 Версия сборки CUDA: 9000 Версия драйвера CUDA: 9020 Версия CUDA Runtime: 9000 cuDNN Версия сборки: 7104 cuDNN Версия: 7104 NCC…
11 дек '18 в 09:55
1
ответ
Как полностью освободить память GPU, используемую в функции
Я использую cupy в функции, которая получает numpy массив, пихает его на графический процессор, делает некоторые операции с ним и возвращает cp.asnumpy копия этого. Проблема: память не освобождается после функции (как видно на ndidia-smi). Я знаю о …
29 ноя '18 в 10:21
0
ответов
Как выполнять быстрые побитовые операции над скаляром с помощью библиотеки `cupy`
Я строю модель обучения подкреплению на графическом процессоре, поэтому я использую цепочку, у которой есть мощный интерфейс. cupy предназначен для дублирования numpy кроме того, что он работает на GPU. Я задавал этот вопрос ранее о том, как сделать…
12 окт '18 в 20:21
0
ответов
Как исправить ошибку "typingerror: невозможно определить тип numba для <class 'function'>?
Я использую Numba для работы с массивом NumPy. Когда я переключаю цель в @jit(target = ___) с 'cpu' на 'cuda' или 'parallel', я получаю ошибку в заголовке. Когда я гуглю эту ошибку, решения, которые я вижу, говорят, что программист должен использова…
18 фев '19 в 21:28
0
ответов
Конвертировать NumPy в CuPy
В приведенном ниже коде у меня есть простой цикл for с NumPy, который я хотел бы заменить реализацией CuPy. импортировать numpy как np b = np.array([9,8100,-60,7], dtype=np.float64) a = np.array([584,-11,23,79,1001,0,-19], dtype=np.float64) м = 3 n …
27 дек '18 в 14:07
0
ответов
cupy.cuda.cublas.CUBLASError: CUBLAS_STATUS_NOT_INITIALIZED при выполнении умножения матрицы на кубики
Я новичок, занимающийся управлением средой conda, pip и т. Д. Когда я попытался создать двухточечный матричный массив матрицы (matrix_V и vector_u), я обнаружил следующее сообщение об ошибке: vector_predict = matrix_V.dot(vector_u) File "cupy/core/c…
12 фев '19 в 19:27
1
ответ
Индекс структуры массива Cupy
Как мне подписать структурированный массив Cupy. Я не могу найти документ об этом... arr = cp.zeros(shape=(100,), dtype=cp.dtype([('t', '<f4'), ('tri', '<i4'), ('u', '<f4'), ('v', '<f4')])) # numpy... arr[...]['tri'] # cupy ????
04 фев '19 в 09:01
1
ответ
Почему мой редуктор RawKernel вызывает cudaErrorIllegalAddress?
Моя цель - написать собственное ядро редукции, которое будет возвращать как argmax вдоль каждой строки, так и разницу между max и submax (второй по величине max). Я новичок в CUDA, и я работаю с Cupy. В качестве первого шага я попытался написать с…
08 янв '19 в 21:56
1
ответ
Выделение памяти графического процессора для массивов
У меня есть сеанс tenorflow, запущенный параллельно с этим кодовым кодом. Я выделил 8 ГБ из 16 ГБ моей общей памяти GPU для сеанса тензорного потока. Теперь я хочу выделить 2 ГБ из оставшихся 7 ГБ для выполнения этого объемного кода. Фактический код…
26 ноя '18 в 07:34
1
ответ
Ошибка выполнения куба при вычислении нескольких массивов
Шлейф в порядкечашка петли 1 раз, 3 раза в порядке. но 10 раз делает ошибку.как я могу решить эту проблему?это проблема памяти GPU? (исходный код) import cupy as cp import numpy as np mc = 5000 def fcal(ff, nloop, skey): maa = ff.zeros((mc,mc)) + 0.…
03 дек '18 в 13:27
1
ответ
best_local_affine_kernel.cu [WinError 126] Указанный модуль не найден в Windows 10
Я использую код FastPhotoStyle в Windows 10 и использую Python 3.7, CUDA 10.0 и cuda 9.1. Хотя я внес изменения, предложенные для обновления версии Python со строки на байт, я все еще получаю ту же ошибку. Можете ли вы предложить решение этой пробле…
29 дек '18 в 17:11