Описание тега rapids

RAPIDS - это платформа для ускоренного машинного обучения и анализа данных на графических процессорах.
0 ответов

Варианты ускорения кода Python через распараллеливание / многопроцессорность

Ниже я собрал 4 способа завершить выполнение кода, который включает сортировку обновлений Pandas Dataframes. Я хотел бы применить лучшие методы для ускорения выполнения кода. Я использую лучшие доступные методы? Кто-нибудь, пожалуйста, поделитесь св…
19 фев '19 в 21:41
2 ответа

Установите библиотеку RAPIDS на блокнот Googe Colab

Мне было интересно, смогу ли я установить библиотеку RAPIDS (выполняя задачи машинного обучения полностью на GPU) в записной книжке Google Colab Laboratory? Я провел некоторые исследования, но я не смог найти способ сделать это...
17 дек '18 в 10:19
0 ответов

Как сделать матричный точечный продукт в графическом процессоре с помощью rapids.ai

Я использую CUDF, это часть набора ML Rapids от Nvidia. Используя этот пакет, как бы я сделал точечный продукт? df = cudf.DataFrame([('a', list(range(20))), ('b', list(reversed(range(20)))), ('c', list(range(20)))]) Например, как бы я выполнил точеч…
01 фев '19 в 13:20
1 ответ

Какие новые функции добавлены в контейнер Rapids?

Новый релиз контейнера Rapids.ai был размещен на NGC. Чтобы получить: docker pull nvcr.io/nvidia/rapidsai/rapidsai:ubuntu1604_cuda92_py35 Какие новые функции были добавлены (интегрирован ли RAPIDS Memory Manager)?
29 окт '18 в 19:06
1 ответ

Как реализовать SQL Groupby в RAPIDS

Я пытаюсь перевести запрос SQL для использования RAPIDS. Рассмотрим упрощенный запрос ниже: (SELECT min(a), max(b), c FROM T GROUP BY c) AS result Я проверил приведенный ниже код, но является ли это оптимальным решением? Нужна ли сортировка по групп…
20 ноя '18 в 16:49
0 ответов

У объекта 'nvstrings' нет атрибута 'to_gpu_array'

Я использую cuML для стохастического градиентного спуска. Я использовал sklearn's train_test_split для генерации расщеплений для train_X, train_y ... из кадра данных cuDF. Следующий код (я удалил гиперпараметры, не относящиеся к этому вопросу): from…
30 май '19 в 22:16
0 ответов

Как удалить столбцы с NA, используя CUDF?

Панды: data = data.dropna(axis = 'columns') Я пытаюсь сделать что-то подобное, используя фрейм данных cudf, но API не предлагают эту функцию. Мое решение - преобразовать в pandas df, выполнить указанную выше команду, а затем повторно преобразовать в…
30 май '19 в 16:37
2 ответа

Как использовать RAPIDS для ускорения модулей, разделенных контейнером, в конвейере

У нас есть функция, которая позволяет пользователям перетаскивать модуль через интерфейс пользовательского интерфейса для формирования конвейера обработки данных, такого как чтение данных, предварительная обработка, обучение классификации и т. Д. По…
2 ответа

Рекомендованный cudf Dataframe Construction

Я заинтересован в рекомендуемых и быстрых способах создания cudf DataFrames из плотных numpy объектов. Я видел много примеров разбиения столбцов двумерной матрицы на кортежи с последующим вызовом cudf.DataFrame в списке кортежей - это довольно дорог…
30 апр '19 в 13:37
1 ответ

Почему я получаю разные результаты от Scikit-learn API и Learning API XGBoost?

Я использовал Scikit-Learn API для XGBoost (в Python). Моя точность была ~ 68%. Я использовал тот же набор параметров и использовал Learning API для XGBoost; моя точность была ~ 60%. Насколько я понимаю, Scikit-Learn API - это оболочка вокруг Learni…
03 май '19 в 21:50
0 ответов

Почему я получаю разные результаты от Scikit-learn API и Learning API XGBoost (часть 2)?

Я использовал Scikit-Learn API для XGBoost (в Python). Моя точность была ~ 75%. Я использовал тот же набор параметров и использовал Learning API для XGBoost; моя точность была ~ 87%. Насколько я понимаю, Scikit-Learn API - это оболочка вокруг Learni…
07 май '19 в 22:22
0 ответов

Инструмент мониторинга и отладки для rapids.io Как вы отслеживаете и отлаживаете cudf?

1- Какой вызов функции выполняет @present в графическом процессоре. 2- Время, затраченное на загрузку данных, время выполнения, выделенную / использованную память, время загрузки библиотеки CUDF в графическом процессоре или создание контекста. 3- Ес…
17 май '19 в 13:54
0 ответов

Чтение CSV не удалось для конкретного файла CSV с CUDF

Я пытаюсь использовать cudf из Rapids для обработки определенного CSV-файла. Файл можно открыть по этой ссылке: http://open-data-assurance-maladie.ameli.fr/depenses/download.php?Dir_Rep=Open_DAMIR&Annee;=2018 Я пробовал файл A2018_01.csv (введите "d…
20 июл '19 в 12:55
3 ответа

Как применить условие if в GPU DataFramecDF для фильтрации DataFrame?

Я хотел бы отфильтровать фрейм данных cuDF на основе значения столбца, а затем создать новый столбец на основе указанного условия. В принципе, как я могу применить следующее в cuDF? df.loc[df.column_name condition, 'new column name'] = 'value if con…
27 июл '19 в 03:44
0 ответов

Какая последняя версия CUDA поддерживается RAPIDS?

Я искал в официальной документации RAPIDS, там говорится, что CUDA 10.1 еще не поддерживается. С другой стороны, я вижу вопросы сообщества, которые показывают людям, работающим с CUDA 10.1 и задающим вопросы о конкретных проблемах, связанных с RAPID…
21 авг '19 в 11:37
1 ответ

Ошибка памяти порогов Python Nvidia при использовании cuml для обучения модели машинного обучения

Я использую Python 3 с nvidia Rapids, чтобы ускорить машинное обучение с использованием библиотеки cuml и графического процессора. Мои скрипты также используют керас с обучением на GPU (через tf), и когда я достигаю стадии, на которой я пытаюсь испо…
06 июн '19 в 12:35
3 ответа

Замените значения в столбце C, где значение в столбце A равно x

вопрос В процессе замены нулевых значений, чтобы столбец был логическим, мы находим нулевые значения в fireplace_count колонка. Если fireplaceflag значение False fireplace_count null значение должно быть заменено на 0 написано для панд df_train.loc[…
23 июл '19 в 00:13
1 ответ

Как предварительно кэшировать dask.dataframe для всех рабочих и разделов, чтобы уменьшить потребность в связи

Иногда привлекательно использовать dask.dataframe.map_partitions для операций, таких как слияния. В некоторых случаях при объединении left_df и right_df с помощью map_partitionsЯ хотел бы, по существу, предварительно кэшировать right_df перед выполн…
30 июл '19 в 17:47
0 ответов

Что использовать вместо pandas.Series.filter?

панды -> cuDF Преобразование некоторых написанных для панд питонов для работы на порогах панд temp=df_train.copy() temp['buildingqualitytypeid']=temp['buildingqualitytypeid'].fillna(-1) temp=temp.groupby("buildingqualitytypeid").filter(lambda x: x.b…
21 авг '19 в 06:03
1 ответ

Преобразовать столбец фрейма cuDF в 1 или 0 для значений "истина" / "ложь"

Я использую док-контейнер RAPIDS (выпуск 0.9). Как я могу сделать следующее с RAPIDS cuDF? df['new_column'] = df['column_name'] > condition df[['new_column']] *= 1
22 авг '19 в 17:12