У объекта 'nvstrings' нет атрибута 'to_gpu_array'

Я использую cuML для стохастического градиентного спуска. Я использовал sklearn's train_test_split для генерации расщеплений для train_X, train_y ... из кадра данных cuDF.

Следующий код (я удалил гиперпараметры, не относящиеся к этому вопросу):

from cuml.solvers import SGD as cumlSGD
cu_sgd = cumlSGD(eta0=0.005)
cu_sgd.fit(train_X, train_y)

Выдает следующую ошибку в строке cu_sgd.fit: объект 'nvstrings' не имеет атрибута 'to_gpu_array'

Как я могу обойти эту проблему?

0 ответов

Решение состоит в том, чтобы сначала преобразовать любой столбец в train_X или train_Y которые имеют string dtype к categorydtype. Строки нельзя преобразовать с помощьюto_gpu_arrayпотому что они не имеют фиксированной ширины. Вы потеряете фактические строковые значения, но их можно будет восстановить, иcu_sgd.fit должно работать нормально.

Другие вопросы по тегам