У объекта 'nvstrings' нет атрибута 'to_gpu_array'
Я использую cuML для стохастического градиентного спуска. Я использовал sklearn's train_test_split для генерации расщеплений для train_X, train_y ... из кадра данных cuDF.
Следующий код (я удалил гиперпараметры, не относящиеся к этому вопросу):
from cuml.solvers import SGD as cumlSGD
cu_sgd = cumlSGD(eta0=0.005)
cu_sgd.fit(train_X, train_y)
Выдает следующую ошибку в строке cu_sgd.fit: объект 'nvstrings' не имеет атрибута 'to_gpu_array'
Как я могу обойти эту проблему?
0 ответов
Решение состоит в том, чтобы сначала преобразовать любой столбец в train_X
или train_Y
которые имеют string
dtype
к category
dtype. Строки нельзя преобразовать с помощьюto_gpu_array
потому что они не имеют фиксированной ширины. Вы потеряете фактические строковые значения, но их можно будет восстановить, иcu_sgd.fit
должно работать нормально.