Машинное обучение с использованием нескольких функций - обработка текста

У меня есть данные, как следующие:

col1   col2   col3
 2      14    text, text, some text

Я прошел http://scikit-learn.org/stable/modules/preprocessing.html, но я мог только найти информацию для векторизации col3 и передать ее для классификации. В моем сценарии у меня также есть числовая информация в столбцах col1 и col2.

Если без векторизации я передаю col1, 2 и 3, я получаю ошибку для col3, поскольку это String.

Если я векторизирую col3, на выходе получается разреженная матрица. Мне нужно добавить col1 и col2 к векторизованным данным. Как я могу это сделать?

Я использую scikit-learn.

0 ответов

Другие вопросы по тегам