Машинное обучение с использованием нескольких функций - обработка текста
У меня есть данные, как следующие:
col1 col2 col3
2 14 text, text, some text
Я прошел http://scikit-learn.org/stable/modules/preprocessing.html, но я мог только найти информацию для векторизации col3 и передать ее для классификации. В моем сценарии у меня также есть числовая информация в столбцах col1 и col2.
Если без векторизации я передаю col1, 2 и 3, я получаю ошибку для col3, поскольку это String.
Если я векторизирую col3, на выходе получается разреженная матрица. Мне нужно добавить col1 и col2 к векторизованным данным. Как я могу это сделать?
Я использую scikit-learn.