Как обучить модель SVC/Multinomial_NB на выходе word2Vec?
У меня есть датафрейм с комментариями и настроениями в виде столбцов. Я сгенерировал Word2Vec представление комментариев, как показано ниже: из перчаток импорта Корпус, Перчатки
создание объекта корпуса
corpus = Corpus()
тренировка корпуса для генерации матрицы совпадений, которая используется в GloVe
corpus.fit(data['Comments'].apply(lambda x : x.split()), window=10)
создание объекта Glove, который будет использовать матрицу, созданную в приведенных выше строках, для создания вложений
установить скорость обучения, используя градиентный спуск и количество компонентов
glove = Glove(no_components=5, learning_rate=0.05)
glove.fit(corpus.matrix, epochs=30, no_threads=4, verbose=True)
glove.word_vectors[glove.dictionary['drug']]
Выход:
array([ 0.9242366 , -0.81431099, -0.6752495 , 0.67732151, 0.52884703])
Теперь я хочу использовать этот вывод word2vec и тренировать SVC
или алгоритм полиномиальной классификации. Было бы лучше, если бы ваше предложение включало использование Python в конвейере. Любая идея / фрагмент кода или учебник будут полезны.
Благодарю.