Создание вектора tfidf запроса с помощью scikit learn

Я хочу создать матрицу терминальных документов с векторизацией tfidf, что довольно просто с scikit learns tfidfVectrizer. У меня был вопрос: как я могу использовать совокупность слов для создания значений tfidf, но использовать значения idf документов, используемых в матрице терминов документов, для векторизации запроса, который может или не может уже появиться в исходных обработанных документах? Значения tf тривиальны, но значения idf можно получить только из уже обработанных документов.

0 ответов

Другие вопросы по тегам