Textacy - ошибка взвешивания векторизатора

Недавно я нашел Textacy, и, просматривая справочное руководство по API, я сталкиваюсь с ошибкой для Vectorizer. Если я добавлю какие-либо параметры из ссылки на API, я получу аргумент TypeError: неожиданное ключевое слово. Я получаю эту ошибку для других вариантов в дополнение к взвешиванию.

Я установил textacy с помощью pip и использую Python3 в Ubuntu. Любая помощь приветствуется. Спасибо!

vectorizer = textacy.vsm.Vectorizer(weighting='tfidf')

TypeError: __init__() got an unexpected keyword argument 'weighting'

1 ответ

Столкнулся с той же проблемой. Документация API не отражает текущие аргументы ключевого слова Vectorizer. Векторизатор теперь предоставляет различные ключевые аргументы, чтобы обеспечить больший контроль над тем, как применяется TF*IDF.

vectorizer = textacy.Vectorizer(tf_type='linear', apply_idf=True, idf_type='smooth')

tf_type применяет стандартную частоту (TF), apply_idf=True применяет обратную частоту документов (IDF). Из комментариев репо, idf_type='smooth' добавляет один к каждой частоте документа, чтобы избежать деления на ноль.

Чтобы увидеть больше информации о параметрах, проверьте комментарий в строке 182 в репозитории здесь: https://github.com/chartbeat-labs/textacy/blob/master/textacy/vsm/vectorizers.py

Другие вопросы по тегам