Textacy - ошибка взвешивания векторизатора
Недавно я нашел Textacy, и, просматривая справочное руководство по API, я сталкиваюсь с ошибкой для Vectorizer. Если я добавлю какие-либо параметры из ссылки на API, я получу аргумент TypeError: неожиданное ключевое слово. Я получаю эту ошибку для других вариантов в дополнение к взвешиванию.
Я установил textacy с помощью pip и использую Python3 в Ubuntu. Любая помощь приветствуется. Спасибо!
vectorizer = textacy.vsm.Vectorizer(weighting='tfidf')
TypeError: __init__() got an unexpected keyword argument 'weighting'
1 ответ
Столкнулся с той же проблемой. Документация API не отражает текущие аргументы ключевого слова Vectorizer. Векторизатор теперь предоставляет различные ключевые аргументы, чтобы обеспечить больший контроль над тем, как применяется TF*IDF.
vectorizer = textacy.Vectorizer(tf_type='linear', apply_idf=True, idf_type='smooth')
tf_type
применяет стандартную частоту (TF), apply_idf=True
применяет обратную частоту документов (IDF). Из комментариев репо, idf_type='smooth'
добавляет один к каждой частоте документа, чтобы избежать деления на ноль.
Чтобы увидеть больше информации о параметрах, проверьте комментарий в строке 182 в репозитории здесь: https://github.com/chartbeat-labs/textacy/blob/master/textacy/vsm/vectorizers.py