Как я могу отключить запись сообщений от Pang-тега Stanford?
У меня есть около 4 миллионов текстов для аннотации с помощью Stanford POS tagger. Как я могу отключить эти сообщения журнала:
Reading POS tagger model from edu/stanford/nlp/models/pos-tagger/english-left3words/english-left3words-distsim.tagger ... done [1,1 sec].
Мне не нужно 4 миллиона из них в моих лог-файлах.
2 ответа
StanfordNLP использует Redwood
в качестве каркаса для ведения журнала. Вы должны отключить его перед инициализацией конвейера StanfordNLP.
import edu.stanford.nlp.util.logging.RedwoodConfiguration;
RedwoodConfiguration.current().clear().apply();
StanfordCoreNLP pipeline = new StanfordCoreNLP(props);
Меня устраивает. Он не показывает длинное сообщение INFO в каждой строке во время работы программы.
Ссылка: RedwoodConfiguratin Tutorial.
Надеюсь, поможет!
Не могли бы вы предоставить мне более подробную информацию о том, как вы используете Stanford CoreNLP? Похоже, вы загружаете тег POS для каждого документа, который вам не нужно делать. Таким образом, вы можете загрузить тег POS один раз (для каждого работника, если у вас есть кластер), а затем просмотреть документы, повторно используя уже загруженный теггер. Это также ускорит вашу обработку!