Описание тега opennlp

Библиотеки Apache для обработки естественного языка (NLP).

Библиотека Apache OpenNLP - это набор инструментов на основе машинного обучения для обработки текста на естественном языке. Он поддерживает наиболее распространенные задачи НЛП, такие как токенизация, сегментация предложений, тегирование части речи, извлечение именованных сущностей, разбиение на части, синтаксический анализ и разрешение кореферентности. Эти задачи обычно требуются для создания более сложных служб обработки текста. OpenNLP также включает максимальную энтропию и машинное обучение на основе перцептронов.

Подробнее об обработке естественного языка:

Natural language processing (NLP) is the ability of a computer program to understand human speech as it is spoken.

Apache OpenNlp is often used with Apache Flink(a document query library).

Соответствующие ссылки,

http://searchcontentmanagement.techtarget.com/definition/natural-language-processing-NLP https://opennlp.apache.org/docs/.

Книги Cornerstone: https://www.manning.com/books/taming-text