Поддерживает ли библиотека NLP John Snow Labs, построенную на основе Apache Spark, Java?

Библиотека НЛП John Snow Labs построена на основе библиотек Apache Spark и Spark ML. Все его примеры представлены в Scala и Python. Это поддерживает Java? Если да, где я могу найти соответствующие руководства? Если нет их какой-либо план поддержки Java?

1 ответ

Как правило, библиотекам Scala требуется выделенный Java API, только если их API (не реализация) предоставляет функциональность без эквивалента Java. К сожалению, стандартные типы функций Scala являются примером, по крайней мере, до Scala 2.12 и Java 8. Например, Spark широко использует ClassTag и последствия, что затрудняет использование непосредственно из Java.

Но эта библиотека основана на Spark ML, который не имеет отдельного Java API, и, на первый взгляд, не нуждается в нем (по крайней мере, для нового DataFrame API). Вы можете увидеть его примеры на Java по адресу https://spark.apache.org/docs/2.3.0/ml-pipeline.html.

Таким образом, библиотека НЛП просто создает экземпляры Transformer, Pipeline и другие типы Spark ML, и код для их создания можно легко перевести на Java. Вам просто нужно знать, что Array(...) соответствует new T[] { ... } (где T это тип аргументов). Исходя из этого, он не нуждается в Java API, даже если ему может быть полезно давать примеры на Java. К сожалению, он не предоставляет даже ссылку Scaladoc, поэтому я мог видеть, есть ли что-то в API, что проблематично использовать из Java.

Другие вопросы по тегам