Crawler4J не обнаруживает кодирование с помощью Tika с помощью sbt-сборки в FatJar
Использование Crawler4j в консоли SBT работает. При использовании sbt-Assembly для создания фиджара Тика (?) Больше не может определять кодировку страниц при запуске с
java -jar crawler.jar
Чего не хватает Тике, чтобы обнаружить кодировку?
ERROR edu.uci.ics.crawler4j.parser.Parser - Failed to detect the character
encoding of a document, while parsing
Стратегия слияния
assemblyMergeStrategy in assembly := {
case PathList("META-INF", xs @ _*) => MergeStrategy.discard
case _ => MergeStrategy.first
}
1 ответ
Удалена стратегия слияния, теперь работает со стандартной стратегией. Получил это из плохого примера.