Невозможно правильно проверить орфографию с помощью LanguageTool Java API

Я пытаюсь исправить некоторые слова с ошибками, присутствующие в текстовом файле, с помощью LanguageTool Java API. Пройдя через LT wiki и https://languagetool.org/ я попробовал несколько примеров кодов -

JLanguageTool langTool;
String text = "I.- Any reference _in this Section to a panicular genus or species of an anirmgl, cxccpl where the context";
langTool = new JLanguageTool(Language.AMERICAN_ENGLISH);
langTool.activateDefaultPatternRules();

List<RuleMatch> matches = langTool.check(text);
for (RuleMatch match : matches) {
          System.out.println("Potential error at line " +
                match.getEndLine() + ", column " +
                match.getColumn() + ": " + match.getMessage());
          System.out.println("Suggested correction: " +
                match.getSuggestedReplacements());
}

Выход выглядит следующим образом -

Potential error at line 0, column 19: Possible spelling mistake found
Suggested correction: [Lin, Min, ain, bin, din, fin, gin, in, kin, min, pin, sin, tin, win, yin]
Potential error at line 0, column 41: Possible spelling mistake found
Suggested correction: []
Potential error at line 0, column 74: Possible spelling mistake found
Suggested correction: []
Potential error at line 0, column 83: Possible spelling mistake found
Suggested correction: []

Ожидаемый выход -

Starting check in English (American)...
1. Line 1, column 19
Message: Possible spelling mistake found (deactivate)
Correction: in; win; bin; pin; tin; min; Lin; din; gin; kin; yin; ain; fin; sin; IN; In; Min; PIN
Context: I.- Any reference _in this Section to a panicular genus or sp...
2. Line 1, column 41
Message: Possible spelling mistake found (deactivate)
Correction: particular; funicular
Context: ...I.- Any reference _in this Section to a panicular genus or species of an anirmgl, cxccpl ...
3. Line 1, column 74
Message: Possible spelling mistake found (deactivate)
Correction: animal
Context: ...n to a panicular genus or species of an anirmgl, cxccpl where the context
4. Line 1, column 83
Message: Possible spelling mistake found (deactivate)
Context: ...nicular genus or species of an anirmgl, cxccpl where the context
Potential problems found: 4 (time: 171ms)
How you can improve LanguageTool

Я получил этот вывод из автономного программного обеспечения для настольных ПК. Я сравнил его установочные папки и его содержимое с исходным кодом и jar-файлами API, но не смог найти ничего особенного, что делает первое лучше.

Также я хочу заменить слова с ошибками первым элементом в списке предложений.

Любая помощь будет высоко оценена.

1 ответ

Я использовал старую банку Languagetool. Пожалуйста, используйте это -

<dependency>
<groupId>org.languagetool</groupId>
<artifactId>language-en</artifactId>
<version>3.5</version>
</dependency>

Кроме того, исправление орфографии можно сделать, выбрав слова с ошибками из (match.getFromPos() в match.getToPos()) и заменив его наиболее убедительным словом из списка предложений (его выбор зависит от программиста).

Надеюсь, что это может быть полезно.

Другие вопросы по тегам