Невозможно правильно проверить орфографию с помощью LanguageTool Java API
Я пытаюсь исправить некоторые слова с ошибками, присутствующие в текстовом файле, с помощью LanguageTool Java API. Пройдя через LT wiki и https://languagetool.org/ я попробовал несколько примеров кодов -
JLanguageTool langTool;
String text = "I.- Any reference _in this Section to a panicular genus or species of an anirmgl, cxccpl where the context";
langTool = new JLanguageTool(Language.AMERICAN_ENGLISH);
langTool.activateDefaultPatternRules();
List<RuleMatch> matches = langTool.check(text);
for (RuleMatch match : matches) {
System.out.println("Potential error at line " +
match.getEndLine() + ", column " +
match.getColumn() + ": " + match.getMessage());
System.out.println("Suggested correction: " +
match.getSuggestedReplacements());
}
Выход выглядит следующим образом -
Potential error at line 0, column 19: Possible spelling mistake found
Suggested correction: [Lin, Min, ain, bin, din, fin, gin, in, kin, min, pin, sin, tin, win, yin]
Potential error at line 0, column 41: Possible spelling mistake found
Suggested correction: []
Potential error at line 0, column 74: Possible spelling mistake found
Suggested correction: []
Potential error at line 0, column 83: Possible spelling mistake found
Suggested correction: []
Ожидаемый выход -
Starting check in English (American)...
1. Line 1, column 19
Message: Possible spelling mistake found (deactivate)
Correction: in; win; bin; pin; tin; min; Lin; din; gin; kin; yin; ain; fin; sin; IN; In; Min; PIN
Context: I.- Any reference _in this Section to a panicular genus or sp...
2. Line 1, column 41
Message: Possible spelling mistake found (deactivate)
Correction: particular; funicular
Context: ...I.- Any reference _in this Section to a panicular genus or species of an anirmgl, cxccpl ...
3. Line 1, column 74
Message: Possible spelling mistake found (deactivate)
Correction: animal
Context: ...n to a panicular genus or species of an anirmgl, cxccpl where the context
4. Line 1, column 83
Message: Possible spelling mistake found (deactivate)
Context: ...nicular genus or species of an anirmgl, cxccpl where the context
Potential problems found: 4 (time: 171ms)
How you can improve LanguageTool
Я получил этот вывод из автономного программного обеспечения для настольных ПК. Я сравнил его установочные папки и его содержимое с исходным кодом и jar-файлами API, но не смог найти ничего особенного, что делает первое лучше.
Также я хочу заменить слова с ошибками первым элементом в списке предложений.
Любая помощь будет высоко оценена.
1 ответ
Я использовал старую банку Languagetool. Пожалуйста, используйте это -
<dependency>
<groupId>org.languagetool</groupId>
<artifactId>language-en</artifactId>
<version>3.5</version>
</dependency>
Кроме того, исправление орфографии можно сделать, выбрав слова с ошибками из (match.getFromPos() в match.getToPos()) и заменив его наиболее убедительным словом из списка предложений (его выбор зависит от программиста).
Надеюсь, что это может быть полезно.