pyenchant распознает строчные слова, но не тогда, когда они начинаются с заглавной буквы

Question

pyenchant распознает строчные слова, но не тогда, когда они начинаются с заглавной буквы

Я пытаюсь использовать pyenchant для проверки орфографии английского и болгарского текста. У меня проблема с тем, что в английском языке слова распознаются как в нижнем, так и в верхнем регистре. Например:

>>> d = Dict('en_GB')
>>> d.check('car')
True
>>> d.check('Car')
True

Однако по-болгарски:

>>> d = Dict('bg_BG')
>>> d.check('кола')
True
>>> d.check('Кола')
False

Это нормальное поведение? Я хочу использовать класс SpellChecker для проверки целых абзацев, и это мешает. Я не очень хочу использовать .lower() в целом ул, так как это похоже на взломать. я использую pyenchant==1.6.8 и Python 3.5.2. Словари en_US и en_GB поставлялись с pyenchant, и я скачал словарь bg_BG с https://cgit.freedesktop.org/libreoffice/dictionaries/plain/bg_BG/bg_BG.dic и афф соответственно. Мне пришлось конвертировать их из Windows-1251 в UTF-8, потому что в противном случае слова не распознавались.

1

python spell-checking hunspell pyenchant enchant

Источник

user977345 26 мар '17 в 11:39

0 ответов

Другие вопросы по тегам python spell-checking hunspell pyenchant enchant