Как проверить орфографию сокращений?

Я использую Hunspell, который основан на MySpell, и я не могу понять, как проверять орфографию слова с апострофами в середине.

Я тестирую его в командной строке из Max OS X Terminal, как показано в следующем примере:

Эта фраза имеет одинарные кавычки и апостроф (все используют ASCII 0x27 ')

He doesn't like 'Big Jon'

Я сохраняю этот файл в test.txt а затем запустить hunspell Запрограммируйте следующее, чтобы показать орфографические ошибки:

~$ /usr/bin/hunspell -d en-GB -l test.txt
doesn

Это печатает "doesn" как неудачное правописание. Все остальные слова проходят, в том числе отрубленные "t",

Слово doesn't в моем словаре. (скачано с Mozilla)

Я могу заставить словарь не разбивать слова, добавив WORDCHARS ' в файл Affix (en-GB.aff), но затем слова в кавычках считаются написанными с ошибками, поэтому я получаю:

~$ /usr/bin/hunspell -d en-GB -l test.txt
'Big
Jon'

Есть ли способ (без предварительной обработки текста), чтобы соответствовать действительные сокращения и декапс цитаты?

0 ответов

Другие вопросы по тегам