Как проверить орфографию сокращений?
Я использую Hunspell, который основан на MySpell, и я не могу понять, как проверять орфографию слова с апострофами в середине.
Я тестирую его в командной строке из Max OS X Terminal, как показано в следующем примере:
Эта фраза имеет одинарные кавычки и апостроф (все используют ASCII 0x27 '
)
He doesn't like 'Big Jon'
Я сохраняю этот файл в test.txt
а затем запустить hunspell
Запрограммируйте следующее, чтобы показать орфографические ошибки:
~$ /usr/bin/hunspell -d en-GB -l test.txt
doesn
Это печатает "doesn"
как неудачное правописание. Все остальные слова проходят, в том числе отрубленные "t"
,
Слово doesn't
в моем словаре. (скачано с Mozilla)
Я могу заставить словарь не разбивать слова, добавив WORDCHARS '
в файл Affix (en-GB.aff), но затем слова в кавычках считаются написанными с ошибками, поэтому я получаю:
~$ /usr/bin/hunspell -d en-GB -l test.txt
'Big
Jon'
Есть ли способ (без предварительной обработки текста), чтобы соответствовать действительные сокращения и декапс цитаты?