Классы персонажей, используемые в ffi-aspell
Я пытаюсь использовать камень ffi-aspell для проверки правописания текста. Для этого мне кажется, что я должен извлечь слова сам. Я пытаюсь сделать это, применяя String#scan
к тексту с регулярным выражением, но это не кажется простым.
Какой самый простой способ определить класс символов, которые могут появиться в словаре ffi-aspell какого-либо языка? Я хочу сделать его доступным не только для английского языка, поэтому такие вещи, как /[a-zA-Z']/
для персонажа (или /[a-zA-Z']+/
слово) не работает. /[[:word:]]/
кажется, что он захватывает символы, которых нет в словаре, такие как цифры, и, кроме того, не соответствует апострофу (одинарная кавычка), который часто используется в слове. Есть ли документация, которая определяет набор символов, используемый в словаре ffi-aspell?
1 ответ
Я думаю, было бы проще сканировать ffi_aspell
сначаласловарь для записей и просто вроде Regexp#union
уникальные потом.