Классы персонажей, используемые в ffi-aspell

Я пытаюсь использовать камень ffi-aspell для проверки правописания текста. Для этого мне кажется, что я должен извлечь слова сам. Я пытаюсь сделать это, применяя String#scan к тексту с регулярным выражением, но это не кажется простым.

Какой самый простой способ определить класс символов, которые могут появиться в словаре ffi-aspell какого-либо языка? Я хочу сделать его доступным не только для английского языка, поэтому такие вещи, как /[a-zA-Z']/ для персонажа (или /[a-zA-Z']+/ слово) не работает. /[[:word:]]/ кажется, что он захватывает символы, которых нет в словаре, такие как цифры, и, кроме того, не соответствует апострофу (одинарная кавычка), который часто используется в слове. Есть ли документация, которая определяет набор символов, используемый в словаре ffi-aspell?

1 ответ

Решение

Я думаю, было бы проще сканировать ffi_aspell сначаласловарь для записей и просто вроде Regexp#union уникальные потом.

Другие вопросы по тегам