Классы персонажей, используемые в ffi-aspell

Question

Классы персонажей, используемые в ffi-aspell

Я пытаюсь использовать камень ffi-aspell для проверки правописания текста. Для этого мне кажется, что я должен извлечь слова сам. Я пытаюсь сделать это, применяя String#scan к тексту с регулярным выражением, но это не кажется простым.

Какой самый простой способ определить класс символов, которые могут появиться в словаре ffi-aspell какого-либо языка? Я хочу сделать его доступным не только для английского языка, поэтому такие вещи, как /[a-zA-Z']/ для персонажа (или /[a-zA-Z']+/ слово) не работает. /[[:word:]]/ кажется, что он захватывает символы, которых нет в словаре, такие как цифры, и, кроме того, не соответствует апострофу (одинарная кавычка), который часто используется в слове. Есть ли документация, которая определяет набор символов, используемый в словаре ffi-aspell?

0

regex ruby dictionary nlp aspell

Источник

user314166 21 апр '16 в 14:57

1 ответ

Решение

Другие вопросы по тегам regex ruby dictionary nlp aspell

user2035262 21 апр '16 в 15:49 2016-04-21 15:49 · Accepted Answer · 2016-04-21 15:49

Я думаю, было бы проще сканировать ffi_aspell сначаласловарь для записей и просто вроде Regexp#union уникальные потом.

1

Источник

user2035262 21 апр '16 в 15:49