Python NLTK словосочетание для римских цифр

Так как в nltk есть словосочетание для чисел, таких как ('RS', '##number##')

Мне интересно, есть ли такой спецификатор для римских цифр, который я хочу использовать для чего-то вроде этого: ('volume', '##roman number##')

Если нет способа сделать это, было бы полезно, если бы существовал способ преобразовать римские цифры в десятичные для сегментации предложения, а затем после сегментации преобразовать текст обратно в исходные римские цифры.

0 ответов

Другие вопросы по тегам