Python NLTK словосочетание для римских цифр
Так как в nltk есть словосочетание для чисел, таких как ('RS', '##number##')
Мне интересно, есть ли такой спецификатор для римских цифр, который я хочу использовать для чего-то вроде этого: ('volume', '##roman number##')
Если нет способа сделать это, было бы полезно, если бы существовал способ преобразовать римские цифры в десятичные для сегментации предложения, а затем после сегментации преобразовать текст обратно в исходные римские цифры.