Замена слов при обработке документов перед токенизацией в Rapidminer

У меня есть набор документов, и я хотел бы заменить некоторые наборы слов одним словом перед токенизацией.

ех. "продолжение" -> продолжение,

 "Set up" --> Setup and 

  "with out" --> without

Я попытался использовать Replace(словарь), загрузив CSV-файл с потенциальными словами. Но не могу токенизировать после.

введите описание изображения здесь

Как мне это сделать?

Спасибо,

Аджи

1 ответ

Взгляните на Stem (словарь). это может быть неправильно использовано, чтобы сделать трюк.

Ура, Мартин

Другие вопросы по тегам