Классификация текста в R
Привет у меня есть набор данных, где агент центра обработки вызовов набирает комментарии против идентификатора клиента. Мы должны классифицировать эти комментарии по различным категориям на основе общих слов в них. Например, "клиент хочет возмещение" или "клиент недоволен, хочет возместить", эти два предложения должны относиться к одной категории, так как это относится к возмещению. Я хочу использовать R для классификации этих комментариев. Я пытался использовать KNN или SVM для того же, но проблема в том, что у нас нет типовой классификации для обучения Алгоритму. Можно ли классифицировать эти комментарии на общие категории на основе общности.
Любая помощь в этом будет очень признательна.
Спасибо, AB