Ответы Text Mining с очень разными длинами ответов

У меня есть набор ответов, где людей просили ответить на ряд вопросов. Там только один столбец текстовых данных для обработки.

Моя задача только очень немногие респонденты написали длинные тексты, которые мне было легко обработать, и я понял из этого. Большинство других ответов часто бывают очень короткими, такими как "Отчасти", "Да", "Нет", "Большая степень". Это также не было возможно масштабировать это обычно, потому что нет логического порядка для этого.

Я смог использовать более длинные текстовые ответы, чтобы получить представление о чувствах, извлечь ключевые слова и фразы и применить машинное обучение, такое как RAKE и PMI. Я использовал библиотеку UDPIPE с R.

Однако, для более коротких ответов "в несколько слов", мне действительно трудно понять их.

Возможна ли какая-либо другая техника машинного обучения с текущей проблемой? Или мне нужно попробовать какую-нибудь технику НЛП?

0 ответов

Другие вопросы по тегам