Какие алгоритмы классификации текста я могу использовать для классификации сообщений чата клиента?

Я работаю над тем, чтобы классифицировать сообщения чата клиентов по 5 категориям. Примеры категорий: "Логин", "SSL" и т. Д. В случае, если у клиента возникают проблемы с логином, сообщение может выглядеть примерно так: "У меня проблема с логином или мой логин не работает... Мы должны принять во внимание" неправильное написание, упоминание нескольких классифицированных ключевых слов (например: я только что обновил свой SSL, но теперь у меня проблемы с логином) и т. д.

Существуют ли модели /apis, которые я могу использовать для решения этой проблемы?

1 ответ

Я думаю, что ваш вопрос довольно широкий, потому что ваша проблема в основном связана с классификацией текста, и в литературе с ней сталкивались большинство алгоритмов классификации НЛП, поэтому вариантов гораздо больше (и, возможно, в вашем случае лучше), чем глубокое обучение. Но если вы хотите использовать глубокое обучение, вам нужно учитывать не только архитектуру (простую многоуровневую, сверточную, LSTM и т. Д.), Но и объем помеченных данных, которые необходимы для хорошего обучения (а как насчет неконтролируемых алгоритмов для классификации текста?).

Затем, независимо от выбранного вами подхода, я настоятельно рекомендую вам проверить алгоритмы встраивания слов (предварительно подготовленные или созданные с использованием ваших собственных данных), особенно те, которые похожи на fasttext, потому что позволят вам иметь дело с ошибочными словами.

надеюсь, это поможет

Другие вопросы по тегам