Машинное обучение: текстовая классификация среди тысяч категорий
У меня есть база данных строк, которая состоит из одного текста (для простоты) и внешнего ключа (целое число), который ссылается на другую таблицу. Есть много тысяч уникальных внешних ключей.
Я сопоставил тысячи этих текстов с определенным внешним ключом, но хотел бы автоматизировать его с помощью службы управляемого машинного обучения (предпочтительно в AWS, но не обязательно). Вариант использования - взять текст и найти наиболее подходящий внешний ключ.
Проблема с категориальной моделью AWS состоит в том, что она может макс. используйте 100 разных категорий, поэтому мои 5000+ внешних ключей не могут работать с этой моделью.
Как я мог решить эту проблему?