Специальное обучение для разговора / обсуждения GPT-2
В настоящее время я использую модель GPT-2 в диалоговом контексте с множественным выбором.
Использование будет следующим: 2 собеседника будут в одной комнате, один собеседник сформулирует вопрос, а второй собеседник будет иметь 4 варианта ответа.
Сегодня я заново обучаю свою модель, используя только выбранный ответ. Как я могу также интегрировать не-варианты? как наказывать невыбранные ответы?
Жду ваших идей и творчества :)
Хорошего дня, жюстин