Использование OpenAI LLM для классификации. Запрос на классификацию вместо запроса на вероятность
Я использую LLM для классификации продуктов по определенным категориям. Мультикласс.
Один из способов сделать это — спросить, да/нет ли это для определенной категории, и просмотреть категории.
Другой способ — запросить вероятность того, что определенный продукт принадлежит к одному из этих классов.
Второй вариант позволяет мне настроить пороговые значения прогнозирования в «посте» и пере-/недостаточно классифицировать определенные классы.
Однако ходят слухи, что модели OpenAI, обученные RLHF, такие какgpt-3.5-turbo
иgpt-4
слабы в угадывании вероятностей относительно моделей завершения текста, таких какtext-davinci-003
потому что обучение RLHF заставляет модель «думать» больше как человек (плохо угадывать вероятности).
Есть ли какая-либо литература, которую я могу прочитать/о которой мне следует знать? Прежде чем я продолжу и проведу 100 тестов.
Я еще ничего не пробовал, учитывая, что тестирование требует много времени и денег. И прежде чем приступить к работе, хотелось бы получить базовое понимание того, как решить проблему.