OpenAI 3.5 Turbo API. Как использовать конечную точку модерации без необходимости делать два вызова API или увеличивать скорость?

Я создаю приложение, которое требует модерации, так как им будут пользоваться дети. Я смог модерировать или отфильтровать ответ в сообщении с помощью подсказки, но для дополнительной безопасности я хотел бы использовать новую модель модерации «text-moderation-001», которую можно найти здесь: https://platform.openai.com/docs /руководства/модерация/быстрый старт

Из того, что я могу прочитать, это бесплатный вызов API, но мне нужно сначала запустить ввод текста от пользователя в эту конечную точку модерации, а затем отправить еще один вызов на основной «3.5-turbo», если ответ на это сообщение « неверно» по всем критериям. Но это довольно сильно влияет на производительность и получение отклика на нагрузку. Кто-нибудь еще использовал модерации и может сказать мне другой способ сделать это или, в идеале, как включить все это в один вызов API? Я знаю, что есть способ «потокового» ответа, но я не могу понять, как это сделать с помощью Javascript(и я знаю, что над этим работает много разработчиков), поэтому для получения ответа требуется 5-10 секунд. просто слишком долго.

0 ответов

Другие вопросы по тегам