API-интерфейс OpenAI Chat Completions: как настроить ответы моделей GPT-3.5 или GPT-4, если я не могу их точно настроить?

Мы видели, как некоторые компании используют модели GPT-3.5 или GPT-4 для обучения своих собственных данных и предоставления индивидуальных ответов. Но модели GPT-3.5 и GPT-4 недоступны для тонкой настройки.

Я видел документ OpenAI по этой проблеме, но видел, что OpenAI допускает только тонкую настройку.davinci, например.

Как мне настроить ответы из модели GPT-3.5 или GPT-4, если я не могу их настроить?

2 ответа

Они не настраивают модели GPT-3.5 или GPT-4.

У вас есть два варианта.

ВАРИАНТ 1: Использование или

Они используют LlamaIndexLlamaIndex (ранее GPT-Index) или LangChainLangChain . Оба они позволяют вам подключать модели OpenAI к существующим источникам данных.

ВАРИАНТ 2. Использование конечной точки API OpenAI Embeddings.

Смотрите мой прошлый ответ . Кроме того, как упоминал @peter_the_oak, вы можете использовать Pinecone для хранения векторов внедрения. Pinecone разработан специально для обработки данных такого типа.

Помимо LlamaIndex, существует только базовая комбинация базы данных векторов и LLM. Взгляните на сосноваю шишку: https://www.pinecone.io/learn/vector-database/

База данных векторов хранит фрагменты текста (или фрагменты изображений, звука или чего-либо еще) вместе с числовым вектором. Числовой вектор содержит информацию о тексте. Запрос также можно преобразовать в числовой вектор. Теперь, имея два вектора, существуют алгоритмы поиска того, который больше всего соответствует (например, косинусному расстоянию). Таким образом, вы можете искать в базе данных текст, который наиболее актуален в соответствии с вектором.

Теперь вы можете хранить свои «знания» во многих парах текст/вектор. Если вы получили запрос, сначала прочитайте подходящий контекст из векторной базы данных и поместите полученный текст перед подсказкой. Таким образом, LLM всегда будет иметь правильные знания контекста вместе с запросом клиента.

В большинстве случаев точная настройка требует дополнительных затрат, но подсказки — это очень простое и не такое мощное решение. Базы данных векторов используют подсказки, но предлагают механизм поиска подходящих подсказок, который является мощным промежуточным решением.

Другие вопросы по тегам