Описание тега openaiembeddings

2 ответа

Настройте встраивание слов в свой словарный запас

У меня есть словарный запас, связанный с ресторанным бизнесом на испанском языке, и я использую предопределенные встраивания слов на испанском языке с помощью FastText и Bert, однако я вижу, что есть много слов за пределами словарного запаса (oov), …
1 ответ

Проблема LangChain/OpenAI с форматом текстового файла из веб-скрапинга, приводящая к сбою вызова API для «максимальной длины контекста»

Я пытаюсь использовать расширенную генерацию поиска, используя TextLoader и CharacterTextSplitter LangChain. Мои исходные данные — это текстовые данные, которые я собрал с веб-сайта клиента. При очистке без предварительной обработки данные становятс…
1 ответ

Как добавить коллекции/объект в базу данных Chroma?

Я пытаюсь запустить несколько документов через API встраивания текста OpenAI и вставить полученное встраивание вместе с текстом в базу данных Chroma локально. sales_data = medium_data_split + yt_data_split sales_store = Chroma.from_documents( sales_…
1 ответ

Получите данные из нескольких коллекций PGVector с помощью langchain.

У меня есть несколько коллекций в базе данных PGVector. COLLECTION_NAME1 = "mydata1" COLLECTION_NAME2 = "mydata2" Теперь я использую метод PGVector для загрузки из него данных на основе коллекции. embeddings = OpenAIEmbeddings() store1 = PGVector( c…
0 ответов

Azure Open AI внедрения QNA с подмножеством загруженных файлов

Я новичок в Azure OpenAI, и ниже описано, чего я пытаюсь достичь. Я хочу использовать службы Azure OpenAI для qna в файле PDF. Я просмотрел несколько документов и блогов, связанных с этим, и вот что я понял на данный момент. Я могу загружать свои фа…
1 ответ

Как добавить память в load_qa_chain или как реализовать ConversationalRetrievalChain с помощью специального приглашения с несколькими входами

Я пытаюсь предоставить специальную подсказку для вопросов и ответов в langchain. Мне не удалось сделать это с помощью ConversationalRetrievalChain, поскольку он не позволял вводить несколько пользовательских входных данных в пользовательском приглаш…
1 ответ

Чат-бот, использующий CSV-файл

Я пытаюсь создать чат-бота, используя службу ботов Azure и открытый искусственный интеллект Azure. Источником данных являются несколько файлов csv. Я могу создавать встраивание, используя расширение цветности langchain. Но при запросе встраивания я …
0 ответов

Как заменить OpenAiEmbeddings на Huggingface в Langchain?

const { HuggingFaceInferenceEmbeddings } = require('@huggingface/inference'); const embeddings = new HuggingFaceInferenceEmbeddings({ apiKey: process.env.HUGGINGFACEHUB_API_KEY, model: "hkunlp/instructor-large", }); vectorStore = await HNSWLib.load…
09 июл '23 в 13:22
2 ответа

Использование API внедрения в Azure OpenAI

Когда я использую внедрения с Azure OpenAI, я получаю 404 (ресурс не найден): EmbeddingsOptions embdOptions = new EmbeddingsOptions(text); Azure.AI.OpenAI.Embeddings response = Task.Run(() => mOpenAiClient.GetEmbeddingsAsync(mWebSvc.AzureOpenAI.D…
01 июл '23 в 21:58
1 ответ

ValueError: не удалось передать входной массив из формы (1536) в форму (2000)

Пытаюсь создать векторсор Qdrant и добавить свои документы. Мои вложения основаны наOpenAIEmbeddings тотQdrantClientявляется локальным для моего случая коллекция, которую я создаю, имеет VectorParams как таковую:VectorParams(size=2000, distance=Dist…
0 ответов

Получение ошибок при построении контроля качества PDF с помощью OPEN AI и Langchain.

Я пытаюсь использовать Langchain & AI. Итак, я установил все библиотеки и попытался написать приведенный ниже код с документацией Langchain. Но я, кажется, сталкиваюсь с некоторыми ошибками, которые я не могу решить. Вот мой код: import os from …
1 ответ

Как добиться встраивания текста с помощью BERT?

Я пытаюсь создать функцию встраивания текста с помощью BERT. Там говорилось, что BERT может встраивать текст. Однако я не могу найти функцию внедрения в учебнике BERT. Вот ссылка, которую я нашел: https://huggingface.co/docs/transformers/model_doc/b…
0 ответов

У меня есть текстовые данные для анализа настроений. С помощью трех классов я хочу создать вложения и получить центроиды данных. Есть идеи?

У меня есть текстовые данные для анализа настроений. С тремя классами (-1,0,1) я хотел бы создатьembeddingsи получить центроиды данных, чтобы новые данные можно было назначать в соответствии с центроидами на основе косинусного сходства. Есть идеи? Я…
0 ответов

Кластеры HDBSCAN объединяют в одном кластере встраивания, которые находятся слишком далеко друг от друга.

У меня есть задача группировать высказывания для чат-бота на основе сходства предложений, чтобы выяснить, какие темы задают пользователи и насколько они важны. Я конвертирую высказывания в встраивания предложений, используя «all-mpnet-base-v2». Вект…
1 ответ

Вызов функции-члена toArray() в массиве – predis laravel

Я пытаюсь использовать Redis с Laravel, чтобы найти похожие векторы, используя вложения OpenAI. У меня есть пример на Python, который выглядит так: def search_similar_documents(self, entity_id, vector, topK=5): query = Query("*=>[KNN 2 @embedding…
25 авг '23 в 05:06
0 ответов

Как создать несколько баз данных цветности и запросить отдельные базы данных?

Я делаю это с несколькими текстовыми файлами, чтобы каждый текстовый файл получал 1 дБ. А затем запросите их индивидуально Я бы хотел задать вопрос индивидуально. from langchain.vectorstores import Chroma from langchain.embeddings import OpenAIEmbed…
10 июл '23 в 16:14
0 ответов

Получение «несанкционированного» результата из API Azure OpenAI Embeddings

У меня есть следующий код, который возвращает «Неавторизованный». Я озадачен. Идентичный код с ключом OpenAI (не Azure) и URL-адресом OpenAI дает 200 результатов. Что я делаю не так? Единственное: имею ли я право звонить из запада США (Калифорния) в…
28 июн '23 в 22:21
0 ответов

Ошибка подключения к семантическому кэшу Azure Redis

Я пытаюсь подключиться к семантическому кешу Redis, используя приведенный ниже код. import redis import langchain from langchain.cache import RedisSemanticCache from langchain.embeddings import OpenAIEmbeddings from dotenv import load_dotenv # Conne…
0 ответов

Динамический выбор подсказок в langchain

Я хочу использовать несколько подсказок для разных сценариев. В документации я нашел следующее, но, видимо, оно не работает с поиском по хранилищу векторов. цепочка = MultiPromptChain.from_prompts(OpenAI(), Prompt_infos, verbose=True) В любом случае…
13 июл '23 в 14:19
1 ответ

Ограничьте количество токенов в минуту в LangChain, используя OpenAI-вложения и векторное хранилище Chroma.

Я ищу способ ограничить количество токенов в минуту при сохранении вложений в векторном хранилище Chroma. Вот мой код: [...] # split the documents into chunks text_splitter = CharacterTextSplitter(chunk_size=1500, chunk_overlap=0) texts = text_split…
18 июл '23 в 14:46