Описание тега openaiembeddings
2
ответа
Настройте встраивание слов в свой словарный запас
У меня есть словарный запас, связанный с ресторанным бизнесом на испанском языке, и я использую предопределенные встраивания слов на испанском языке с помощью FastText и Bert, однако я вижу, что есть много слов за пределами словарного запаса (oov), …
08 авг '23 в 08:57
1
ответ
Проблема LangChain/OpenAI с форматом текстового файла из веб-скрапинга, приводящая к сбою вызова API для «максимальной длины контекста»
Я пытаюсь использовать расширенную генерацию поиска, используя TextLoader и CharacterTextSplitter LangChain. Мои исходные данные — это текстовые данные, которые я собрал с веб-сайта клиента. При очистке без предварительной обработки данные становятс…
30 авг '23 в 16:08
1
ответ
Как добавить коллекции/объект в базу данных Chroma?
Я пытаюсь запустить несколько документов через API встраивания текста OpenAI и вставить полученное встраивание вместе с текстом в базу данных Chroma локально. sales_data = medium_data_split + yt_data_split sales_store = Chroma.from_documents( sales_…
04 июл '23 в 07:04
1
ответ
Получите данные из нескольких коллекций PGVector с помощью langchain.
У меня есть несколько коллекций в базе данных PGVector. COLLECTION_NAME1 = "mydata1" COLLECTION_NAME2 = "mydata2" Теперь я использую метод PGVector для загрузки из него данных на основе коллекции. embeddings = OpenAIEmbeddings() store1 = PGVector( c…
17 июл '23 в 11:12
0
ответов
Azure Open AI внедрения QNA с подмножеством загруженных файлов
Я новичок в Azure OpenAI, и ниже описано, чего я пытаюсь достичь. Я хочу использовать службы Azure OpenAI для qna в файле PDF. Я просмотрел несколько документов и блогов, связанных с этим, и вот что я понял на данный момент. Я могу загружать свои фа…
08 авг '23 в 09:56
1
ответ
Как добавить память в load_qa_chain или как реализовать ConversationalRetrievalChain с помощью специального приглашения с несколькими входами
Я пытаюсь предоставить специальную подсказку для вопросов и ответов в langchain. Мне не удалось сделать это с помощью ConversationalRetrievalChain, поскольку он не позволял вводить несколько пользовательских входных данных в пользовательском приглаш…
15 июл '23 в 08:21
1
ответ
Чат-бот, использующий CSV-файл
Я пытаюсь создать чат-бота, используя службу ботов Azure и открытый искусственный интеллект Azure. Источником данных являются несколько файлов csv. Я могу создавать встраивание, используя расширение цветности langchain. Но при запросе встраивания я …
18 авг '23 в 07:51
0
ответов
Как заменить OpenAiEmbeddings на Huggingface в Langchain?
const { HuggingFaceInferenceEmbeddings } = require('@huggingface/inference'); const embeddings = new HuggingFaceInferenceEmbeddings({ apiKey: process.env.HUGGINGFACEHUB_API_KEY, model: "hkunlp/instructor-large", }); vectorStore = await HNSWLib.load…
09 июл '23 в 13:22
2
ответа
Использование API внедрения в Azure OpenAI
Когда я использую внедрения с Azure OpenAI, я получаю 404 (ресурс не найден): EmbeddingsOptions embdOptions = new EmbeddingsOptions(text); Azure.AI.OpenAI.Embeddings response = Task.Run(() => mOpenAiClient.GetEmbeddingsAsync(mWebSvc.AzureOpenAI.D…
01 июл '23 в 21:58
1
ответ
ValueError: не удалось передать входной массив из формы (1536) в форму (2000)
Пытаюсь создать векторсор Qdrant и добавить свои документы. Мои вложения основаны наOpenAIEmbeddings тотQdrantClientявляется локальным для моего случая коллекция, которую я создаю, имеет VectorParams как таковую:VectorParams(size=2000, distance=Dist…
07 июн '23 в 09:19
0
ответов
Получение ошибок при построении контроля качества PDF с помощью OPEN AI и Langchain.
Я пытаюсь использовать Langchain & AI. Итак, я установил все библиотеки и попытался написать приведенный ниже код с документацией Langchain. Но я, кажется, сталкиваюсь с некоторыми ошибками, которые я не могу решить. Вот мой код: import os from …
13 июл '23 в 23:04
1
ответ
Как добиться встраивания текста с помощью BERT?
Я пытаюсь создать функцию встраивания текста с помощью BERT. Там говорилось, что BERT может встраивать текст. Однако я не могу найти функцию внедрения в учебнике BERT. Вот ссылка, которую я нашел: https://huggingface.co/docs/transformers/model_doc/b…
25 авг '23 в 00:04
0
ответов
У меня есть текстовые данные для анализа настроений. С помощью трех классов я хочу создать вложения и получить центроиды данных. Есть идеи?
У меня есть текстовые данные для анализа настроений. С тремя классами (-1,0,1) я хотел бы создатьembeddingsи получить центроиды данных, чтобы новые данные можно было назначать в соответствии с центроидами на основе косинусного сходства. Есть идеи? Я…
31 июл '23 в 00:49
0
ответов
Кластеры HDBSCAN объединяют в одном кластере встраивания, которые находятся слишком далеко друг от друга.
У меня есть задача группировать высказывания для чат-бота на основе сходства предложений, чтобы выяснить, какие темы задают пользователи и насколько они важны. Я конвертирую высказывания в встраивания предложений, используя «all-mpnet-base-v2». Вект…
13 июл '23 в 07:10
1
ответ
Вызов функции-члена toArray() в массиве – predis laravel
Я пытаюсь использовать Redis с Laravel, чтобы найти похожие векторы, используя вложения OpenAI. У меня есть пример на Python, который выглядит так: def search_similar_documents(self, entity_id, vector, topK=5): query = Query("*=>[KNN 2 @embedding…
25 авг '23 в 05:06
0
ответов
Как создать несколько баз данных цветности и запросить отдельные базы данных?
Я делаю это с несколькими текстовыми файлами, чтобы каждый текстовый файл получал 1 дБ. А затем запросите их индивидуально Я бы хотел задать вопрос индивидуально. from langchain.vectorstores import Chroma from langchain.embeddings import OpenAIEmbed…
10 июл '23 в 16:14
0
ответов
Получение «несанкционированного» результата из API Azure OpenAI Embeddings
У меня есть следующий код, который возвращает «Неавторизованный». Я озадачен. Идентичный код с ключом OpenAI (не Azure) и URL-адресом OpenAI дает 200 результатов. Что я делаю не так? Единственное: имею ли я право звонить из запада США (Калифорния) в…
28 июн '23 в 22:21
0
ответов
Ошибка подключения к семантическому кэшу Azure Redis
Я пытаюсь подключиться к семантическому кешу Redis, используя приведенный ниже код. import redis import langchain from langchain.cache import RedisSemanticCache from langchain.embeddings import OpenAIEmbeddings from dotenv import load_dotenv # Conne…
03 авг '23 в 10:43
0
ответов
Динамический выбор подсказок в langchain
Я хочу использовать несколько подсказок для разных сценариев. В документации я нашел следующее, но, видимо, оно не работает с поиском по хранилищу векторов. цепочка = MultiPromptChain.from_prompts(OpenAI(), Prompt_infos, verbose=True) В любом случае…
13 июл '23 в 14:19
1
ответ
Ограничьте количество токенов в минуту в LangChain, используя OpenAI-вложения и векторное хранилище Chroma.
Я ищу способ ограничить количество токенов в минуту при сохранении вложений в векторном хранилище Chroma. Вот мой код: [...] # split the documents into chunks text_splitter = CharacterTextSplitter(chunk_size=1500, chunk_overlap=0) texts = text_split…
18 июл '23 в 14:46