Описание тега vector-database
2
ответа
Как найти ближайшие векторы встраивания?
У меня есть 100 000 известных вложений, т.е. [emb_1, emb_2, ..., emb_100000] Каждое из этих вложений получено из вложения предложений GPT-3 с размерностью 2048. Моей задаче дано встраивание () найти ближайшие 10 вложений из приведенных выше100kвложе…
22 июл '22 в 02:22
1
ответ
Milvus, поиск сходства по id вектора
Я пытаюсь провести поиск сходства векторов с помощью необработанного идентификатора вектора (тип VarChar). Например, вектор состоит из трех полей: auto_id (int64), userId (VarChar), vectorField (FloatVector). Одно из возможных решений, на мой взгляд…
16 сен '22 в 07:38
0
ответов
FailedPrecondition: 400 Matching Engine не поддерживается в регионе europe-west4
Я пробую механизм сопоставления на gcp и хочу создать индекс. Я вижу, что выбранный мной регион не поддерживается, и я знаю, чтоus-central1является поддерживаемым регионом. Однако по юридическим причинам и правилам я не могу хранить данные в США. Ес…
10 ноя '22 в 10:00
0
ответов
использовать существующий elasticsearch7/8 для поиска векторов вместо добавления специальной базы данных векторов
У меня уже установлена эластичная поисковая система, и я хочу добавить встраивание openai ada для поддержки оценки лексического сходства для улучшения многоязычности и синонимов в моем приложении. Должен ли я добавить новую базу данных векторов ил…
29 июл '23 в 08:39
1
ответ
Как хранить внедрения OpenAI в базе данных Redis Vector?
Я просмотрел веб-сайты Azure и Redis и понял, что Redis можно использовать для хранения кеша. Я хочу сохранить внедрения OpenAI в базе данных Redis Vector. Я зарегистрировал бесплатную пробную учетную запись облачной версии Redis. Я могу подключитьс…
07 апр '23 в 07:20
1
ответ
Как развернуть базу данных цветности (векторную базу данных) в производстве
Я работаю над проектом, в котором хочу сохранить вложения в векторной базе данных. нужна помощь или ресурсы для развертывания базы данных Chroma для производственного использования
19 июн '23 в 09:59
0
ответов
Как я могу удалить точку данных в индексе механизма сопоставления Google с помощью Langchain
Я работаю с механизмом сопоставления Langchain и просмотрел их документацию по интеграции с VectorStores (https://python.langchain.com/docs/integrations/vectorstores/matchingengine). Я успешно реализовал создание индекса и конечной точки для хранени…
29 авг '23 в 06:54
1
ответ
Почему я получаю сообщение об ошибке аутентификации при попытке запустить руководство LangChain по векторной базе данных FAISS с помощью OpenAI API?
Я следую руководству YouTube по LangChain, где оно учит Create Your Own ChatGPT with PDF Data in 5 Minutes (LangChain Tutorial) а вот ссылка на блокнот Colab , предоставленная автором для его работы под описанием видео. Я не менял многие из его кодо…
24 май '23 в 09:28
1
ответ
Оптимизация Weaviate для поиска по встраиванию изображений без сохранения изображений
В настоящее время я работаю над проектом, в котором использую Weaviate в качестве векторной базы данных для хранения и поиска изображений на основе их вложений. Сами изображения хранятся в корзине S3. Моя цель — использовать возможности Weaviate иск…
06 авг '23 в 10:55
1
ответ
Как обнаружить ошибку дублирования идентификатора при использовании langchain.vectorstores.Chroma.from_documents()
Я использую следующую строку для добавления документов langchain в базу данных цветности:Chroma.from_documents(docs, embeddings, ids=ids, persist_directory='db') когда идентификаторы дублируются, я получаю эту ошибку:chromadb.errors.IDAlreadyExistsE…
06 июн '23 в 12:53
1
ответ
Невозможно ли разбить на страницы отфильтрованные результаты с помощью векторной базы данных Weaviate?
Фильтр запросов работает Использование фильтрации запросов Weaviate работает нормально, например, из их руководства : response = ( client.query .get("JeopardyQuestion", ["question", "answer", "round"]) .with_where({ "path": ["round"], "operator": "E…
10 авг '23 в 18:05
1
ответ
langchain векторный магазин: вопрос и ответ из одного встраивания в векторный магазин
Я работал над созданием векторного хранилища из серии абзацев текстового документа. Текст документа не зря разбит на непересекающиеся абзацы, поскольку они представляют разную информацию. В эти абзацы включены метаданные. from langchain.embeddings.o…
07 июл '23 в 17:46
2
ответа
Модель SagemakerEndpoint не возвращает полный вывод, только при появлении запроса с помощью langchain
У меня есть модель Huggingface, развернутая за конечной точкой sagemaker, которая выдает ожидаемые результаты при прямом прогнозировании против нее. Однако, когда я инициализирую его с помощью класса SagemakerEndpoint из langchain, он возвращает тол…
14 июл '23 в 09:02
0
ответов
Как создать векторную базу данных огромного набора корпоративных документов?
Это своего рода вопрос дизайна. Я новичок в VectorDB. Я работаю над созданием системы обобщения LLM для огромного набора документов. В этих документах будет указана определенная дата. Пользователи могут искать их в эти даты. Когда пользователь выпол…
20 июл '23 в 05:08
0
ответов
Ошибка React + Pinecone + OpenAI CORS при добавлении встроенных векторов в базу данных векторов Pinecone
Я использую векторную базу данных Pinecone для хранения вложений OpenAI для ввода текста и документов в рамках React. "use-client" import { loadQAStuffChain } from "langchain/chains"; import { OpenAI } from "langchain/llms/openai"; import { Document…
29 май '23 в 07:00
0
ответов
AttributeError при использовании Milvus
[AttributeError: объект «список» не имеет атрибута «изменение формы». Может ли кто-нибудь помочь решить, почему я получаю эту ошибку в последнем цикле for. Здесь я использую открытый API Ai и получаю встроенные данные для текста в формате PDF, и теп…
28 июл '23 в 16:46
1
ответ
Как включить свойство перекрестной ссылки в запрос weaviate?
Проблема в том, что я не знаю, как включить свойство перекрестной ссылки writePublications в результат запроса. У меня есть две коллекции в базе данных Weaviate — «Исследователь» и «Публикация». Схемы: publication_class_schema = { "class": publicati…
10 май '23 в 20:28
0
ответов
Как расширить два вложения разных размеров?
Я пытаюсь реализовать это решение: https://www.mlq.ai/gpt-4-pinecone-website-ai-assistant/ Здесь у меня возникла проблема: «res» не определен, хорошо, я просматриваю документацию и не уверен, откуда взялось это «res». Скриншот ошибки Вот код, я поду…
21 май '23 в 04:25
0
ответов
Ошибка протокола в режиме клиента Chroma
Я развертываю сервер Chroma в контейнере, когда использую функцию «collection.add()», он показывает ProtocolError: («Соединение прервано.», ConnectionResetError(10054, «Существующее соединение было принудительно закрыто удаленным хостом», None, 1005…
09 авг '23 в 04:10
0
ответов
Как сгенерировать намерение диалогового потока, обучающие фразы и текстовый ответ из данного документа с помощью LLM иchatgpt
Я работаю над проектом, в котором я могу очистить веб-сайт пользователя, и на основе этого очищенного контента мне нужно создать персонализированное намерение диалогового потока, обучающие фразы и текстовый ответ, используя LLM, сосновую шишку и Cha…
02 июн '23 в 06:40