Описание тега chromadb

1 ответ

Создание и использование идентификаторов ChromaDB

Мне интересно, как люди справляются с идентификаторами в Chroma DB. Я планирую хранить фрагменты кода (скажем, отдельные функции или классы) в коллекции, и для каждого из них нужен уникальный идентификатор. Эти документы будут сгенерированы, поэтому…
02 сен '23 в 21:43
0 ответов

HuggingFace Space с Langchain и Gradio SDK: почему я получаю ошибку, связанную с FAISS, когда использую Chroma, а не FAISS?

Я создаю HuggingFace Space с Langchain (Gradio SDK) для обмена своими данными, клонирую из пространства Chat Your Data Харрисона Чейза и продолжаю оттуда. Исправлена ​​проблема с устареванием (см. Обсуждение ), переключился на DirectoryLoader, чтобы…
30 авг '23 в 18:28
2 ответа

Как запустить multiprocess Chroma.from_documents() в Langchain

Можем ли мы каким-то образом передать возможность запуска нескольких потоков/процессов при вызове Chroma.from_documents() в Langchain? Я пытаюсь встроить 980 документов (модель внедрения — mpnet в CUDA), и это занимает вечность. Характеристики: Прог…
3 ответа

Попытка выполнить сборку докера, которая не удалась при установке chromadb

Я пытаюсь создать образ докера для моего проекта фляги Python. Похоже, возникла проблема с приведенными ниже пакетами, от которых зависит сборка Chromadb. уткадб, hnswlib Ниже приведено содержимое файла docker. FROM python:3.10-slim-buster ENV HNSWL…
26 май '23 в 13:20
1 ответ

Как удалить документы в векторном магазине LangChain

Я следую руководству LangChain , чтобы создать селектор примеров для автоматического выбора похожих примеров с учетом входных данных. example_selector = SemanticSimilarityExampleSelector.from_examples( # This is the list of examples available to sel…
0 ответов

Проблемы с удалением документов ChromaDB.

Кажется, я не могу удалить документы из моей базы данных векторов Chroma. Я был бы признателен за любую информацию о том, почему этот пример не работает и какие изменения можно/нужно внести, чтобы он работал правильно. import dotenv import os import…
1 ответ

Как развернуть базу данных цветности (векторную базу данных) в производстве

Я работаю над проектом, в котором хочу сохранить вложения в векторной базе данных. нужна помощь или ресурсы для развертывания базы данных Chroma для производственного использования
19 июн '23 в 09:59
0 ответов

ModuleNotFoundError: нет модуля с именем «_ctypes» при установке chromadb через pip

Я пытаюсь установить chromadb через pip в Ubuntu. Когда я запускаю команду pip install chromadb Я получаю ошибку Traceback (most recent call last): File "/home/tbreimer/.local/lib/python3.11/site-packages/pip/_vendor/pyproject_hooks/_in_process/_in_…
17 июл '23 в 20:50
4 ответа

Цепочка поиска langchain qa не может фильтроваться по конкретным документам

пытаюсь использовать RetrivalQA с Chromadb для создания бота вопросов и ответов по документам нашей компании. общая настройка, как показано ниже: импортировать библиотеки from langchain.vectorstores.chroma import Chroma # for storing and retrieving …
20 июн '23 в 00:47
2 ответа

streamlit: в вашей системе установлена ​​неподдерживаемая версия sqlite3. Chroma требует sqlite3 >= 3.35.0

Ранее я развернул приложение в Streamlit Cloud , которое использовалоchromadb. Раньше приложение работало нормально. Однако сегодня я столкнулся с новой ошибкой (как указано в заголовке), и приложение перестало работать. Я попытался устранить непола…
23 авг '23 в 06:31
0 ответов

Не удалось создать колесо для chroma-hsnwlib (#include <Python.h> не существует) в Ubuntu

Я получаю сообщение об ошибке «Не удалось создать колесо для chroma-hsnwlib» на сервере Ubuntu. В хронологии: /tmp/pip-build-env/overlay/lib/python3.10/site-packages/pybind11/include/pybind11/detail/../detail/common.h: 226:10: Python.h нет такого фа…
27 авг '23 в 14:47
0 ответов

Проблема с использованием Chromadb с Typescript

Я пытаюсь использовать Chromadb с langchain. У меня запущен докер, и я установил все, что указано в документации. Я продолжаю получать эти ошибки при запуске кода, если докер включен Generated documents: [ Document { pageContent: `["Tortoise: Labyri…
07 июн '23 в 19:45
1 ответ

Как обнаружить ошибку дублирования идентификатора при использовании langchain.vectorstores.Chroma.from_documents()

Я использую следующую строку для добавления документов langchain в базу данных цветности:Chroma.from_documents(docs, embeddings, ids=ids, persist_directory='db') когда идентификаторы дублируются, я получаю эту ошибку:chromadb.errors.IDAlreadyExistsE…
06 июн '23 в 12:53
1 ответ

Очень медленный ответ от механизма запросов вопросов и ответов на основе LLM

Я создал бот для запросов вопросов и ответов на основе CSV-файла размером 4 МБ, который у меня есть в моем локальном хранилище. Я использую цветность для создания векторной базы данных, а модель внедрения — Instructor Large из обнимающего лица, а мо…
1 ответ

Как добавить коллекции/объект в базу данных Chroma?

Я пытаюсь запустить несколько документов через API встраивания текста OpenAI и вставить полученное встраивание вместе с текстом в базу данных Chroma локально. sales_data = medium_data_split + yt_data_split sales_store = Chroma.from_documents( sales_…
0 ответов

Управление ChromaDB

Существует ли эффективный способ управления экземплярами ChromaDB, в частности, с использованием метаданных для удаления документов? Поддерживаются вставки/повышения. Поддерживается удаление по коллекции, но я не могу найти в их API многого для удал…
17 июн '23 в 07:12
7 ответов

LangChain Chroma — загрузка данных из базы данных векторов

Я написал код LangChain, используя Chroma DB, для векторного хранения данных с URL-адреса веб-сайта. В настоящее время он работает для получения данных из URL-адреса, сохранения их в папке проекта и последующего использования этих данных для ответа …
12 май '23 в 00:15
0 ответов

Как создать векторную базу данных огромного набора корпоративных документов?

Это своего рода вопрос дизайна. Я новичок в VectorDB. Я работаю над созданием системы обобщения LLM для огромного набора документов. В этих документах будет указана определенная дата. Пользователи могут искать их в эти даты. Когда пользователь выпол…
20 июл '23 в 05:08
1 ответ

Чат-бот, использующий CSV-файл

Я пытаюсь создать чат-бота, используя службу ботов Azure и открытый искусственный интеллект Azure. Источником данных являются несколько файлов csv. Я могу создавать встраивание, используя расширение цветности langchain. Но при запросе встраивания я …
1 ответ

Можем ли мы ускорить создание коллекции в ChromaDB?

Это код для создания коллекции в ChromaDB: client = chromadb.Client() collection = client.create_collection( name="collection_name", metadata={"hnsw:space": "cosine"} ) и это для добавления данных в коллекцию: collection.add( documents=a['documents'…
17 авг '23 в 08:54