Невозможно загрузить сохраненную базу данных с помощью Chroma/Langchain

Я проглотил все документы и создал коллекцию/вложения с помощью Chroma. У меня есть локальный каталог db. В базе данных есть chroma-collections.parquet и chroma-embeddings.parquet. Они не пусты. Chroma-collections.parquet при открытии возвращает имя коллекции, uuid и нулевые метаданные.

Когда я позже загружаю его с помощью langchain, здесь ничего нет.

      from langchain.vectorstores import Chroma

embeddings = HuggingFaceEmbeddings(model_name=embeddings_model_name)
CHROMA_SETTINGS = Settings(
        chroma_db_impl='duckdb+parquet',
        persist_directory='db',
        anonymized_telemetry=False
)

db = Chroma(persist_directory='db', embedding_function=embeddings, client_settings=CHROMA_SETTINGS)

db.get()возвращает{'ids': [], 'embeddings': None, 'documents': [], 'metadatas': []}

Я пробовал много других альтернативных подходов в Интернете. Например

      import chromadb

client = chromadb.Client(Settings(chroma_db_impl="duckdb+parquet",
                                    persist_directory='./db'))
coll = client.get_or_create_collection("langchain", embedding_function=embeddings)
coll.count() returns 0

Я ожидаю, что все документы и вложения будут доступны. Что мне не хватает?

0 ответов

Другие вопросы по тегам