Невозможно загрузить сохраненную базу данных с помощью Chroma/Langchain
Я проглотил все документы и создал коллекцию/вложения с помощью Chroma. У меня есть локальный каталог db. В базе данных есть chroma-collections.parquet и chroma-embeddings.parquet. Они не пусты. Chroma-collections.parquet при открытии возвращает имя коллекции, uuid и нулевые метаданные.
Когда я позже загружаю его с помощью langchain, здесь ничего нет.
from langchain.vectorstores import Chroma
embeddings = HuggingFaceEmbeddings(model_name=embeddings_model_name)
CHROMA_SETTINGS = Settings(
chroma_db_impl='duckdb+parquet',
persist_directory='db',
anonymized_telemetry=False
)
db = Chroma(persist_directory='db', embedding_function=embeddings, client_settings=CHROMA_SETTINGS)
db.get()
возвращает{'ids': [], 'embeddings': None, 'documents': [], 'metadatas': []}
Я пробовал много других альтернативных подходов в Интернете. Например
import chromadb
client = chromadb.Client(Settings(chroma_db_impl="duckdb+parquet",
persist_directory='./db'))
coll = client.get_or_create_collection("langchain", embedding_function=embeddings)
coll.count() returns 0
Я ожидаю, что все документы и вложения будут доступны. Что мне не хватает?