PGVector от LangChain в качестве векторной базы данных для приложения дополненной генерации (RAG)
https://python.langchain.com/docs/integrations/vectorstores/pgvector
Один из обязательных аргументов вPGVector.from_documents()
is , который является строкой подключения к базе данных PostgreSQL. Форматconnection_string
являетсяpostgresql://username:password@host:port/databasename
поэтому я использовалpostgresql://tombomer:Passw0rd1@localhost:5432/postgres
который (я думаю) соответствует БД, которую я установил ранее с помощьюpsql
интерфейс командной строки
Я выполнил следующие команды:
-
psql postgres
который, я думаю, включает CLI psql для базы данных Postgres по умолчанию, а затем подключается к моей базе данных под названиемpostgres
и сделал иCREATE EXTENSION vector;
- тот
vector
команда работала нормально, ноpgvector
отдалERROR: could not open extension control file "/Users/tombomer/homebrew/share/postgresql@14/extension/pgvector.control": No such file or directory
Затем я запускаю скрипт Python и получаю длинный вывод, ошибка:sqlalchemy.exc.DataError: (psycopg2.errors.InvalidTextRepresentation) malformed array literal: "[-0.40820312,0.19042969...]"
Я также следил за этим: https://bugbytes.io/posts/vector-databases-pgvector-and-langchain/ , но когда я доберусь доCREATE EXTENSION pgvector;
я получаю то же самоеcould not open extension control file
ошибка, как указано выше
TLDR: как мне настроить базу данных Postgres и какой должна быть строка подключения?