Пьенконе: Должен ли я поместить все данные и их различные поля в один индекс или использовать пространства имен для каждого поля?

Я храню векторы с помощью Pinecone и имею набор данных Movie со следующими полями:

      id title genres original_language overview production_companies release_date budget revenue runtime vote_average vote_count credits keywords

Я хочу иметь возможность выполнять семантический поиск по этому набору данных, используя все поля, например, поисковый запрос может быть следующим:

Фильм на английском языке о космосе, в нем играет актер Мэтью МакКонахи, его продолжительность превышает два часа.

Как лучше всего индексировать эти данные?

Должен ли я объединить все поля в один индекс или мне следует разделить каждое поле на собственное пространство имен, а затем использовать агрегацию?

Спасибо

0 ответов

Другие вопросы по тегам