Пьенконе: Должен ли я поместить все данные и их различные поля в один индекс или использовать пространства имен для каждого поля?
Я храню векторы с помощью Pinecone и имею набор данных Movie со следующими полями:
id title genres original_language overview production_companies release_date budget revenue runtime vote_average vote_count credits keywords
Я хочу иметь возможность выполнять семантический поиск по этому набору данных, используя все поля, например, поисковый запрос может быть следующим:
Фильм на английском языке о космосе, в нем играет актер Мэтью МакКонахи, его продолжительность превышает два часа.
Как лучше всего индексировать эти данные?
Должен ли я объединить все поля в один индекс или мне следует разделить каждое поле на собственное пространство имен, а затем использовать агрегацию?
Спасибо