Создание векторных вложений из нескольких атрибутов
Чтобы реализовать нечеткое сопоставление между элементами, я хотел бы создать векторное встраивание из элементов с несколькими атрибутами. Эти атрибуты включают в себя:
- текстовые поля с фразами
- список адресов электронной почты (сильный показатель сходства)
- несколько числовых свойств
В большинстве примеров показано только, как создать встраивание из неструктурированного блока текста. Насколько я понимаю, необходимо применить два метода:
- генерировать частичные внедрения для каждого из атрибутов
- объединить все вложения
Как можно создать частичное внедрение для нетекстовых атрибутов (числовых и списка адресов электронной почты)? Существуют ли какие-либо методы или библиотеки для объединения вложений с весами? Или это ошибочный подход к сопоставлению сходства данных такого типа?