Создание векторных вложений из нескольких атрибутов

Чтобы реализовать нечеткое сопоставление между элементами, я хотел бы создать векторное встраивание из элементов с несколькими атрибутами. Эти атрибуты включают в себя:

  1. текстовые поля с фразами
  2. список адресов электронной почты (сильный показатель сходства)
  3. несколько числовых свойств

В большинстве примеров показано только, как создать встраивание из неструктурированного блока текста. Насколько я понимаю, необходимо применить два метода:

  1. генерировать частичные внедрения для каждого из атрибутов
  2. объединить все вложения

Как можно создать частичное внедрение для нетекстовых атрибутов (числовых и списка адресов электронной почты)? Существуют ли какие-либо методы или библиотеки для объединения вложений с весами? Или это ошибочный подход к сопоставлению сходства данных такого типа?

0 ответов

Другие вопросы по тегам