API тегов Myrrix для представления / веса родителя / ребенка

Я использовал API тегов для тегирования своих предметов, чтобы можно было рассчитывать баллы "схожести" предметов-предметов, поэтому: Предмет 1 помечается {UK, MALE, 50}, Товар 2 помечается {FRANCE, MALE, 22}, такие вещи. Это работает нормально.

То, что я хотел бы сделать, это представить элемент-элемент 'отношения', поэтому, если мое приложение говорит, что 1 является родителем 2 (и просто, чтобы сделать вещи немного сложнее, это многоуровневый), я бы хотел чтобы можно было сказать Миррикс, чтобы они сблизились.

Моим первым решением было добавить тег "PARENT_[имя]" к каждому элементу и для каждого родительского элемента добавить тег "PARENT_[родительское имя]" с меньшим весом по мере продвижения вверх по иерархии. Это удалось сблизить родителей и детей.

К сожалению, общее качество предложений, казалось, немного упало, и результаты казались все более изменчивыми, например, запустите импорт снова, результаты кажутся совершенно случайными. Это то, что можно исправить на уровне возможностей / лямбды?

Я до сих пор не совсем ясно, что представляют собой "функции", но я подозреваю, что, увеличивая количество возможных тегов, мне нужно настроить модель совсем по-другому...

1 ответ

Решение

Это правильный способ думать об этом. Это немного перегружает API, но все же принципиально.

Это может или не может реально помочь результатам. Это зависит от того, понравится ли пользователям, которым нравится A, B, потому что у них общее семейство продуктов. Возможно для музыки; маловероятно для вещей, которые вы покупаете один раз, как тостер.

Изменчивость происходит от случайной начальной точки. Вы будете получать разные модели каждый раз. Если различие является значительным, когда вы начинаете с нуля, то вы, скорее всего, получаете переоснащение. Может быть, ваш набор функций слишком высок или лямбда слишком мала для набора данных.

Вы также должны запустить eval, чтобы увидеть, хороши ли результаты вообще. Если оценка плохая, да, это случай параметров, которые не соответствуют их лучшим значениям.

Идея в том, что вам не нужно каждый раз создавать новую модель с нуля.

Другие вопросы по тегам