Что является разумным способом объединить несколько расчетов Яро-Винклера?

Допустим, я сравниваю двух человек, у каждого из которых есть имя, фамилия, почтовый индекс, адрес (строка1), адрес (строка2) и номер телефона. Все они имеют различную надежность и важность для определения соответствия.

Я могу создать расстояние JW для каждого поля без проблем. Как я могу объединить их, чтобы получить разумную оценку сходства двух людей?

До сих пор я думал о том, чтобы просто взвесить различные рейтинги JW до величины, пропорциональной их релевантности, а затем взять средневзвешенное значение. Я чувствую, что должны быть лучшие методы.

0 ответов

Другие вопросы по тегам