Оценка категорий из веб-журналов

Я создаю счетчик для индивидуальной оценки для категорий на веб-сайте.
Ввод: ИД пользователя, категория
Вывод: идентификатор пользователя, Score_cat_1, Score_cat_2 и т. Д...

Оценка дается по 10.

Мой план состоит в том, чтобы сначала подсчитать для каждого пользователя, сколько кликов для каждой категории, затем разделить результаты в квантиле (может быть, в тысяче), чтобы, наконец, использовать алгоритм кластеров для квантилей каждой категории, чтобы кластеризовать их в 10 кластеров, которые будут упорядочены. и дать оценку.
Идея состоит в том, чтобы сгруппировать квантили, которые находятся близко друг к другу в одном кластере, и получить более интересную оценку, чем просто сказать: "10% лучших кликеров получают 10, следующие 10% получают 9 и т. Д."

Мои проблемы следующие:
1- Как вы думаете, это хорошая идея? Есть ли более естественный и точный способ сделать это?
2 - кластер может быть слишком маленьким, и я не могу гарантировать кардинал на каждом кластере.

0 ответов

Другие вопросы по тегам