Интеллектуальный анализ данных: наборы частых предметов

Когда вас спрашивают в экзаменационном вопросе, чтобы найти все частые наборы предметов, это только тот набор, который был в последний раз проработан, это ответ, который вы даете, или это необходимо дать и перед этим тоже.

например, скажем, если последние результаты, которые я получаю для набора, (A,B,D), то это то, что мой частый набор элементов или мне нужно также включить все найденные ранее, которые также удовлетворяют minSup, например (A,B) (A,D) (B,D) и т. Д.

1 ответ

Я понимаю, что вы спрашиваете, удовлетворяет ли частый набор элементов минимальному порогу поддержки, поддерживает ли подмножества этого набора элементов также минимальную поддержку? Ответ - да, подмножества также удовлетворяют минимальному порогу поддержки.

Логика здесь - подход снизу вверх. Наборы кандидатов размера 2 генерируются из частых наборов размеров 1. Наборы кандидатов размера 3 генерируются из частых наборов размеров 2.

Для примера набора данных:

  • Ряд 1: A B C D E
  • Ряд 2: A C D
  • Ряд 3: до н.э
  • Ряд 4: A C D E
  • Ряд 5: A D E
  • Ряд 6: A B C D
  • Ряд 7: A B C
  • Ряд 8: A C
  • Ряд 9: B C D
  • Ряд 10: B D E

Сначала были созданы наборы кандидатов размера 1. Это: A, B, C, D, E. Теперь рассчитывается поддержка каждого кандидата. A=7, B=6, C=8, D=7, E=4. Теперь, если значение minSup равно 5, это сокращается. Если значение minSup равно 3, то все кандидаты размера 1 оценивались как частые.

Были созданы наборы кандидатов второго размера 2. Подход заключается в том, чтобы объединять часто встречающиеся товарные единицы размера 1. Таким образом, A B, A C, A D, A E, B C, B D, B E, C D, C E, D E наборы элементов-кандидатов размера 2 были сгенерированы. После этого были рассчитаны значения поддержки каждого кандидата. Поддержка AB составляет 3, поскольку строка 1, строка 6 и строка 7 включают этот шаблон. Но кандидат BE присутствует только для строки 1 и строки 10, и если значение minSup равно 3, этот кандидат сокращается.

Поскольку эта логика используется, если верхний набор элементов является частым, подмножества также должны быть частыми. Если нет, то верхний набор элементов не может быть сгенерирован.

Я надеюсь, что смогу объяснить себя.

Другие вопросы по тегам