Последовательный шаблон или набор элементов fp дерева

FP-алгоритмы роста используются для Itemset Mining. Есть ли способ использовать эти алгоритмы для майнинга последовательных паттернов вместо майнинга Itemset?

1 ответ

Алгоритм FPGrowth определен для использования в транзакциях для поиска наборов элементов. Таким образом, он не заботится о порядке элементов, и каждый элемент может появляться только один раз в транзакции.

Если вы хотите применить его к последовательностям, чтобы найти последовательные шаблоны, то это более общая проблема. Другими словами, майнинг наборов элементов является частным случаем последовательного майнинга паттернов. Для решения этой проблемы вам нужно будет обобщить FPGrowth. Во-первых, вам нужно изменить FPTree для хранения последовательностей, в которых элементы могут появляться более одного раза. Это значит изменить то, как создаются ветви деревьев. Но вам также необходимо изменить способ обработки ссылок между элементами, представляющими узлы, поскольку один и тот же элемент может появляться несколько раз за последовательность.

Но действительно ли это хорошая идея? Я не уверен в этом. Существует много последовательных алгоритмов интеллектуального анализа паттернов. Например, вы можете использовать несколько реализаций в моей библиотеке интеллектуального анализа данных SPMF ( http://www.philippe-fournier-viger.com/spmf/), реализованной в Java, поэтому вам не нужно реализовывать ее самостоятельно.

Другие вопросы по тегам