Последовательный шаблон или набор элементов fp дерева
FP-алгоритмы роста используются для Itemset Mining. Есть ли способ использовать эти алгоритмы для майнинга последовательных паттернов вместо майнинга Itemset?
1 ответ
Алгоритм FPGrowth определен для использования в транзакциях для поиска наборов элементов. Таким образом, он не заботится о порядке элементов, и каждый элемент может появляться только один раз в транзакции.
Если вы хотите применить его к последовательностям, чтобы найти последовательные шаблоны, то это более общая проблема. Другими словами, майнинг наборов элементов является частным случаем последовательного майнинга паттернов. Для решения этой проблемы вам нужно будет обобщить FPGrowth. Во-первых, вам нужно изменить FPTree для хранения последовательностей, в которых элементы могут появляться более одного раза. Это значит изменить то, как создаются ветви деревьев. Но вам также необходимо изменить способ обработки ссылок между элементами, представляющими узлы, поскольку один и тот же элемент может появляться несколько раз за последовательность.
Но действительно ли это хорошая идея? Я не уверен в этом. Существует много последовательных алгоритмов интеллектуального анализа паттернов. Например, вы можете использовать несколько реализаций в моей библиотеке интеллектуального анализа данных SPMF ( http://www.philippe-fournier-viger.com/spmf/), реализованной в Java, поэтому вам не нужно реализовывать ее самостоятельно.