Описание тега pattern-mining

0 ответов

Анализ последовательных правил как программный подход

В настоящее время я работаю с алгоритмом последовательного майнинга правил. Я разработал новый алгоритм майнинга последовательных правил с новым параметром. Может ли это (майнинг последовательных правил) рассматриваться как подход мягких вычислений?…
30 окт '17 в 16:56
2 ответа

Генерация матрицы изображений из кода цепочки Freeman

Предположим, у меня есть код цепи Freeman с 8 направлениями, как показано ниже, в списке Python: freeman_code = [3, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 5] Где направления будут определены следующим образом: Мне нужно преобразовать это в матрицу изоб…
17 дек '18 в 16:08
1 ответ

Распознавание образов в цифрах?

Считайте, что входной файл будет 25 27 29 25 27 29 25 27 29 25 27 29 25 27 28 Я хочу извлечь шаблон 25 27 29. Какие алгоритмы я могу использовать для анализа шаблона в такой последовательности? Я готов реализовать это, используя неконтролируемые мет…
1 ответ

Spark Mllib - добыча по частым схемам - правила ассоциации - не получение ожидаемых результатов

У меня есть следующий набор данных: [A,D] [C,A,B] [A] [A,E,D] [B,D] И я пытаюсь извлечь некоторые правила ассоциации, используя Frequent Pattern Mining, используя Spark Mllib. Для этого у меня есть следующий код: val transactions = sc.textFile("/use…
1 ответ

TraMineR, извлеките все существующие комбинации событий как фиктивные переменные

Допустим, у меня есть эти данные. Моя цель - извлечь комбинации последовательностей.У меня есть одно ограничение, время между двумя событиями может быть не более 5, давайте назовем это maxGap, User <- c(rep(1,3)) # One users Event <- c("C","B"…
16 фев '17 в 10:06
0 ответов

Как создать пространственно-временные структуры, подобные этой?

Пожалуйста, найдите ссылку на картинку ниже. Я работаю над проектом, в котором мне нужно генерировать шаблоны, подобные изображенному на картинке. Я новичок в программировании, и я хочу знать, как использовать Python для создания такого шаблона. вве…
25 окт '18 в 02:42
1 ответ

Последовательный шаблон или набор элементов fp дерева

FP-алгоритмы роста используются для Itemset Mining. Есть ли способ использовать эти алгоритмы для майнинга последовательных паттернов вместо майнинга Itemset?
06 авг '18 в 21:01
1 ответ

Почему BIDE использует полу-максимальный период для сокращения пространства поиска?

Согласно статье, которая определяет BIDE: BIDE: эффективный майнинг частых замкнутых последовательностей Теорема 2 (обрезка пространства поиска BackScan): Пусть префиксная последовательность будет n-последовательностью, Sp=e1e2...en, Если ∃i(1≤i≤n) …
04 июн '18 в 13:22
1 ответ

Извлеките Подъем и Поддержку из Правил Ассоциации, используя SPARK

Я использую алгоритм поиска по частым шаблонам - Правила ассоциации: import org.apache.spark.mllib.fpm.AssociationRules import org.apache.spark.mllib.fpm.FPGrowth.FreqItemset val freqItemsets = sc.parallelize(Seq( new FreqItemset(Array("a"), 15L), n…
1 ответ

Можно ли прочитать коллекцию строк и вернуть регулярное выражение?

У меня есть коллекция файлов из нескольких источников. Каждый файл содержит строки вроде: File 1: A) B) C) D) E) File 2: a) b) c) d) e) File 3: a. b. c. d. e. File 4: a- b- c- d- e- (...) Я знаю, что мог бы заранее закодировать все возможные шаблоны…
28 мар '16 в 22:00
3 ответа

В чем разница между "последовательным майнингом паттернов" и "последовательным майнингом правил"

Документация для очень мощного инструмента SPMF для анализа данных с открытым исходным кодом перечисляет их отдельно: http://www.philippe-fournier-viger.com/spmf/index.php?link=algorithms.php Кто-нибудь знает почему?
03 янв '16 в 01:38
1 ответ

Правильный формат для преобразования строки в объект даты и времени R

Я сгенерировал систему формата даты и времени. Это выглядит примерно так "2017-04-12-02.29.25.000000". Я хочу преобразовать этот формат в стандартный, чтобы моя система могла это прочитать, а позже я могу преобразовать его в минуты. Кто-то, пожалуйс…
11 июн '18 в 12:45
0 ответов

Последовательный паттерн майнинг - как подготовить данные

Я ищу хороший подход к последовательному анализу паттернов при подготовке данных для классификатора машинного обучения. Особой проблемой здесь являются предметы, встречающиеся в равные моменты времени. Данные выдержки (полные данные ниже): a b c d e…
1 ответ

Apriori, arulesSequence, в R: есть ли поддержка последовательности "корзин" (заказ в пределах одной поездки за покупками не имеет значения)?

Я начинаю работу с arulesSequence с целью выполнения анализа частых последовательностей для некоторых данных, которые у меня есть. Данные для магазина A выглядят следующим образом: CUSTOMER_ID seq_num Размер купленных_элементов 1 17399 1 2 {100,100}…
11 янв '16 в 07:46
0 ответов

Максимальное количество состояний в TraMineR?

У меня есть набор данных с текстом, написанным пользователями в текстовом поле на веб-сайте. Из-за характера сайта большинство пользователей написали несколько раз в поле. Теперь я хочу посмотреть, если есть шаблон. Например, пользователи, которые в…
23 янв '16 в 16:10
0 ответов

Частая добыча предметов

У меня есть вопросительный вопрос о населении, каждый человек дает ответ на каждый вопрос, у каждого человека есть некоторые атрибуты, такие как возраст, пол, раса, место рождения и т. Д. как я могу объединить людей на основе их ответов и создать ме…
0 ответов

Как исправить "Ошибка в файле (con, "r")" в RStudio

Я попробовал cspade, установленный с anaconda, но когда я запускаю код, я получаю сообщение об ошибке library(arulesSequences) s1 <- cspade(trans_matrix, parameter = list(support = 0.3,maxlen = >3,maxsize = 3), control = list(verbose = TRUE)) …
22 май '19 в 07:42
2 ответа

Эффективно разбить строку на основе n-го вхождения подстроки, используя R

Вступление Учитывая строку в R, возможно ли получить векторизованное решение (т.е. без циклов), где мы можем разбить строку на блоки, где каждый блок определяется n-м появлением подстроки в строке. Работа сделана на воспроизводимом примере Предполож…
04 апр '19 в 16:01
1 ответ

Есть ли способ использовать найденные последовательные шаблоны в качестве входных данных для алгоритма кластеризации

Я делаю проект по классификации пользователей на основе их шаблонов серфинга на сайте. Для этого мне нужно найти шаблоны в данных и затем кластеризовать их, но кластеризация является проблемой, так как алгоритмы кластеризации, которые я пробовал (k-…
2 ответа

Как я могу удалить строки, которые имеют два или более слов (после друг друга) в последовательности?

Я хочу удалить строки, которые имеют одинаковые два или более слов друг за другом, как последовательность. Это делается для последовательного анализа паттернов. Я уже попробовал distinct() а также duplicated() функция, но это только удаляет всю стро…