Описание тега pattern-mining
0
ответов
Анализ последовательных правил как программный подход
В настоящее время я работаю с алгоритмом последовательного майнинга правил. Я разработал новый алгоритм майнинга последовательных правил с новым параметром. Может ли это (майнинг последовательных правил) рассматриваться как подход мягких вычислений?…
30 окт '17 в 16:56
2
ответа
Генерация матрицы изображений из кода цепочки Freeman
Предположим, у меня есть код цепи Freeman с 8 направлениями, как показано ниже, в списке Python: freeman_code = [3, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 5] Где направления будут определены следующим образом: Мне нужно преобразовать это в матрицу изоб…
17 дек '18 в 16:08
1
ответ
Распознавание образов в цифрах?
Считайте, что входной файл будет 25 27 29 25 27 29 25 27 29 25 27 29 25 27 28 Я хочу извлечь шаблон 25 27 29. Какие алгоритмы я могу использовать для анализа шаблона в такой последовательности? Я готов реализовать это, используя неконтролируемые мет…
10 июн '16 в 10:47
1
ответ
Spark Mllib - добыча по частым схемам - правила ассоциации - не получение ожидаемых результатов
У меня есть следующий набор данных: [A,D] [C,A,B] [A] [A,E,D] [B,D] И я пытаюсь извлечь некоторые правила ассоциации, используя Frequent Pattern Mining, используя Spark Mllib. Для этого у меня есть следующий код: val transactions = sc.textFile("/use…
28 сен '16 в 14:11
1
ответ
TraMineR, извлеките все существующие комбинации событий как фиктивные переменные
Допустим, у меня есть эти данные. Моя цель - извлечь комбинации последовательностей.У меня есть одно ограничение, время между двумя событиями может быть не более 5, давайте назовем это maxGap, User <- c(rep(1,3)) # One users Event <- c("C","B"…
16 фев '17 в 10:06
0
ответов
Как создать пространственно-временные структуры, подобные этой?
Пожалуйста, найдите ссылку на картинку ниже. Я работаю над проектом, в котором мне нужно генерировать шаблоны, подобные изображенному на картинке. Я новичок в программировании, и я хочу знать, как использовать Python для создания такого шаблона. вве…
25 окт '18 в 02:42
1
ответ
Последовательный шаблон или набор элементов fp дерева
FP-алгоритмы роста используются для Itemset Mining. Есть ли способ использовать эти алгоритмы для майнинга последовательных паттернов вместо майнинга Itemset?
06 авг '18 в 21:01
1
ответ
Почему BIDE использует полу-максимальный период для сокращения пространства поиска?
Согласно статье, которая определяет BIDE: BIDE: эффективный майнинг частых замкнутых последовательностей Теорема 2 (обрезка пространства поиска BackScan): Пусть префиксная последовательность будет n-последовательностью, Sp=e1e2...en, Если ∃i(1≤i≤n) …
04 июн '18 в 13:22
1
ответ
Извлеките Подъем и Поддержку из Правил Ассоциации, используя SPARK
Я использую алгоритм поиска по частым шаблонам - Правила ассоциации: import org.apache.spark.mllib.fpm.AssociationRules import org.apache.spark.mllib.fpm.FPGrowth.FreqItemset val freqItemsets = sc.parallelize(Seq( new FreqItemset(Array("a"), 15L), n…
27 сен '16 в 16:18
1
ответ
Можно ли прочитать коллекцию строк и вернуть регулярное выражение?
У меня есть коллекция файлов из нескольких источников. Каждый файл содержит строки вроде: File 1: A) B) C) D) E) File 2: a) b) c) d) e) File 3: a. b. c. d. e. File 4: a- b- c- d- e- (...) Я знаю, что мог бы заранее закодировать все возможные шаблоны…
28 мар '16 в 22:00
3
ответа
В чем разница между "последовательным майнингом паттернов" и "последовательным майнингом правил"
Документация для очень мощного инструмента SPMF для анализа данных с открытым исходным кодом перечисляет их отдельно: http://www.philippe-fournier-viger.com/spmf/index.php?link=algorithms.php Кто-нибудь знает почему?
03 янв '16 в 01:38
1
ответ
Правильный формат для преобразования строки в объект даты и времени R
Я сгенерировал систему формата даты и времени. Это выглядит примерно так "2017-04-12-02.29.25.000000". Я хочу преобразовать этот формат в стандартный, чтобы моя система могла это прочитать, а позже я могу преобразовать его в минуты. Кто-то, пожалуйс…
11 июн '18 в 12:45
0
ответов
Последовательный паттерн майнинг - как подготовить данные
Я ищу хороший подход к последовательному анализу паттернов при подготовке данных для классификатора машинного обучения. Особой проблемой здесь являются предметы, встречающиеся в равные моменты времени. Данные выдержки (полные данные ниже): a b c d e…
22 июн '18 в 18:09
1
ответ
Apriori, arulesSequence, в R: есть ли поддержка последовательности "корзин" (заказ в пределах одной поездки за покупками не имеет значения)?
Я начинаю работу с arulesSequence с целью выполнения анализа частых последовательностей для некоторых данных, которые у меня есть. Данные для магазина A выглядят следующим образом: CUSTOMER_ID seq_num Размер купленных_элементов 1 17399 1 2 {100,100}…
11 янв '16 в 07:46
0
ответов
Максимальное количество состояний в TraMineR?
У меня есть набор данных с текстом, написанным пользователями в текстовом поле на веб-сайте. Из-за характера сайта большинство пользователей написали несколько раз в поле. Теперь я хочу посмотреть, если есть шаблон. Например, пользователи, которые в…
23 янв '16 в 16:10
0
ответов
Частая добыча предметов
У меня есть вопросительный вопрос о населении, каждый человек дает ответ на каждый вопрос, у каждого человека есть некоторые атрибуты, такие как возраст, пол, раса, место рождения и т. Д. как я могу объединить людей на основе их ответов и создать ме…
08 май '18 в 16:45
0
ответов
Как исправить "Ошибка в файле (con, "r")" в RStudio
Я попробовал cspade, установленный с anaconda, но когда я запускаю код, я получаю сообщение об ошибке library(arulesSequences) s1 <- cspade(trans_matrix, parameter = list(support = 0.3,maxlen = >3,maxsize = 3), control = list(verbose = TRUE)) …
22 май '19 в 07:42
2
ответа
Эффективно разбить строку на основе n-го вхождения подстроки, используя R
Вступление Учитывая строку в R, возможно ли получить векторизованное решение (т.е. без циклов), где мы можем разбить строку на блоки, где каждый блок определяется n-м появлением подстроки в строке. Работа сделана на воспроизводимом примере Предполож…
04 апр '19 в 16:01
1
ответ
Есть ли способ использовать найденные последовательные шаблоны в качестве входных данных для алгоритма кластеризации
Я делаю проект по классификации пользователей на основе их шаблонов серфинга на сайте. Для этого мне нужно найти шаблоны в данных и затем кластеризовать их, но кластеризация является проблемой, так как алгоритмы кластеризации, которые я пробовал (k-…
07 май '19 в 14:48
2
ответа
Как я могу удалить строки, которые имеют два или более слов (после друг друга) в последовательности?
Я хочу удалить строки, которые имеют одинаковые два или более слов друг за другом, как последовательность. Это делается для последовательного анализа паттернов. Я уже попробовал distinct() а также duplicated() функция, но это только удаляет всю стро…
13 май '19 в 14:57