Описание тега data-mining
Интеллектуальный анализ данных - это процесс анализа больших объемов данных с целью выявления закономерностей и общих черт.
2
ответа
Как использовать функцию интеллектуального анализа данных SQL Server 2008 с ASP.Net
Как использовать функцию интеллектуального анализа данных SQL Server 2008 с ASP.Net
03 окт '08 в 04:36
1
ответ
Генерация правил SAS Enterprise Miner
Я хочу выполнить правила ассоциации для этого набора данных http://archive.ics.uci.edu/ml/machine-learning-databases/00222/. Это набор данных о покупателях, и y является результатом, если кампания убедила их подписаться на продукт или нет. а остальн…
31 дек '16 в 15:10
1
ответ
Сайт на базе PHP с использованием Weka в качестве движка
Я хотел бы разработать веб-приложение на основе php, желательно с использованием MySQL и CodeIgniter PHP Framework. Я никогда раньше не использовал Weka, но мое назначение требует, чтобы я подключил Weka к PHP. План состоит в том, чтобы разработать …
09 янв '18 в 03:29
2
ответа
Могу ли я использовать погремушку на 64-битном R?
Пытаюсь установить rattle На Windows Server 2008 R2 64-битной машине, используя 64-битную версию R ver2.11, я получил следующее сообщение: install.packages("rattle", dependencies=TRUE) Warning: dependencies ‘RGtk2’, ‘rggobi’, ‘RSvgDevice’, ‘Biobase’…
10 май '10 в 20:53
0
ответов
Как кодировать векторную авторегрессивную модель в matlab?
Модель VAR обобщает одномерную авторегрессивную (AR) модель для нескольких временных рядов. Я хотел бы реализовать модель векторной авторегрессии, которая описывает следующую формулу на основе наблюдения времени t: x (t) = c + (t-1) ∑ (i = t + T) * …
09 дек '14 в 21:27
2
ответа
Группировка для извлечения общих значений в полуструктурированных данных
У меня есть "несколько" уродливое поле в базе данных, которое содержит названия локаций. Например, Мэдисон Сквер Гарденс, который также был введен как "Мэдисон Сквер Гарденс" и т. Д. И т. Д. Я пытаюсь извлечь данные, чтобы я мог получить точный спис…
25 ноя '09 в 22:58
1
ответ
Набор данных KDD Cup 1999, как использовать его в Visual Studio 2010
Я скачал набор данных KDD99 здесь: http://archive.ics.uci.edu/ml/machine-learning-databases/kddcup99-mld/kddcup99.html После разархивирования я попытался открыть его с помощью datagrid в VS 2010, но это не сработало, я пробовал разные программы, но …
27 сен '13 в 05:49
2
ответа
Runtime Pompt для Rapidminer
Я использовал Rapidminer и создал серию процессов, которые формируют стандартный набор задач. Теперь я хочу позволить пользователю динамически устанавливать параметры процесса при запуске. Например, при написании CSV-файла я хочу предложить пользова…
15 дек '10 в 12:36
0
ответов
Анализ последовательных правил как программный подход
В настоящее время я работаю с алгоритмом последовательного майнинга правил. Я разработал новый алгоритм майнинга последовательных правил с новым параметром. Может ли это (майнинг последовательных правил) рассматриваться как подход мягких вычислений?…
30 окт '17 в 16:56
1
ответ
Как реализовать анализ ассоциативных правил или анализ корзины с нуля?
Я пытался просмотреть многочисленные статьи, пытаясь понять, каким должен быть мой первый шаг к включению ассоциативного анализа (может быть, анализ "Корзины рынка") в мою систему. Все они углубляются в реализацию алгоритма, но никто не говорил о то…
17 июл '16 в 21:56
1
ответ
Интеллектуальный анализ данных: наборы частых предметов
Когда вас спрашивают в экзаменационном вопросе, чтобы найти все частые наборы предметов, это только тот набор, который был в последний раз проработан, это ответ, который вы даете, или это необходимо дать и перед этим тоже. например, скажем, если пос…
07 янв '14 в 17:08
0
ответов
Оранжевый виджет
Я пытаюсь привести пример, приведенный в руководстве по разработке Orange, для работы с версией 2.7. Однако, хотя я могу протестировать свой виджет из оболочки Python, я не могу получить созданный мной виджет, который будет отображаться в графическо…
15 фев '16 в 20:39
3
ответа
Самый простой способ обрезать ненужные точки в октаве / матлабе
У меня есть координаты точек (х, у), хранящихся в 1206x2 матрица называется data, Команда plot(data(:,1),data(:,2)) дает эту картину: Я нашел максимумы в моих данных с findpeaks команда: [pks,loc,smth] = findpeaks(data(:,2)); И затем нанесите их на …
31 мар '17 в 01:18
1
ответ
Как рассчитать точность данных с помощью определенного классификатора?
У меня есть набор данных, который необходимо вычислить с помощью классификатора KNN, я пытался сделать это с помощью приведенного ниже кода, но он не работает. Кто-то может сказать, почему? На самом деле мне нужно рассчитать Акк от weka внутри Java …
14 окт '18 в 07:56
1
ответ
Сочетание ударов и недостаточной выборки на weka
Согласно статье, написанной Chawla и др. (2002), лучшая производительность балансировки данных сочетает недостаточную выборку с SMOTE. Я пытался объединить свой набор данных с использованием недостаточной выборки и SMOTE, но я немного запутался в ат…
14 янв '15 в 17:00
1
ответ
Кривая ROC для деревьев решений с использованием пакета rocr
Я использую rpart пакет для разработки моего дерева и прогнозирования модели. Наконец, чтобы построить кривую ROC, я пытаюсь использовать rocr пакет. Извинения за то, что не воспроизвели его со встроенным набором данных, не смог. Пожалуйста, найдите…
15 фев '16 в 08:46
0
ответов
RTextTools после LSA
Я использую библиотеку LSA в R и создаю TermDocumentMatrix после проекции lsa. Однако для классификации с использованием библиотеки RTextTools для моего TermDocumentMatrix выдается следующая ошибка: container <- create_container(t(projected_train…
05 авг '16 в 12:53
2
ответа
Лучший способ хранения реальных событий в БД?
Я строю систему, которая будет собирать данные о производственном процессе, который контролируется извне. Эти данные будут использоваться для построения статистики использования для различных компонентов системы. Упрощенный пример: есть обогреватель…
16 фев '11 в 13:17
1
ответ
Apache Spark flatMap сложность времени
Я пытался найти способ подсчитать, сколько раз наборы строк встречаются в базе данных транзакций (реализация алгоритма Apriori в распределенном режиме). Код у меня в настоящее время выглядит следующим образом: val cand_br = sc.broadcast(cand) transa…
25 мар '15 в 15:58
2
ответа
Алгоритм Apriori - генерация частых наборов
Я использую алгоритм Apriori для идентификации наборов частых предметов клиента. Основываясь на идентифицированных наборах частых предметов, я хочу предложить пользователю предложить товары, когда клиент добавляет новый товар в свой список покупок, …
20 май '16 в 16:37