Описание тега data-mining

Интеллектуальный анализ данных - это процесс анализа больших объемов данных с целью выявления закономерностей и общих черт.
2 ответа

Как использовать функцию интеллектуального анализа данных SQL Server 2008 с ASP.Net

Как использовать функцию интеллектуального анализа данных SQL Server 2008 с ASP.Net
1 ответ

Генерация правил SAS Enterprise Miner

Я хочу выполнить правила ассоциации для этого набора данных http://archive.ics.uci.edu/ml/machine-learning-databases/00222/. Это набор данных о покупателях, и y является результатом, если кампания убедила их подписаться на продукт или нет. а остальн…
1 ответ

Сайт на базе PHP с использованием Weka в качестве движка

Я хотел бы разработать веб-приложение на основе php, желательно с использованием MySQL и CodeIgniter PHP Framework. Я никогда раньше не использовал Weka, но мое назначение требует, чтобы я подключил Weka к PHP. План состоит в том, чтобы разработать …
09 янв '18 в 03:29
2 ответа

Могу ли я использовать погремушку на 64-битном R?

Пытаюсь установить rattle На Windows Server 2008 R2 64-битной машине, используя 64-битную версию R ver2.11, я получил следующее сообщение: install.packages("rattle", dependencies=TRUE) Warning: dependencies ‘RGtk2’, ‘rggobi’, ‘RSvgDevice’, ‘Biobase’…
10 май '10 в 20:53
0 ответов

Как кодировать векторную авторегрессивную модель в matlab?

Модель VAR обобщает одномерную авторегрессивную (AR) модель для нескольких временных рядов. Я хотел бы реализовать модель векторной авторегрессии, которая описывает следующую формулу на основе наблюдения времени t: x (t) = c + (t-1) ∑ (i = t + T) * …
2 ответа

Группировка для извлечения общих значений в полуструктурированных данных

У меня есть "несколько" уродливое поле в базе данных, которое содержит названия локаций. Например, Мэдисон Сквер Гарденс, который также был введен как "Мэдисон Сквер Гарденс" и т. Д. И т. Д. Я пытаюсь извлечь данные, чтобы я мог получить точный спис…
25 ноя '09 в 22:58
1 ответ

Набор данных KDD Cup 1999, как использовать его в Visual Studio 2010

Я скачал набор данных KDD99 здесь: http://archive.ics.uci.edu/ml/machine-learning-databases/kddcup99-mld/kddcup99.html После разархивирования я попытался открыть его с помощью datagrid в VS 2010, но это не сработало, я пробовал разные программы, но …
2 ответа

Runtime Pompt для Rapidminer

Я использовал Rapidminer и создал серию процессов, которые формируют стандартный набор задач. Теперь я хочу позволить пользователю динамически устанавливать параметры процесса при запуске. Например, при написании CSV-файла я хочу предложить пользова…
15 дек '10 в 12:36
0 ответов

Анализ последовательных правил как программный подход

В настоящее время я работаю с алгоритмом последовательного майнинга правил. Я разработал новый алгоритм майнинга последовательных правил с новым параметром. Может ли это (майнинг последовательных правил) рассматриваться как подход мягких вычислений?…
30 окт '17 в 16:56
1 ответ

Как реализовать анализ ассоциативных правил или анализ корзины с нуля?

Я пытался просмотреть многочисленные статьи, пытаясь понять, каким должен быть мой первый шаг к включению ассоциативного анализа (может быть, анализ "Корзины рынка") в мою систему. Все они углубляются в реализацию алгоритма, но никто не говорил о то…
1 ответ

Интеллектуальный анализ данных: наборы частых предметов

Когда вас спрашивают в экзаменационном вопросе, чтобы найти все частые наборы предметов, это только тот набор, который был в последний раз проработан, это ответ, который вы даете, или это необходимо дать и перед этим тоже. например, скажем, если пос…
07 янв '14 в 17:08
0 ответов

Оранжевый виджет

Я пытаюсь привести пример, приведенный в руководстве по разработке Orange, для работы с версией 2.7. Однако, хотя я могу протестировать свой виджет из оболочки Python, я не могу получить созданный мной виджет, который будет отображаться в графическо…
15 фев '16 в 20:39
3 ответа

Самый простой способ обрезать ненужные точки в октаве / матлабе

У меня есть координаты точек (х, у), хранящихся в 1206x2 матрица называется data, Команда plot(data(:,1),data(:,2)) дает эту картину: Я нашел максимумы в моих данных с findpeaks команда: [pks,loc,smth] = findpeaks(data(:,2)); И затем нанесите их на …
31 мар '17 в 01:18
1 ответ

Как рассчитать точность данных с помощью определенного классификатора?

У меня есть набор данных, который необходимо вычислить с помощью классификатора KNN, я пытался сделать это с помощью приведенного ниже кода, но он не работает. Кто-то может сказать, почему? На самом деле мне нужно рассчитать Акк от weka внутри Java …
14 окт '18 в 07:56
1 ответ

Сочетание ударов и недостаточной выборки на weka

Согласно статье, написанной Chawla и др. (2002), лучшая производительность балансировки данных сочетает недостаточную выборку с SMOTE. Я пытался объединить свой набор данных с использованием недостаточной выборки и SMOTE, но я немного запутался в ат…
14 янв '15 в 17:00
1 ответ

Кривая ROC для деревьев решений с использованием пакета rocr

Я использую rpart пакет для разработки моего дерева и прогнозирования модели. Наконец, чтобы построить кривую ROC, я пытаюсь использовать rocr пакет. Извинения за то, что не воспроизвели его со встроенным набором данных, не смог. Пожалуйста, найдите…
15 фев '16 в 08:46
0 ответов

RTextTools после LSA

Я использую библиотеку LSA в R и создаю TermDocumentMatrix после проекции lsa. Однако для классификации с использованием библиотеки RTextTools для моего TermDocumentMatrix выдается следующая ошибка: container <- create_container(t(projected_train…
2 ответа

Лучший способ хранения реальных событий в БД?

Я строю систему, которая будет собирать данные о производственном процессе, который контролируется извне. Эти данные будут использоваться для построения статистики использования для различных компонентов системы. Упрощенный пример: есть обогреватель…
16 фев '11 в 13:17
1 ответ

Apache Spark flatMap сложность времени

Я пытался найти способ подсчитать, сколько раз наборы строк встречаются в базе данных транзакций (реализация алгоритма Apriori в распределенном режиме). Код у меня в настоящее время выглядит следующим образом: val cand_br = sc.broadcast(cand) transa…
25 мар '15 в 15:58
2 ответа

Алгоритм Apriori - генерация частых наборов

Я использую алгоритм Apriori для идентификации наборов частых предметов клиента. Основываясь на идентифицированных наборах частых предметов, я хочу предложить пользователю предложить товары, когда клиент добавляет новый товар в свой список покупок, …
20 май '16 в 16:37