Описание тега information-gain

0 ответов

Как получить информацию из набора данных

У меня проблема с домашней работой по получению информации, но я думаю, что проблема не в этом. Я тот, кто не понимает, или проблема не в этом? Проблема состоит в том, чтобы получить информацию для каждого атрибута, используя некоторый набор данных.…
30 окт '17 в 05:50
0 ответов

Визуализация решения джунглей в Azure Machine Learning Studio

Я обучил модели джунглей принятия решений по машинному обучению Azure, и теперь я хочу визуализировать деревья, чтобы посмотреть, смогу ли я определить корневые узлы, которые являются наиболее определяющими в решении. Когда я щелкаю правой кнопкой м…
1 ответ

Что такое формула InfoGainAttributeEval Weka для оценки энтропии с непрерывными значениями?

Я использую функцию выбора атрибутов Weka для получения информации и пытаюсь выяснить, какую конкретную формулу использует Weka при работе с непрерывными данными. Я понимаю, что обычная формула для энтропии это когда значения в данных являются дискр…
0 ответов

Получение информации от множества (Дерево решений)

Я изучаю дерево решений в области интеллектуального анализа данных, и у меня возникла проблема, заключающаяся в том, что она не задает правильный вопрос. Или, может быть, я просто неправильно понимаю вопрос или саму концепцию.Здесь вопрос. Given a m…
1 ответ

Отрицательное значение получения информации

Я использую C4.5 и в своих расчетах я получаю (для некоторых примеров) отрицательные значения для получения информации. Я читаю Почему я получаю отрицательный информационный прирост, но мой вопрос кажется другим. Я положил свой расчет, чтобы преуспе…
0 ответов

Дерево решений - какую переменную вы бы сначала разбили

Предоставлен набор информации: Вопрос: По какой функции вы бы сначала разбили данные? Ну, я пытаюсь найти функцию, которая обладает наибольшим информационным приростом, и, таким образом, я смогу ее найти. (Потому что это уменьшает энтропию больше вс…
21 июл '18 в 21:14
1 ответ

Как выбрать только лучшие функции, установив порог, используя прирост информации FSelector на языке R?

Я сделал выбор функции получения информации в R с помощью пакета FSelector в R install.packages("RWekajars") install.packages("FSelector") library(FSelector) weights <- information.gain(Classname~., df) Attributes attr_importance X.1 3.6349780 X …
04 янв '17 в 16:27
1 ответ

Результат rpart является рутом, но данные показывают информационный прирост

У меня есть набор данных с частотой событий менее 3% (то есть около 700 записей с классом 1 и 27000 записей с классом 0). ID V1 V2 V3 V5 V6 Target SDataID3 161 ONE 1 FOUR 0 0 SDataID4 11 TWO 2 THREE 2 1 SDataID5 32 TWO 2 FOUR 2 0 SDataID7 13 ONE 1 T…
2 ответа

Вычисление энтропии определенного атрибута?

Это очень просто, но я изучаю деревья решений и алгоритм ID3. Я нашел сайт, который очень полезен, и я следил за энтропией и получением информации, пока не добрался до Я не понимаю, как рассчитывается энтропия для каждого отдельного атрибута (солнеч…
15 июн '16 в 15:36
0 ответов

При выполнении классификации в R, как рассчитать прирост информации для каждой переменной?

Я понимаю, что получение информации - это в основном энтропия родительского узла минус энтропия дочерних узлов, а в R есть такие функции, как gains(actual_prob,predict_prob,groups=10) который дает график усиления и подъема, но это для всей модели. К…
10 янв '18 в 12:56
1 ответ

Энтропия дерева решений машинного обучения Azure / получение информации

Есть ли способ увидеть энтропию / получение информации для каждой функции при обучении дерева решений в Azure ML?
2 ответа

Каково реальное значение, подразумеваемое получением информации в интеллектуальном анализе данных?

Information Gain= (Information before split)-(Information after split) Информационный выигрыш можно найти по приведенному выше уравнению. Но что я не понимаю, в чем именно смысл этой информации? Означает ли это, что сколько информации получено или у…
0 ответов

Расчет коэффициента получения информации

Я искал кусок кода, который делает соотношение прироста информации (IGR), в R или Python. Я нашел удобный пакет R, но он не поддерживается и был удален из CRAN. Однако я нашел какую-то старую версию и взял на себя смелость и "позаимствовал" критичес…
24 июл '13 в 20:47
0 ответов

Формула получения информации

У меня большие проблемы с формулой получения информации. из моего нынешнего понимания его энтропии родителей - взвешенная энтропия детей Однако пример, на котором я практикуюсь, я получаю отрицательный выигрыш, который, как я понимаю, невозможен. Эт…
28 ноя '17 в 21:39
0 ответов

Как рассчитать прирост информации для набора данных ниже?

При понимании расчета прироста информации - вероятность возникновения рака в популяции составляет 1%. Тест на рак правильно идентифицирует больных раком с вероятностью 50% и не раковых пациентов с вероятностью 99,5%. Теперь я должен рассчитать приро…
0 ответов

Как рассчитать Взаимную Информацию между данным термином и классом в R?

Учитывая входной файл N строки в следующем формате: doc_id, class, text class поле имеет только два значения [0,1] (т.е. два класса) text Поле состоит из набора терминов, разделенных пробелами. Как я могу использовать R для вычисления взаимной инфор…
14 апр '16 в 18:12
0 ответов

Как использовать функции библиотеки в python?

Я хочу использовать функцию, которая вычисляет условную взаимную информацию в Python. Я нашел библиотеку 'mdentropy', реализующую ее. Но когда я попытался увидеть список функций библиотеки mdentropy с помощью команды dir(mdentropy) это показало: ['_…
11 апр '18 в 09:35
1 ответ

Цифровое или категорическое разделение?

Я строю классификатор дерева решений и нашел этот метод для расчета прироста информации. Это может быть глупый вопрос, но мне интересно, если разделение в этом методе для числовых или категориальных атрибутов? Я в замешательстве, потому что я думал,…
0 ответов

Почему gain.ratio дает NaN?

Я пытаюсь проверить атрибуты для выбора объекта, и для этого я применил information.gain, gain.ratio и chi-squared, однако некоторые атрибуты дают значение NaN или 0,0000000. > weights <- information.gain(Team1.Result~., df) > print(weights…
17 май '16 в 12:45
0 ответов

Получение негативной информации с помощью сглаживания Лапласа

Можно ли получить отрицательный прирост информации, если использовать сглаживание Лапласа? Мы знаем: IG = H(Y) - H(Y|X) Здесь H - функция энтропии, а IG - прирост информации. Также: H (Y) = -Σy P (Y = y).log2(P (Y = y)) H (Y | X) = Σx P (X = x).H (Y…