Описание тега information-gain
0
ответов
Как получить информацию из набора данных
У меня проблема с домашней работой по получению информации, но я думаю, что проблема не в этом. Я тот, кто не понимает, или проблема не в этом? Проблема состоит в том, чтобы получить информацию для каждого атрибута, используя некоторый набор данных.…
30 окт '17 в 05:50
0
ответов
Визуализация решения джунглей в Azure Machine Learning Studio
Я обучил модели джунглей принятия решений по машинному обучению Azure, и теперь я хочу визуализировать деревья, чтобы посмотреть, смогу ли я определить корневые узлы, которые являются наиболее определяющими в решении. Когда я щелкаю правой кнопкой м…
13 ноя '18 в 03:55
1
ответ
Что такое формула InfoGainAttributeEval Weka для оценки энтропии с непрерывными значениями?
Я использую функцию выбора атрибутов Weka для получения информации и пытаюсь выяснить, какую конкретную формулу использует Weka при работе с непрерывными данными. Я понимаю, что обычная формула для энтропии это когда значения в данных являются дискр…
27 фев '16 в 03:29
0
ответов
Получение информации от множества (Дерево решений)
Я изучаю дерево решений в области интеллектуального анализа данных, и у меня возникла проблема, заключающаяся в том, что она не задает правильный вопрос. Или, может быть, я просто неправильно понимаю вопрос или саму концепцию.Здесь вопрос. Given a m…
27 окт '17 в 20:24
1
ответ
Отрицательное значение получения информации
Я использую C4.5 и в своих расчетах я получаю (для некоторых примеров) отрицательные значения для получения информации. Я читаю Почему я получаю отрицательный информационный прирост, но мой вопрос кажется другим. Я положил свой расчет, чтобы преуспе…
09 фев '17 в 19:50
0
ответов
Дерево решений - какую переменную вы бы сначала разбили
Предоставлен набор информации: Вопрос: По какой функции вы бы сначала разбили данные? Ну, я пытаюсь найти функцию, которая обладает наибольшим информационным приростом, и, таким образом, я смогу ее найти. (Потому что это уменьшает энтропию больше вс…
21 июл '18 в 21:14
1
ответ
Как выбрать только лучшие функции, установив порог, используя прирост информации FSelector на языке R?
Я сделал выбор функции получения информации в R с помощью пакета FSelector в R install.packages("RWekajars") install.packages("FSelector") library(FSelector) weights <- information.gain(Classname~., df) Attributes attr_importance X.1 3.6349780 X …
04 янв '17 в 16:27
1
ответ
Результат rpart является рутом, но данные показывают информационный прирост
У меня есть набор данных с частотой событий менее 3% (то есть около 700 записей с классом 1 и 27000 записей с классом 0). ID V1 V2 V3 V5 V6 Target SDataID3 161 ONE 1 FOUR 0 0 SDataID4 11 TWO 2 THREE 2 1 SDataID5 32 TWO 2 FOUR 2 0 SDataID7 13 ONE 1 T…
31 окт '17 в 06:39
2
ответа
Вычисление энтропии определенного атрибута?
Это очень просто, но я изучаю деревья решений и алгоритм ID3. Я нашел сайт, который очень полезен, и я следил за энтропией и получением информации, пока не добрался до Я не понимаю, как рассчитывается энтропия для каждого отдельного атрибута (солнеч…
15 июн '16 в 15:36
0
ответов
При выполнении классификации в R, как рассчитать прирост информации для каждой переменной?
Я понимаю, что получение информации - это в основном энтропия родительского узла минус энтропия дочерних узлов, а в R есть такие функции, как gains(actual_prob,predict_prob,groups=10) который дает график усиления и подъема, но это для всей модели. К…
10 янв '18 в 12:56
1
ответ
Энтропия дерева решений машинного обучения Azure / получение информации
Есть ли способ увидеть энтропию / получение информации для каждой функции при обучении дерева решений в Azure ML?
09 мар '16 в 08:07
2
ответа
Каково реальное значение, подразумеваемое получением информации в интеллектуальном анализе данных?
Information Gain= (Information before split)-(Information after split) Информационный выигрыш можно найти по приведенному выше уравнению. Но что я не понимаю, в чем именно смысл этой информации? Означает ли это, что сколько информации получено или у…
27 мар '15 в 18:47
0
ответов
Расчет коэффициента получения информации
Я искал кусок кода, который делает соотношение прироста информации (IGR), в R или Python. Я нашел удобный пакет R, но он не поддерживается и был удален из CRAN. Однако я нашел какую-то старую версию и взял на себя смелость и "позаимствовал" критичес…
24 июл '13 в 20:47
0
ответов
Формула получения информации
У меня большие проблемы с формулой получения информации. из моего нынешнего понимания его энтропии родителей - взвешенная энтропия детей Однако пример, на котором я практикуюсь, я получаю отрицательный выигрыш, который, как я понимаю, невозможен. Эт…
28 ноя '17 в 21:39
0
ответов
Как рассчитать прирост информации для набора данных ниже?
При понимании расчета прироста информации - вероятность возникновения рака в популяции составляет 1%. Тест на рак правильно идентифицирует больных раком с вероятностью 50% и не раковых пациентов с вероятностью 99,5%. Теперь я должен рассчитать приро…
24 ноя '15 в 19:51
0
ответов
Как рассчитать Взаимную Информацию между данным термином и классом в R?
Учитывая входной файл N строки в следующем формате: doc_id, class, text class поле имеет только два значения [0,1] (т.е. два класса) text Поле состоит из набора терминов, разделенных пробелами. Как я могу использовать R для вычисления взаимной инфор…
14 апр '16 в 18:12
0
ответов
Как использовать функции библиотеки в python?
Я хочу использовать функцию, которая вычисляет условную взаимную информацию в Python. Я нашел библиотеку 'mdentropy', реализующую ее. Но когда я попытался увидеть список функций библиотеки mdentropy с помощью команды dir(mdentropy) это показало: ['_…
11 апр '18 в 09:35
1
ответ
Цифровое или категорическое разделение?
Я строю классификатор дерева решений и нашел этот метод для расчета прироста информации. Это может быть глупый вопрос, но мне интересно, если разделение в этом методе для числовых или категориальных атрибутов? Я в замешательстве, потому что я думал,…
01 дек '17 в 14:24
0
ответов
Почему gain.ratio дает NaN?
Я пытаюсь проверить атрибуты для выбора объекта, и для этого я применил information.gain, gain.ratio и chi-squared, однако некоторые атрибуты дают значение NaN или 0,0000000. > weights <- information.gain(Team1.Result~., df) > print(weights…
17 май '16 в 12:45
0
ответов
Получение негативной информации с помощью сглаживания Лапласа
Можно ли получить отрицательный прирост информации, если использовать сглаживание Лапласа? Мы знаем: IG = H(Y) - H(Y|X) Здесь H - функция энтропии, а IG - прирост информации. Также: H (Y) = -Σy P (Y = y).log2(P (Y = y)) H (Y | X) = Σx P (X = x).H (Y…
25 мар '18 в 14:14