Энтропия дерева решений машинного обучения Azure / получение информации

Есть ли способ увидеть энтропию / получение информации для каждой функции при обучении дерева решений в Azure ML?

1 ответ

Решение

Традиционная производительность узла:

В настоящее время вы можете видеть только относительный выигрыш в gini в моделях с расширенным деревом решений. Щелкните правой кнопкой мыши и визуализируйте вывод обученного расширенного дерева решений, изображение которого приведено ниже. После этого дождитесь загрузки деревьев. Затем вы можете щелкнуть узлы каждого отдельного дерева, чтобы просмотреть усиление разделения на каждом уровне.

Разделение усиления на каждом узле

Энтропия / получение информации:

Хотя давайте сделаем шаг назад и спросим, ​​почему мы хотим рассматривать энтропию? Энтропия - это измерение конкретного узла в отдельном дереве. В машинном обучении Azure нет классификаторов с одним деревом, таких как rpart в R, только ансамбли деревьев в форме леса решений, джунглей решений и расширенных модулей дерева решений.

Значение переменной:

Поэтому я предполагаю, что вы ищете измерения важности переменных / характеристик, которые являются агрегацией или средним значением общего выигрыша Джини / энтропии / информации всех расщеплений узлов во всех деревьях в ансамбле. Azure ML имеет модуль, который вычисляет важность функций из обученного алгоритма, называемого модулем важности функций перестановки. Он работает, пропуская случайные значения предикторов через вашу обученную модель, чтобы увидеть величину, с которой изменяется класс ответа.

Модуль Важности Перестановки

Другие вопросы по тегам