Weka: Как я могу реализовать суррогатное разделение в дереве решений J48?

Кто-нибудь может мне помочь реализовать альтернативную обработку пропущенных значений в алгоритме J48 с использованием Weka API в Java.

Я уверен, что использовать предварительные подходы перед тренировкой J48 легко.

Но как насчет использования суррогатного атрибута разделения в случае разделения даты обучения (как это делает Брейман в CART) вместо стандартного подхода J48 (Quinlan в C4.5), который разделяет случаи по распределению вероятностей от наблюдаемых случаев с известным значением.

Кто-нибудь может дать мне некоторую информацию, совет, помощь, где в Weka API и Исходном коде нужно изменить, чтобы заменить стандарт с суррогатным разделением?

1 ответ

Решение

Посмотрите на исходный код weka weka.classifiers.trees.j48.C45ModelSelection из строки 152 (найдите "лучший" атрибут для разделения). Он использует коэффициент усиления информации в качестве критерия разделения.

Другие вопросы по тегам