Случайный лес не предсказывает нули

Я запускаю случайный лес на наборе данных, который содержит много нулей. Эти нули представляют подсчет чего-либо (или его отсутствие) и, следовательно, имеют смысл, в отличие от данных, которые могут быть классифицированы как "отсутствующие".

Когда я запускаю прогнозы, я обнаруживаю, что мой RF, кажется, не хочет предсказывать ноль, почти как если бы он не рассматривал 0 как число и поэтому вместо этого по умолчанию принимает значение 1. Есть ли способ, которым я могу решить это? Я просто нахожу странным, что ноль не появляется как прогноз в любое время.

1 ответ

Это не очень удивительно для меня, но это действительно зависит от вашего набора данных. По сути, выходные данные случайных лесов являются средними значениями обучающих значений (если вы не знаете, как они вычисляются, я предлагаю вам взглянуть на теорию, которая поможет вам понять, как вычисляется случайный лес...). Таким образом, за исключением случаев, когда ваша цель состоит почти исключительно из нулей или чрезвычайно хорошо определенных шаблонов (например, если определенная особенность принимает какое-то определенное значение (я), тогда цель всегда равна 0), представляющей множество обучающих случаев, шансы получить ровно 0 в качестве выхода очень низок.

При этом, если ожидается, что ваш вывод будет целым числом (например, 0), вы можете округлить его.

Другие вопросы по тегам