R пакеты / модели, которые могут обрабатывать NA

Я ищу пакеты R или модели / алгоритмы машинного обучения, как randomForest, glmnet, gbdtи т. д., которые могут обрабатывать NA, а не игнорировать строку или столбец, в котором есть какие-либо экземпляры NA. Я не ищу вменения. Какие-либо предложения?

1 ответ

Решение

Алгоритм CART обрабатывает NA довольно легко (пакет rpart). Тогда вы всегда можете обратиться к деревьям в мешках, используя rpart возможно через пакет ipred.

Я слышал, что многовариантные сплайны адаптивной регрессии (mars в пакете mda) хорошо обрабатывает недостающие данные, хотя у меня нет особого опыта работы с ними.

Кроме того, k моделей ближайших соседей (и, как мне кажется, более общие методы ядра) могут быть изменены, чтобы довольно просто обрабатывать пропущенные значения, но реализации могут не делать этого "из коробки". Но, вероятно, это было бы так же просто, как настроить метрику расстояния, чтобы рассматривать только попарно полные случаи. Я менее знаком с конкретными пакетами R, которые делают больше, чем модели vanilla knn.

Другие вопросы по тегам