R пакеты / модели, которые могут обрабатывать NA

Question

R пакеты / модели, которые могут обрабатывать NA

Я ищу пакеты R или модели / алгоритмы машинного обучения, как randomForest, glmnet, gbdtи т. д., которые могут обрабатывать NA, а не игнорировать строку или столбец, в котором есть какие-либо экземпляры NA. Я не ищу вменения. Какие-либо предложения?

6

r random-forest glmnet cart-analysis c4.5

Источник

user914308 10 дек '11 в 23:08

1 ответ

Решение

Другие вопросы по тегам r random-forest glmnet cart-analysis c4.5

user324364 11 дек '11 в 00:04 2011-12-11 00:04 · Accepted Answer · 2011-12-11 00:04

Алгоритм CART обрабатывает NA довольно легко (пакет rpart). Тогда вы всегда можете обратиться к деревьям в мешках, используя rpart возможно через пакет ipred.

Я слышал, что многовариантные сплайны адаптивной регрессии (mars в пакете mda) хорошо обрабатывает недостающие данные, хотя у меня нет особого опыта работы с ними.

Кроме того, k моделей ближайших соседей (и, как мне кажется, более общие методы ядра) могут быть изменены, чтобы довольно просто обрабатывать пропущенные значения, но реализации могут не делать этого "из коробки". Но, вероятно, это было бы так же просто, как настроить метрику расстояния, чтобы рассматривать только попарно полные случаи. Я менее знаком с конкретными пакетами R, которые делают больше, чем модели vanilla knn.