Как бороться с отсутствующими значениями в Azure Machine Learning Studio

Похоже, у меня есть 672 значения миссии, согласно статистике. В столбце QuotedPremium есть значение NULL.

Я реализовал модуль очистки отсутствующих данных, где он должен заменить отсутствующие значения на 0, но по какой-то причине я все еще вижу значения NULL как QuotedPremium, но... он говорит, что отсутствующие значения равны = 0

Здесь вы видите, что это говорит мне, что пропущенные значения = 0, но все еще есть NULL

Так что же на самом деле произошло после того, как я запустил модуль "Чистые недостающие данные"? Почему он работал успешно, но все еще есть значения NULL, хотя он сообщает, что число пропущенных значений равно 0.

1 ответ

Решение

NULL действительно ценность; Записи, содержащие NULL, не пропущены, следовательно, они не очищаются с помощью оператора "Очистить отсутствующие данные" и не сообщаются как пропущенные.

Поскольку на самом деле это не пропущенные значения, ко всем этим ячейкам добавляется строка NULL. Итак, чтобы заменить эти значения на 0, вы можете использовать это ниже:

Использовать Execute R Script модуль и добавьте в него этот код.

dataset1 <- maml.mapInputPort(1); # class: data.frame
dataset1[dataset1 == "NULL"] = 0; # Wherever cell's value is "NULL", replace it with 0
maml.mapOutputPort("dataset1"); # return the modified data.frame

Изображение для того же: