Как бороться с отсутствующими значениями в Azure Machine Learning Studio
Похоже, у меня есть 672 значения миссии, согласно статистике. В столбце QuotedPremium есть значение NULL.
Я реализовал модуль очистки отсутствующих данных, где он должен заменить отсутствующие значения на 0, но по какой-то причине я все еще вижу значения NULL как QuotedPremium, но... он говорит, что отсутствующие значения равны = 0
Здесь вы видите, что это говорит мне, что пропущенные значения = 0, но все еще есть NULL
Так что же на самом деле произошло после того, как я запустил модуль "Чистые недостающие данные"? Почему он работал успешно, но все еще есть значения NULL, хотя он сообщает, что число пропущенных значений равно 0.
1 ответ
NULL
действительно ценность; Записи, содержащие NULL, не пропущены, следовательно, они не очищаются с помощью оператора "Очистить отсутствующие данные" и не сообщаются как пропущенные.
Поскольку на самом деле это не пропущенные значения, ко всем этим ячейкам добавляется строка NULL. Итак, чтобы заменить эти значения на 0, вы можете использовать это ниже:
Использовать Execute R Script
модуль и добавьте в него этот код.
dataset1 <- maml.mapInputPort(1); # class: data.frame
dataset1[dataset1 == "NULL"] = 0; # Wherever cell's value is "NULL", replace it with 0
maml.mapOutputPort("dataset1"); # return the modified data.frame
Изображение для того же: