Модель H20 GBM способна забивать даже при неверных значениях
Я собрал модель H20 GBM с дистрибутивом tweedie. Модель очень хорошая и апробирована на всех уровнях. Вчера, оценивая модель для нового набора данных, я обнаружил уникальную проблему, пожалуйста, помогите мне понять, что здесь происходит.
Все модели построены на Python
Например, у меня есть переменная в модели CONSTRUCTION_TYPE, которая может принимать такие значения, как (FRAME, VENEER, FIRE RESISTIVE и т. Д.) При построении модели.
Во время подсчета нового набора данных по ошибке я допустил орфографическую ошибку в FRAME, и он стал FRAMES для оценки. В идеале я ожидал бы, что H20 выдаст ошибку, что FRAMES не использовался для построения модели, поэтому мы не можем набрать баллы, используя FRAMES, но каким-то образом модель также выиграла FRAMES и дала мне результат
Это очень смущает меня, потому что теперь я не могу доверять модели, которая выдаст мне ошибку, если введенные значения неверны.
Может кто-нибудь объяснить мне, что происходит в этом случае, может быть, есть какая-то логика, о которой я не знаю.
Любая помощь будет высоко оценен.